अध्याय 03 डेटा का संगठन

1. परिचय

पिछले अध्याय में आपने सीखा कि डेटा कैसे एकत्र किया जाता है। आपने यह भी जाना कि जनगणना और नमूनाकरण में क्या अंतर होता है। इस अध्याय में आप जानेंगे कि आपके द्वारा एकत्र किया गया डेटा कैसे वर्गीकृत किया जाए। कच्चे डेटा को वर्गीकृत करने का उद्देश्य उनमें क्रम लाना होता है ताकि उन्हें आगे सांख्यिकीय विश्लेषण के लिए आसानी से प्रयोग किया जा सके।

क्या आपने कभी अपने स्थानीय कबाड़ी वाले या कबाड़ीवाले को देखा है जिसे आप पुराने अखबार, टूटे-फूटे घरेलू सामान, खाली कांच की बोतलें, प्लास्टिक आदि बेचते हैं? वह ये चीजें आपसे खरीदता है और उन्हें उन लोगों को बेच देता है जो इनका पुनर्चक्रण करते हैं। लेकिन उसकी दुकान में इतना सारा कबाड़ होने पर, यदि उसने उन्हें ठीक से संगठित नहीं किया होता तो उसके लिए अपना व्यापार चलाना बहुत मुश्किल हो जाता। अपनी स्थिति को आसान बनाने के लिए वह विभिन्न कबाड़ को उपयुक्त रूप से समूहों में या “वर्गीकृत” करता है। वह पुराने अखबारों को एक साथ रखता है और उन्हें रस्सी से बांध देता है। फिर सभी खाली कांच की बोतलों को एक बोरी में इकट्ठा करता है। वह धातुओं की वस्तुओं को अपनी दुकान के एक कोने में ढेर लगाकर रखता है और उन्हें “लोहा”, “तांबा”, “एल्युमिनियम”, “पीतल” आदि जैसे समूहों में बांटता है, और इसी तरह। इस प्रकार वह अपने कबाड़ को विभिन्न वर्गों में - “अखबार”, “प्लास्टिक”, “कांच”, “धातु” आदि - बांटता है और उनमें क्रम लाता है। एक बार जब उसका कबाड़ व्यवस्थित और वर्गीकृत हो जाता है, तो उसे कोई विशेष वस्तु खोजने में आसानी होती है जो कोई खरीदार मांग सकता है।

इसी तरह जब आप अपनी स्कूल की किताबों को एक निश्चित क्रम में व्यवस्थित करते हैं, तो उन्हें संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। इसलिए, जब आपको किसी विशेष इतिहास की किताब की ज़रूरत होती है, उदाहरण के लिए, तो आपको बस “इतिहास” समूह में उस किताब को खोजना होता है। अन्यथा, आपको अपनी पूरी संग्रह में उस विशेष किताब को खोजना पड़ेगा।

जबकि वस्तुओं या चीज़ों का वर्गीकरण हमारा बहुमूल्य समय और प्रयास बचाता है, यह मनमाने ढंग से नहीं किया जाता है। कबड्डीवाला अपने कबाड़ को पुन: प्रयुक्त वस्तुओं के बाज़ारों के अनुसार समूहित करता है। उदाहरण के लिए, “काँच” समूह के तहत वह खाली बोतलें, टूटे हुए दर्पण और खिड़कियों के काँच आदि रखेगा। इसी तरह जब आप अपनी इतिहास की किताबों को “इतिहास” समूह के तहत वर्गीकृत करते हैं, तो आप उस समूह में किसी अन्य विषय की किताब नहीं रखेंगे। अन्यथा समूहन का पूरा उद्देश्य समाप्त हो जाएगा। वर्गीकरण, इसलिए, किसी मानदंड के आधार पर चीज़ों को समूहों या वर्गों में व्यवस्थित करना है।

गतिविधि

  • अपने स्थानीय डाकघर जाकर पता करें कि पत्रों को कैसे छाँटा जाता है। क्या आप जानते हैं कि पत्र में दिया गया पिन-कोड क्या दर्शाता है? अपने डाकिया से पूछें।

2. कच्चा आँकड़ा

कबड़ीवाले के कबाड़ की तरह, अवर्गीकृत डेटा या कच्चा डेटा अत्यधिक असंगठित होता है। वे अक्सर बहुत बड़े और संभालने में कठिन होते हैं। इनसे सार्थक निष्कर्ष निकालना एक थकाऊ कार्य है क्योंकि वे सांख्यिकीय विधियों के अधीन आसानी से नहीं होते। इसलिए किसी भी व्यवस्थित सांख्यिकीय विश्लेषण से पहले ऐसे डेटा का उचित संगठन और प्रस्तुति आवश्यक है। इसलिए डेटा एकत्र करने के बाद अगला चरण उन्हें संगठित करना और वर्गीकृत रूप में प्रस्तुत करना है।

मान लीजिए आप विद्यार्थियों के गणित में प्रदर्शन को जानना चाहते हैं और आपने अपने स्कूल के 100 विद्यार्थियों के गणित में अंकों का डेटा एकत्र किया है। यदि आप उन्हें एक सारणी के रूप में प्रस्तुत करें, तो वे कुछ इस प्रकार दिखाई दे सकते हैं जैसा कि सारणी 3.1 में है।

सारणी 3.1 एक परीक्षा में 100 विद्यार्थियों द्वारा प्राप्त किए गए गणित में अंक

47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

या आपने अपने पड़ोस के 50 घरों के मासिक खाद्य व्यय का आंकड़ा एकत्र किया होगा ताकि उनका औसत खाद्य व्यय जान सकें। उस स्थिति में एकत्र किया गया आंकड़ा, यदि आपने उसे सारणी के रूप में प्रस्तुत किया होता, तो वह सारणी 3.2 जैसा दिखता। सारणी 3.1 और 3.2 दोनों ही कच्चे या अवर्गीकृत आंकड़े हैं। दोनों सारणियों में आप देखेंगे कि संख्याएँ किसी क्रम में व्यवस्थित नहीं हैं। अब यदि आपसे सारणी 3.1 से गणित में अधिकतम अंक पूछे जाएँ तो आपको पहले 100 विद्यार्थियों के अंकों को या तो बढ़ते या घटते क्रम में व्यवस्थित करना होगा। यह एक थकाऊ कार्य है। यह और भी अधिक थकाऊ हो जाता है यदि 100 के स्थान पर आपके पास 1,000 विद्यार्थियों के अंक हों। इसी प्रकार, सारणी 3.2 में आप देखेंगे कि 50 घरों का औसत मासिक व्यय ज्ञात करना कठिन है। और यह कठिनाई कई गुना बढ़ जाएगी यदि संख्या बड़ी हो—मान लीजिए, 5,000 घर। जैसे हमारा कबाड़ीवाला, जिसे अपना कबाड़ बड़ा और अव्यवस्थित होने पर कोई विशेष वस्तु ढूँढ़ने में कष्ट होता है, आपको भी बड़े कच्चे आंकड़ों से कोई सूचना निकालने में ऐसी ही स्थिति का सामना करना पड़ेगा। एक शब्द में, इसलिए, बड़े अवर्गीकृत आंकड़ों से सूचना निकालना एक थकाऊ कार्य है।

सारणी 3.2 50 घरों का खाद्य पर मासिक घरेलू व्यय (रुपयों में)

1904 1559 3473 1735 2760
2041 1612 1753 1855 4439
5090 1085 1823 2346 1523
1211 1360 1110 2152 1183
1218 1315 1105 2628 2712
4248 1812 1264 1183 1171
1007 1180 1953 1137 2048
2025 1583 1324 2621 3676
1397 1832 1962 2177 2575
1293 1365 1146 3222 1396

कच्चे आँकड़ों का सारांश तैयार किया जाता है और उन्हें वर्गीकरण द्वारा समझने योग्य बनाया जाता है। जब समान लक्षणों वाले तथ्यों को एक ही वर्ग में रखा जाता है, तो उन्हें आसानी से खोजा जा सकता है, तुलना की जा सकती है और बिना किसी कठिनाई के निष्कर्ष निकाले जा सकते हैं। आपने अध्याय 2 में पढ़ा है कि भारत सरकार दस-दस वर्षों पर जनगणना करती है। जनगणना 2001 में लगभग 20 करोड़ व्यक्तियों से संपर्क किया गया था। जनगणना के कच्चे आँकड़े इतने विशाल और टुकड़ों में बँटे हुए हैं कि उनसे कोई सार्थक निष्कर्ष निकालना लगभग असंभव-सा प्रतीत होता है। परंतु जब उन्हीं आँकड़ों को लिंग, शिक्षा, वैवाहिक स्थिति, व्यवसाय आदि के अनुसार वर्गीकृत किया जाता है, तब भारत की जनसंख्या की संरचना और प्रकृति को आसानी से समझा जा सकता है।

कच्चे आंकड़े चरों पर प्रेक्षणों से बने होते हैं। तालिका 3.1 और 3.2 में दिए गए कच्चे आंकड़े किसी विशिष्ट चर या चरों के समूह पर प्रेक्षणों से बने हैं। उदाहरण के लिए तालिका 3.1 देखिए जिसमें 100 विद्यार्थियों द्वारा गणित में प्राप्त अंक हैं। हम इन अंकों का अर्थ कैसे निकाल सकते हैं? इन अंकों को देखते हुए गणित की अध्यापिका सोच रही होगी—मेरे विद्यार्थियों ने कैसा प्रदर्शन किया है? कितने अनुत्तीर्ण हुए हैं? हम आंकड़ों को किस प्रकार वर्गीकृत करते हैं, यह इस बात पर निर्भर करता है कि हमारे मन में क्या उद्देश्य है। इस स्थिति में अध्यापिका यह गहराई से समझना चाहती है कि इन विद्यार्थियों ने कैसा प्रदर्शन किया है। वह संभवतः बारंबारता बंटन बनाना चुनेगी। इसकी चर्चा अगले खंड में की गई है।

गतिविधि

  • अपने परिवार के कुल साप्ताहिक व्यय का एक वर्ष का आंकड़ा इकट्ठा कीजिए और उसे एक सारणी में व्यवस्थित कीजिए। देखिए आपके पास कितने प्रेक्षण हैं। आंकड़ों को मासिक क्रम में व्यवस्थित कीजिए और प्रेक्षणों की संख्या ज्ञात कीजिए।

3. आंकड़ों का वर्गीकरण

वर्गीकरण के समूह या वर्ग विभिन्न प्रकार से किए जाते हैं। अपनी पुस्तकों को विषयों के अनुसार—“इतिहास”, “भूगोल”, “गणित”, “विज्ञान” आदि—वर्गीकृत करने के बजाय आप उन्हें लेखक के नाम के अनुसार वर्णमाला क्रम में भी वर्गीकृत कर सकते थे। या आप उन्हें प्रकाशन वर्ष के अनुसार भी वर्गीकृत कर सकते थे। आप उन्हें जिस प्रकार वर्गीकृत करना चाहेंगे, वह आपकी आवश्यकता पर निर्भर करेगा।

इसी प्रकार कच्चे आंकड़ों को विभिन्न प्रकार से उद्देश्य के अनुसार वर्गीकृत किया जाता है। इन्हें समय के अनुसार समूहबद्ध किया जा सकता है। ऐसी वर्गीकरण को कालानुक्रमिक वर्गीकरण कहा जाता है। इस प्रकार की वर्गीकरण में आंकड़ों को वर्ष, तिमाही, महीने, सप्ताह आदि के संदर्भ में आरोही या अवरोही क्रम में वर्गीकृत किया जाता है। निम्नलिखित उदाहरण भारत की जनसंख्या को वर्षों के संदर्भ में वर्गीकृत करता है। चर ‘जनसंख्या’ एक समय श्रृंखला है क्योंकि यह विभिन्न वर्षों के लिए मानों की एक श्रृंखला दर्शाता है।

उदाहरण 1

भारत की जनसंख्या (करोड़ों में)

वर्ष जनसंख्या (करोड़ों में)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

स्थानिक वर्गीकरण में आंकड़ों को देश, राज्य, शहर, जिला आदि भौगोलिक स्थानों के संदर्भ में वर्गीकृत किया जाता है।

उदाहरण 2 विभिन्न देशों में गेहूं की पैदावार को दर्शाता है।

उदाहरण 2

विभिन्न देशों में गेहूं की पैदावार (2013)

देश गेहूं की पैदावार (किग्रा/हेक्टेयर)
कनाडा 3594
चीन 5055
फ्रांस 7254
जर्मनी 7998
भारत 3154
पाकिस्तान 2787

स्रोत: इंडियन एग्रीकल्चरल स्टैटिस्टिक्स एट अ ग्लांस, 2015

गतिविधियाँ

  • उदाहरण 1 में वे वर्ष ज्ञात कीजिए जिनमें भारत की जनसंख्या न्यूनतम और अधिकतम थी,
  • उदाहरण 2 में वह देश ज्ञात कीजिए जिसकी गेहूँ की पैदावार भारत की तुलना में थोड़ी अधिक है। वह प्रतिशत के रूप में कितनी होगी?
  • उदाहरण 2 के देशों को पैदावार के आरोही क्रम में व्यवस्थित कीजिए। पैदावार के अवरोही क्रम के लिए भी वही अभ्यास कीजिए।

कभी-कभी आप ऐसे लक्षणों के सामने आते हैं जिन्हें मात्रात्मक रूप से व्यक्त नहीं किया जा सकता। ऐसे लक्षणों को गुणात्मक लक्षण कहा जाता है। उदाहरण के लिए, राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता। फिर भी इन गुणों को किसी गुणात्मक लक्षण की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत किया जा सकता है। गुणों पर आधारित ऐसे आँकड़ों के वर्गीकरण को गुणात्मक वर्गीकरण कहा जाता है। निम्नलिखित उदाहरण में हम पाते हैं कि किसी देश की जनसंख्या को गुणात्मक चर “लिंग” के आधार पर समूहबद्ध किया गया है। एक प्रेक्षण या तो पुरुष हो सकता है या महिला। इन दो लक्षणों को वैवाहिक स्थिति के आधार पर आगे वर्गीकृत किया जा सकता है जैसा नीचे दिया गया है:

उदाहरण 3

पहले चरण का वर्गीकरण किसी गुण की उपस्थिति और अनुपस्थिति के आधार पर किया जाता है, अर्थात् पुरुष या गैर-पुरुष (महिला)। दूसरे चरण में, प्रत्येक वर्ग — पुरुष और महिला — को एक अन्य गुण की उपस्थिति या अनुपस्थिति के आधार पर और उपविभाजित किया जाता है, अर्थात् विवाहित या अविवाहित। ऊँचाई, वजन, आयु, आय, छात्रों के अंक आदि जैसी विशेषताएँ प्रकृति में मात्रात्मक होती हैं। जब ऐसी विशेषताओं के संग्रहित आँकड़ों को वर्गों में समूहबद्ध किया जाता है, तो यह मात्रात्मक वर्गीकरण बन जाता है।

गतिविधि

  • चारों ओर के वस्तुओं को जीवित या अजीवित के रूप में समूहीकृत किया जा सकता है। क्या यह एक गुणात्मक वर्गीकरण है?

उदाहरण 4

100 छात्रों के गणित में अंकों का बारंबारता बंटन

अंक बारंबारता
0-10 1
10-20 8
20-30 6
30-40 7
40-50 21
50-60 23
60-70 19
70-80 6
80-90 5
90-100 4
योग 100

उदाहरण 4 तालिका 3.1 में दिए गए 100 छात्रों के गणित के अंकों के मात्रात्मक वर्गीकरण को दर्शाता है।

गतिविधि

  • उदाहरण 4 की बारंबारता के मानों को कुल बारंबारता के अनुपात या प्रतिशत के रूप में व्यक्त करें। ध्यान दें कि इस प्रकार व्यक्त की गई बारंबारता को सापेक्ष बारंबारता कहा जाता है।
  • उदाहरण 4 में, किस वर्ग में आँकड़ों की अधिकतम सांद्रता है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में व्यक्त करें। किस वर्ग में आँकड़ों की न्यूनतम सांद्रता है?

4. चर; सतत और विच्छिन्न

एक सरल परिभाषा चर की, जिसे आपने पिछले अध्याय में पढ़ा है, यह नहीं बताती कि वह कैसे बदलता है। चर विशिष्ट मानदंडों के आधार पर भिन्न होते हैं। इन्हें व्यापक रूप से दो प्रकारों में वर्गीकृत किया गया है:

(i) सतत और निरंतर

(ii) विच्छिन्न।

एक सतत चर कोई भी संख्यात्मक मान ले सकता है। यह पूर्णांक मान $(1,2,3,4,\ldots)$, भिन्नात्मक मान $(1 / 2,2 / 3,3 / 4,\ldots)$, और ऐसे मान भी ले सकता है जो ठीक-ठीक भिन्न नहीं होते $(\sqrt{2}=1.414$, $\sqrt{3}=1.732,\ldots,\sqrt{7}=2.645$)। उदाहरण के लिए, किसी विद्यार्थी की ऊँचाई, जैसे वह/वह बढ़ता है मान लीजिए 90 $\mathrm{~cm}$ से 150 $\mathrm{~cm}$ तक, इस बीच के सभी मान लेगी। यह पूर्ण संख्याओं जैसे 90 $\mathrm{~cm}$, 100 $\mathrm{~cm}$, 108 $\mathrm{~cm}$, 150 $\mathrm{~cm}$ जैसे मान ले सकती है। यह भिन्नात्मक मान भी ले सकती है जैसे 90.85 $\mathrm{~cm}$, 102.34 $\mathrm{~cm}$, 149.99 $\mathrm{~cm}$ आदि जो पूर्ण संख्याएँ नहीं हैं। इस प्रकार चर “ऊँचाई” हर संभावित मान में प्रकट होने में सक्षम है और इसके मानों को अनंत विभाजनों में भी तोड़ा जा सकता है। सतत चर के अन्य उदाहरण हैं वजन, समय, दूरी आदि।

एक सतत चर के विपरीत, एक विच्छिन्न चर केवल निश्चित मान ही ले सकता है। इसका मान केवल परिमित “छलांगों” से बदलता है। यह एक मान से दूसरे मान पर “छलांग” लगाता है लेकिन उनके बीच का कोई मध्यवर्ती मान नहीं लेता। उदाहरण के लिए, “किसी कक्षा में विद्यार्थियों की संख्या” जैसा चर, विभिन्न कक्षाओं के लिए, केवल पूर्ण संख्याओं के मान ग्रहण करेगा। यह 0.5 जैसा कोई भिन्न मान नहीं ले सकता क्योंकि “आधा विद्यार्थी” हास्यास्पद है। इसलिए यह 25 और 26 के बीच 25.5 जैसा मान नहीं ले सकता। इसके बजाय इसका मान या तो 25 हो सकता है या 26। हम देखते हैं कि जैसे ही इसका मान 25 से 26 बदलता है, उनके बीच के मान — भिन्न — इसके द्वारा नहीं लिए जाते। लेकिन हमें यह धारणा नहीं होनी चाहिए कि एक विच्छिन्न चर कोई भिन्न मान नहीं ले सकता। मान लीजिए $X$ एक चर है जो $1/8, 1/16, 1/32, 1/64, \ldots$ जैसे मान लेता है। क्या यह एक विच्छिन्न चर है? हाँ, क्योंकि यद्यपि $\mathrm{X}$ भिन्न मान लेता है, यह दो संलग्न भिन्न मानों के बीच का कोई मान नहीं ले सकता। यह $1/8$ से $1/16$ और $1/16$ से $1/32$ पर “छलांग” लगाता है। लेकिन यह $1/8$ और $1/16$ या $1/16$ और $1/32$ के बीच का कोई मान नहीं ले सकता।

गतिविधि

  • निम्नलिखित चरों को सतत और विच्छिन्न के रूप में भेद कीजिए; क्षेत्रफल, आयतन, तापमान, पासे पर आने वाली संख्या, फसल उत्पादन, जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।

उदाहरण 4 दिखाता है कि 100 विद्यार्थियों के अंकों को वर्गों में कैसे समूहबद्ध किया गया है। आप सोच रहे होंगे कि हमने यह तालिका 3.1 के कच्चे आँकड़ों से कैसे प्राप्त किया। लेकिन इस प्रश्न का उत्तर देने से पहले, आपको यह जानना होगा कि बारंबारता बंटन क्या होता है।

5. बारंबारता बंटन क्या है?

बारंबारता बंटन किसी मात्रात्मक चर के कच्चे आँकड़ों को वर्गीकृत करने का एक व्यापक तरीका है। यह दिखाता है कि चर के भिन्न-भिन्न मान (यहाँ, किसी विद्यार्थी द्वारा गणित में प्राप्त किए गए अंक) भिन्न-भिन्न वर्गों में किस प्रकार बंटे हैं, साथ ही उनके संगत वर्ग बारंबारताएँ भी। इस स्थिति में हमारे पास अंकों के दस वर्ग हैं: $0-10,10-20,\ldots$, 90-100। वर्ग बारंबारता शब्द का अर्थ है किसी विशेष वर्ग में मानों की संख्या। उदाहरण के लिए, वर्ग 30-40 में तालिका 3.1 के कच्चे आँकड़ों से 7 अंक मिलते हैं। वे हैं $30,37,34,30,35,39,32$। इस प्रकार वर्ग $30-40$ की बारंबारता 7 है। लेकिन आप सोच रहे होंगे कि $40-$ जो कच्चे आँकड़ों में दो बार आ रहा है - वर्ग 30-40 में क्यों नहीं शामिल किया गया। यदि इसे शामिल किया जाता तो वर्ग 30-40 की बारंबारता 7 के बजाय 9 होती। यह पहेली आपके लिए स्पष्ट हो जाएगी यदि आप इस अध्याय को धैर्यपूर्वक पढ़ें। तो आगे बढ़िए। आप स्वयं उत्तर पा लेंगे।

आवृत्ति वितरण सारणी में प्रत्येक वर्ग वर्ग सीमाओं से घिरा होता है। वर्ग सीमाएँ किसी वर्ग के दो सिरों को कहती हैं। सबसे छोटे मान को निम्न वर्ग सीमा कहा जाता है और सबसे बड़े मान को उच्च वर्ग सीमा। उदाहरण के लिए, वर्ग: 60-70 के लिए वर्ग सीमाएँ 60 और 70 हैं। इसकी निम्न वर्ग सीमा 60 है और उच्च वर्ग सीमा 70 है। वर्ग अंतराल या वर्ग चौड़ाई उच्च वर्ग सीमा और निम्न वर्ग सीमा के बीच का अंतर होता है। वर्ग 60-70 के लिए वर्ग अंतराल 10 है (उच्च वर्ग सीमा घटा निम्न वर्ग सीमा)।

वर्च मध्य-बिंदु या वर्ग चिह्न किसी वर्ग का मध्य मान होता है। यह वर्ग की निम्न वर्ग सीमा और उच्च वर्ग सीमा के बीच आधे रास्ते पर स्थित होता है और निम्न प्रकार से ज्ञात किया जा सकता है:

वर्ग मध्य-बिंदु या वर्ग चिह्न

$$ \text { = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2 } $$

प्रत्येक वर्ग का वर्ग चिह्न या मध्य-मान उस वर्ग का प्रतिनिधित्व करने के लिए प्रयुक्त होता है। एक बार कच्चे आँकड़ों को वर्गों में समूहीकृत करने के बाद, व्यक्तिगत प्रेक्षण आगे की गणनाओं में प्रयुक्त नहीं होते। इसके बजाय वर्ग चिह्न का उपयोग किया जाता है।

TABLE 3.3 निम्न वर्ग सीमाएँ, उच्च वर्ग सीमाएँ और वर्ग चिह्न

वर्ग आवृत्ति निचली वर्ग सीमा ऊपरी वर्ग सीमा वर्ग चिह्न
0-10 1 0 10 5
10-20 8 10 20 15
20-30 6 20 30 25
30-40 7 30 40 35
40-50 21 40 50 45
50-60 23 50 60 55
60-70 19 60 70 65
70-80 6 70 80 75
80-90 5 80 90 85
90-100 4 90 100 95

आवृत्ति वक्र एक आवृत्ति बंटन का आलेखीय प्रतिनिधित्व है। चित्र 3.1 हमारे उपरोक्त उदाहरण के आंकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति दिखाता है। आवृत्ति वक्र प्राप्त करने के लिए हम वर्ग चिह्नों को $\mathrm{X}$-अक्ष पर और आवृत्ति को $\mathrm{Y}$ अक्ष पर लेखांकित करते हैं।

चित्र 3.1: आंकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति।

आवृत्ति बंटन कैसे तैयार करें

आवृत्ति बंटन तैयार करते समय निम्नलिखित पाँच प्रश्नों को संबोधित करने की आवश्यकता होती है:

  1. क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?
  2. हमें कितने वर्ग होने चाहिए?
  3. प्रत्येक वर्ग का आकार क्या होना चाहिए?
  4. वर्ग सीमाएँ कैसे निर्धारित करें?
  5. प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करें?

क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?

दो ऐसी परिस्थितियाँ होती हैं जिनमें असमान आकार के अंतरालों का प्रयोग किया जाता है। पहली, जब हमारे पास आय और अन्य इसी प्रकार के चरों पर आँकड़े हों जिनकी सीमा बहुत अधिक हो। उदाहरण के लिए, प्रतिदिन आय लगभग शून्य से लेकर सैकड़ों करोड़ रुपये तक हो सकती है। ऐसी स्थिति में समान वर्ग अंतराल उपयुक्त नहीं होते क्योंकि (i) यदि वर्ग अंतराल मध्यम आकार के और समान हों तो बहुत सारे वर्ग बन जाएँगे। (ii) यदि वर्ग अंतराल बड़े हों तो हम या तो बहुत कम स्तर या बहुत अधिक स्तर की आय की सूचना को दबा देंगे।

दूसरी, यदि बड़ी संख्या में मान सीमा के एक छोटे भाग में केंद्रित हों, तो समान वर्ग अंतराल कई मानों की सूचना की कमी का कारण बनेंगे।

अन्य सभी मामलों में, बारंबारता बंटनों में समान आकार के वर्ग अंतरालों का प्रयोग किया जाता है।

हमारे पास कितने वर्ग होने चाहिए?

वर्गों की संख्या सामान्यतः छह से पंद्रह के बीच होती है। यदि हम समान आकार के वर्ग अंतरालों का प्रयोग कर रहे हैं तो वर्गों की संख्या सीमा (चर के सबसे बड़े और सबसे छोटे मानों के बीच का अंतर) को वर्ग अंतराल के आकार से भाग देकर निकाली जा सकती है।

गतिविधियाँ

निम्नलिखित की सीमा ज्ञात कीजिए:

  • उदाहरण 1 में भारत की जनसंख्या,
  • उदाहरण 2 में गेहूँ की पैदावार।

प्रत्येक समूह का आकार कितना होना चाहिए?

इस प्रश्न का उत्तर पिछले प्रश्न के उत्तर पर निर्भर करता है। चर की सीमा दी गई होने पर, एक बार जब हम वर्ग अंतराल तय कर लेते हैं तो हम वर्गों की संख्या निर्धारित कर सकते हैं। इस प्रकार हम पाते हैं कि ये दोनों निर्णय आपस में जुड़े हुए हैं। हम एक का निर्णय दूसरे के बिना नहीं ले सकते।

उदाहरण 4 में, हमारे पास वर्गों की संख्या 10 है। सीमा का मान 100 दिया गया होने पर, वर्ग अंतराल स्वचालित रूप से 10 हो जाते हैं। ध्यान दें कि वर्तमान संदर्भ में हमने समान परिमाण के वर्ग अंतराल चुने हैं। हालांकि, हम ऐसे वर्ग अंतराल भी चुन सकते थे जो समान परिमाण के नहीं होते। उस स्थिति में वर्ग असमान चौड़ाई के होते।

हमें वर्ग सीमाएँ कैसे निर्धारित करनी चाहिए?

वर्ग सीमाएँ निश्चित और स्पष्ट रूप से बताई जानी चाहिए। आम तौर पर, खुली सीमाओं वाले वर्ग जैसे “70 और ऊपर” या “10 से कम” वांछनीय नहीं होते हैं।

निचली और ऊपरी वर्ग सीमाएँ इस प्रकार निर्धारित की जानी चाहिए कि प्रत्येक वर्ग की आवृत्तियाँ वितरण के मध्य में केंद्रित होने की प्रवृत्ति रखें।

वर्ग अंतराल दो प्रकार के होते हैं:

(i) समावेशी वर्ग अंतराल; इस स्थिति में, किसी वर्ग की निचली और ऊपरी सीमा के बराबर मान उसी वर्ग की आवृत्ति में शामिल किए जाते हैं।

(ii) अपवर्जी वर्ग अंतराल; इस स्थिति में, कोई वस्तु जो ऊपरी या निचली वर्ग सीमा के बराबर हो, उस वर्ग की आवृत्ति से बाहर रखी जाती है।

विचर चर के मामले में, केवल अपवर्जी वर्ग अंतरालों का उपयोग किया जा सकता है।

निरंतर चरों के मामले में विशिष्ट वर्ग अंतरालों का प्रायः उपयोग किया जाता है।

उदाहरण

मान लीजिए हमारे पास किसी परीक्षा में विद्यार्थियों द्वारा प्राप्त किए गए अंकों का आंकड़ा है और सभी अंक पूर्ण संख्याओं में हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए विद्यार्थियों द्वारा प्राप्त अंक 0 से 100 तक भिन्न-भिन्न हैं।

यह विविक्त चर का मामला है क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस स्थिति में, यदि हम समान आकार के वर्ग अंतरालों का उपयोग कर रहे हैं और 10 वर्ग अंतराल रखने का निर्णय लेते हैं, तो वर्ग अंतराल निम्नलिखित में से किसी भी रूप में हो सकते हैं:

समावेशी रूप के वर्ग अंतराल:

$0-10$

$11-20$

$21-30$

$-$

$-$

$91-100$

विशिष्ट रूप के वर्ग अंतराल: 0–10

$10-20$

$20-30$

$-$

$-$

$90-100$

विशिष्ट वर्ग अंतरालों के मामले में हमें पहले से निर्णय लेना होता है कि यदि हमें किसी वर्ग सीमा के बराबर मान मिले तो उसका क्या किया जाए। उदाहरण के लिए हम निर्णय ले सकते हैं कि 10, 30 आदि जैसे मानों को वर्ग अंतरालों “0 से 10” और “20 से 30” में क्रमशः रखा जाए। इसे निम्न सीमा बहिष्कृत का मामला कहा जा सकता है।

अथवा हम 10, 30 आदि मानों को वर्ग अंतरालों “10 से 20” और “30 से 40” में क्रमशः रख सकते हैं। इसे ऊपरी सीमा बहिष्कृत का मामला कहा जा सकता है।

निरंतर चर का उदाहरण

मान लीजिए हमारे पास किसी चर जैसे ऊंचाई (सेंटीमीटर) या वजन (किलोग्राम) पर आंकड़े हैं। यह आंकड़ा निरंतर प्रकार का है। ऐसे मामलों में वर्ग अंतराल निम्नलिखित प्रकार से परिभाषित किए जा सकते हैं:

$30 \mathrm{Kg}-39.999 \ldots\mathrm{Kg}$

$40 \mathrm{Kg}-49.999 \ldots\mathrm{Kg}$

$50 \mathrm{Kg}-59.999 \ldots\mathrm{Kg}$ आदि।

इन वर्ग अंतरालों को निम्नलिढित तरीके से समझा जाता है:

$30 \mathrm{Kg}$ और उससे अधिक तथा $40 \mathrm{Kg}$ से कम

$40 \mathrm{Kg}$ और उससे अधिक तथा $50 \mathrm{Kg}$ से कम

$50 \mathrm{Kg}$ और उससे अधिक तथा $60 \mathrm{Kg}$ से कम, आदि।

TABLE 3.4 एक कंपनी के 550 कर्मचारियों की आय का आवृत्ति बंटन

आय $(Rs)$ कर्मचारियों की संख्या
800-899 50
900-999 100
1000-1099 200
1100-1199 150
1200-1299 40
1300-1399 10
कुल 550

वर्ग अंतराल में समायोजन

तालिका 3.4 में समावेशी विधि के सावधानीपूर्वक अवलोकन से यह स्पष्ट होता है कि यद्यपि चर “आय” एक सतत चर है, फिर भी जब वर्ग बनाए जाते हैं तो ऐसी निरंतरता बनाए नहीं रखी जाती। हमें किसी वर्ग की ऊपरी सीमा और अगले वर्ग की निचली सीमा के बीच “अंतराल” या असांतत्य दिखाई देता है। उदाहरण के लिए, पहले वर्ग की ऊपरी सीमा: 899 और दूसरे वर्ग की निचली सीमा: 900 के बीच हमें 1 का “अंतराल” मिलता है। तो फिर वर्गीकरण करते समय चर की निरंतरता कैसे सुनिश्चित करें? यह वर्ग अंतराल में समायोजन करके प्राप्त किया जाता है। समायोजन निम्नलिखित तरीके से किया जाता है:

  1. दूसरी कक्षा की निचली सीमा और पहली कक्षा की ऊपरी सीमा के बीच का अंतर निकालें। उदाहरण के लिए, तालिका 3.4 में दूसरी कक्षा की निचली सीमा 900 है और पहली कक्षा की ऊपरी सीमा 899 है। इनके बीच का अंतर 1 है, अर्थात् $(900-899 =1)$
  2. (1) में प्राप्त अंतर को दो से विभाजित करें, अर्थात् $(1 / 2 = 0.5)$
  3. (2) में प्राप्त मान को सभी कक्षाओं की निचली सीमाओं से घटाएँ (निचली कक्षा सीमा - 0.5)
  4. (2) में प्राप्त मान को सभी कक्षाओं की ऊपरी सीमाओं में जोड़ें (ऊपरी कक्षा सीमा +0.5$)$

आवृत्ति बंटन में आंकड़ों की सततता को पुनः स्थापित करने वाले समायोजन के बाद, तालिका 3.4 को तालिका 3.5 में संशोधित किया गया है

कक्षा सीमाओं में समायोजन के बाद, वह सूत्र (1) जो कक्षा-चिह्न का मान निर्धारित करता है, निम्नलिखित प्रकार से संशोधित किया गया है:

समायोजित कक्षा चिह्न = (समायोजित ऊपरी कक्षा सीमा + समायोजित निचली कक्षा सीमा)/2

तालिका 3.5 एक कंपनी के 550 कर्मचारियों की आय का आवृत्ति बंटन

आय (रु) कर्मचारियों की संख्या
799.5-899.5 50
899.5-999.5 100
999.5-1099.5 200
1099.5-1199.5 150
1199.5-1299.5 40
1299.5-1399.5 10
कुल 550

हमें प्रत्येक कक्षा के लिए आवृत्ति कैसे प्राप्त करनी चाहिए?

सरल शब्दों में, किसी प्रेक्षण की बारंबारता का अर्थ है वह प्रेक्षण कच्चे आँकड़ों में कितनी बार आता है। हमारी तालिका 3.1 में हम देखते हैं कि मान 40 तीन बार आता है; 0 और 10 केवल एक-एक बार आते हैं; 49 पाँच बार आता है इत्यादि। इस प्रकार 40 की बारंबारता 3 है, 0 की 1 है, 10 की 1 है, 49 की 5 है इत्यादि। परंतु जब आँकड़ों को वर्गों में समूहीकृत किया जाता है जैसा उदाहरण 3 में है, तो वर्ग बारंबारता का अर्थ है किसी विशेष वर्ग में मानों की संख्या। वर्ग बारंबारता की गिनती संबंधित वर्ग के सामने टैली चिह्न लगाकर की जाती है।

टैली चिह्न लगाकर वर्ग बारंबारता ज्ञात करना

प्रत्येक विद्यार्थी के लिए जिसके अंक उस वर्ग में आते हैं, उस वर्ग के सामने एक टैली (/) लगाई जाती है। उदाहरण के लिए, यदि किसी विद्यार्थी को 57 अंक मिले हैं, तो हम वर्ग $50-60$ के सामने टैली (/) लगाते हैं। यदि अंक 71 हैं, तो वर्ग $70-80$ के सामने टैली लगाई जाती है। यदि किसी को 40 अंक मिले हैं, तो वर्ग $40-50$ के सामने टैली लगाई जाती है। तालिका 3.6 तालिका 3.1 से गणित में 100 विद्यार्थियों के अंकों की टैली गिनती दिखाती है।

तालिका 3.6 100 विद्यार्थियों के गणित अंकों की टैली गिनती

गिनती को आसान बनाने के लिए चार टैलियों को //// इस प्रकार रखा जाता है और पाँचवीं टैली को उनके ऊपर | इस प्रकार लगाया जाता है। फिर टैलियों को पाँच-पाँच के समूहों में गिना जाता है। इसलिए यदि किसी वर्ग में 16 टैलियाँ हों, तो हम सुविधा के लिए उन्हें |||| | |||| | इस प्रकार लगाते हैं। इस प्रकार किसी वर्ग की बारंबारता उस वर्ग के सामने लगी टैलियों की संख्या के बराबर होती है।

सूचना की हानि

आंकड़ों को बारंबारता बंटन के रूप में वर्गीकृत करने में एक अंतर्निहित कमी होती है। यह यद्यपि कच्चे आंकड़ों का सारांश बनाकर उन्हें संक्षिप्त और समझने योग्य बनाता है, परंतु इसमें वे विवरण नहीं दिखते जो कच्चे आंकड़ों में मौजूद होते हैं। कच्चे आंकड़ों को वर्गीकृत करने पर सूचना की हानि होती है, यद्यपि इसे वर्गीकृत आंकड़ों के रूप में सारांशित करने से बहुत कुछ प्राप्त होता है। एक बार जब आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो कोई भी व्यक्तिगत प्रेक्षण आगे की सांख्यिकीय गणनाओं में कोई महत्व नहीं रखता। उदाहरण 4 में, वर्ग 20-30 में 6 प्रेक्षण हैं: $25,25,20,22,25$ और 28। इसलिए जब इन आंकड़ों को बारंबारता बंटन में वर्ग $20-30$ के रूप में समूहबद्ध किया जाता है, तो बाद वाला केवल उस वर्ग में दर्ज प्रेक्षणों की संख्या प्रदान करता है (अर्थात् बारंबारता $=6$) परंतु उनके वास्तविक मान नहीं दिखाता। इस वर्ग के सभी मानों को वर्ग अंतराल के मध्य मान या वर्ग चिह्न (अर्थात् 25) के बराबर माना जाता है। आगे की सांख्यिकीय गणनाएं केवल वर्ग चिह्न के मानों पर आधारित होती हैं, न कि उस वर्ग में मौजूद प्रेक्षणों के मानों पर। यह बात अन्य वर्गों के लिए भी सत्य है। इस प्रकार सांख्यिकीय विधियों में प्रेक्षणों के वास्तविक मानों के स्थान पर वर्ग चिह्न के प्रयोग से पर्याप्त सूचना की हानि होती है। तथापि, कच्चे आंकड़ों को अधिक समझने योग्य बनाने की क्षमता इस हानि से कहीं अधिक लाभ देती है।

असमान वर्गों के साथ बारंबारता बंटन

अब तक आप समान वर्ग अंतरालों की बारंबारता बंटन से परिचित हैं। आप जानते हैं कि वे कच्चे आँकड़ों से कैसे बनाए जाते हैं। लेकिन कुछ मामलों में असमान वर्ग अंतरालों वाले बारंबारता बंटन अधिक उपयुक्त होते हैं। यदि आप उदाहरण 4 की बारंबारता बंटन को तालिका 3.6 के अनुसार देखें, तो आप देखेंगे कि अधिकांश प्रेक्षण वर्गों 40-50, 50-60 और 60-70 में केंद्रित हैं। इनकी संबंधित बारंबारताएँ 21, 23 और 19 हैं। इसका अर्थ है कि 100 विद्यार्थियों में से 63 $(21 + 23 + 19)$ विद्यार्थी इन वर्गों में केंद्रित हैं। इस प्रकार, 63 प्रतिशत 40-70 के मध्य सीमा में हैं। शेष 37 प्रतिशत आँकड़े वर्गों $0-10, 10-20, 20-30, 30-40$, 70-80, 80-90 और 90-100 में हैं। ये वर्ग प्रेक्षणों से विरल आबादित हैं। आगे आप यह भी देखेंगे कि इन वर्गों में प्रेक्षण अपने-अपने वर्ग चिह्नों से अन्य वर्गों की तुलना में अधिक विचलित होते हैं। लेकिन यदि वर्ग इस प्रकार बनाए जाएँ कि वर्ग चिह्न, जहाँ तक संभव हो, उस मान से मेल खाएँ जिसके आसपास एक वर्ग में प्रेक्षण केंद्रित होते हैं, तो असमान वर्ग अंतराल अधिक उपयुक्त है।

TABLE 3.7 असमान वर्गों की बारंबारता बंटन

वर्ग प्रेक्षण आवृत्ति वर्ग चिह्न
0-10 0 1 5
10-20 10,14,17,12,14,12,14,14 8 15
20-30 25,25,20,22,25,28 6 25
30-40 30,37,34,39,32,30,35 7 35
40-45 42,44,40,44,41,40,43,40,41 9 42.5
45-50 47,49,49,45,45,47,49,46,48,48,49,49 12 47.5
50-55 51,53,51,50,51,50,54 7 52.5
55-60 59,56,55,57,55,56,59,56,59,57,59,55,56,55,56,55 16 57.5
60-65 60,64,62,64,64,60,62,61,60,62 10 62.5
65-70 66,69,66,69,66,65,65,66,65 9 67.5
70-80 70,75,70,76,70,71 6 75
80-90 82,82,82,80,85 5 85
90-100 90,100,90,90 4 95
कुल 100

तालिका 3.7 तालिका 3.6 की उसी आवृत्ति बंटन को असमान वर्गों के संदर्भ में दिखाती है। 40-50, 50-60 और 60-70 के प्रत्येक वर्ग को दो भागों में विभाजित किया गया है। वर्ग 40-50 को 40-45 और 45-50 में बाँटा गया है। वर्ग 50-60 को 50-55 और 55-60 में बाँटा गया है। और वर्ग 60-70 को 60-65 और 65-70 में बाँटा गया है। नए वर्ग 40-45, 45-50, 50-55, 55-60, 60-65 और 65-70 का वर्ग अंतराल 5 है। अन्य वर्ग: 0-10, 10-20, 20-30, 30-40, 70-80, 80-90 और 90-100 अपना पुराना वर्ग अंतराल 10 बनाए रखते हैं। इस तालिका का अंतिम स्तंभ इन वर्गों के लिए वर्ग चिह्नों के नए मान दिखाता है। इनकी तुलना तालिका 3.6 में वर्ग चिह्नों के पुराने मानों से करें। ध्यान दें कि इन वर्गों में प्रेक्षण उनके पुराने वर्ग चिह्न मानों की अपेक्षा अपने नए वर्ग चिह्न मानों से अधिक विचलित हुए हैं। इस प्रकार नए वर्ग चिह्न मान पुराने मानों की अपेक्षा इन वर्गों में आँकड़ों के अधिक प्रतिनिधि हैं।

आकृति 3.2 तालिका 3.7 के बंटन की आवृत्ति वक्र दिखाती है।

आकृति 3.2: आवृत्ति वक्र

तालिका के वर्ग चिह्नों को X-अक्ष पर और आवृत्तियों को Y-अक्ष पर आलेखित किया गया है।

गतिविधि

  • यदि आप आकृति 3.2 की तुलना आकृति 3.1 से करें, तो आप क्या प्रेक्षित करते हैं? क्या आपको इनमें कोई अंतर दिखता है? क्या आप अंतर की व्याख्या कर सकते हैं?

आवृत्ति सरणी

अब तक हमने एक सतत चर के आँकड़ों के वर्गीकरण पर चर्चा की है, जिसमें गणित में 100 विद्यार्थियों के प्रतिशत अंकों को उदाहरण के रूप में लिया गया है। एक विच्छिन्न चर के लिए उसके आँकड़ों का वर्गीकरण बारंबारता बंटन (Frequency Distribution) कहलाता है। चूँकि एक विच्छिन्न चर मान लेता है और दो पूर्णांक मानों के बीच की भिन्नात्मक मान नहीं लेता, इसलिए हर पूर्णांक मान के अनुरूप बारंबारताएँ होती हैं।

तालिका 3.8 में दिया गया उदाहरण एक बारंबारता सरणी (Frequency Array) को दर्शाता है।

तालिका 3.8 परिवार के आकार की बारंबारता सरणी

परिवार का आकार परिवारों की संख्या
1 5
2 15
3 25
4 35
5 10
6 5
7 3
8 2
योग 100

चर “परिवार का आकार” एक विच्छिन्न चर है जो केवल पूर्णांक मान लेता है जैसा कि तालिका में दिखाया गया है।

6. द्विचर बारंबारता बंटन

अक्सर जब हम किसी जनसंख्या से एक नमूना लेते हैं तो नमूने के प्रत्येक तत्व से एक से अधिक प्रकार की सूचना एकत्र करते हैं। उदाहरण के लिए, मान लीजिए हमने किसी शहर में आधारित कंपनियों की सूची से 20 कंपनियों का नमूना लिया है। मान लीजिए हमने प्रत्येक कंपनी से बिक्री और विज्ञापन पर व्यय की सूचना एकत्र की है। इस स्थिति में हमारे पास द्विचर नमूना आँकड़े हैं। ऐसे द्विचर आँकड़ों को एक द्विचर बारंबारता बंटन द्वारा संक्षेप में प्रस्तुत किया जा सकता है।

द्विचर बारंबारता बंटन को दो चरों के मानों के बारंबारता बंटन के रूप में परिभाषित किया जा सकता है।

तालिका 3.9 20 कंपनियों की दो चरों—बिक्री और विज्ञापन व्यय (रु. लाख में)—की आवृत्ति बंटन दिखाती है। बिक्री के मान विभिन्न स्तंभों में वर्गीकृत हैं और विज्ञापन व्यय के मान विभिन्न पंक्तियों में वर्गीकृत हैं। प्रत्येक कोष्ठक संगत पंक्ति और स्तंभ मानों की आवृत्ति दिखाता है। उदाहरण के लिए, 3 ऐसी फर्में हैं जिनकी बिक्री रु 135 से रु 145 लाख के बीच है और उनका विज्ञापन व्यय रु 64 से रु 66 हजार के बीच है। द्विचर बंटन का उपयोग सहसंबंध पर अध्याय 8 में किया जाएगा।

7. निष्कर्ष

प्राथमिक और द्वितीय स्रोतों से एकत्र किए गए आंकड़े कच्चे या अवर्गीकृत होते हैं। एक बार आंकड़े एकत्र हो जाने पर, अगला चरण उन्हें आगे के सांख्यिकीय विश्लेषण के लिए वर्गीकृत करना होता है। वर्गीकरण आंकड़ों में क्रम लाता है। यह अध्याय आपको यह जानने में सक्षम बनाता है कि आंकड़ों को आवृत्ति बंटन के माध्यम से व्यापक रूप से कैसे वर्गीकृत किया जा सकता है। एक बार जब आप वर्गीकरण की तकनीकों को जान लेते हैं, तो आपके लिए सतत और विच्छिन्न चरों दोनों के लिए आवृत्ति बंटन बनाना आसान हो जाएगा।

तालिका 3.9 20 फर्मों की बिक्री (लाख रु में) और विज्ञापन व्यय (हजार रु में) का द्विचर आवृत्ति बंटन

115–125 125–135 135–145 145–155 155–165 165–175 कुल
62-64 2 1 3
64-66 1 3 4
66-68 1 1 2 1 5
68-70 2 2 4
70-72 1 1 1 1 4
कुल 4 5 6 3 1 1 20

सारांश

  • वर्गीकरण कच्चे आँकड़ों में क्रम लाता है।
  • एक बारंबारता बंटन यह दर्शाता है कि किसी चर के विभिन्न मान किस प्रकार विभिन्न वर्गों में बँटे हैं तथा संगत वर्ग बारंबारताएँ क्या हैं।
  • अनन्य विधि में या तो ऊपरी वर्ग सीमा या निचली वर्ग सीमा को बाहर रखा जाता है।
  • समावेशी विधि में ऊपरी और निचली दोनों वर्ग सीमाएँ शामिल की जाती हैं।
  • बारंबारता बंटन में आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न मानों पर आधारित होती हैं, प्रेक्षणों के मानों पर नहीं।
  • वर्गों को इस प्रकार बनाना चाहिए कि प्रत्येक वर्ग का वर्ग चिह्न यथासंभव उस मान के निकट आए, जिसके आस-पास वर्ग के प्रेक्षण एकत्रित होते हैं।

अभ्यास

निम्नलिखित में से कौन-सा कथन सत्य है?

(i) वर्च मध्य-बिंदु बराबर होता है:

(a) ऊपरी वर्ग सीमा और निचली वर्ग सीला के औसत का।

(b) ऊपरी वर्ग सीमा और निचली वर्ग सीमा के गुणनफल का।

(c) ऊपरी वर्ग सीमा और निचली वर्ग सीमा के अनुपात का।

(d) उपरोक्त में से कोई नहीं।

(ii) दो चरों का बारंबारता बंटन द्विचर बारंबारता बंटन कहलाता है।

(ए) एकचर वितरण

(ब) द्विचर वितरण

(स) बहुचर वितरण

(द) उपर्युक्त में से कोई नहीं

(त्रय) वर्गीकृत आँकड़ों में सांख्यिकीय गणनाएँ गोपनीयता और सुरक्षा प्रोटोकॉल पर आधारित होती हैं

(ए) मापन के वास्तविक मान

(ब) वर्ग की ऊपरी सीमा

(स) वर्ग की निचली सीमाएँ

(द) वर्ग मध्य-बिंदु

(चतु:) परास (Range) विच्छेदन का माप है

(ए) सबसे बड़े और सबसे छोटे प्रेक्षणों के बीच का अंतर

(ब) सबसे छोटे और सबसे बड़े प्रेक्षणों के बीच का अंतर

(स) सबसे बड़े और सबसे छोटे प्रेक्षणों का औसत

(द) सबसे बड़े को सबसे छोटे प्रेक्षण से अनुपात

2. क्या चीज़ों को वर्गीकृत करने का कोई लाभ हो सकता है? अपने दैनिक जीवन के उदाहरण के साथ समझाइए।

3. चर क्या है? विवृत (discrete) और सतत (continuous) चर में अंतर बताइए।

4. आँकड़ों के वर्गीकरण में प्रयुक्त ‘अनन्य’ (exclusive) और ‘समावेशी’ (inclusive) विधियों की व्याख्या कीजिए।

5. सारणी 3.2 में दिए गए 50 घरों के भोजन पर मासिक घरेलू व्यय (रुपयों में) से संबंधित आँकड़ों का प्रयोग कीजिए और

(i) भोजन पर मासिक घरेलू व्यय की परास प्राप्त कीजिए।

(ii) परास को उचित संख्या में वर्ग अंतरालों में बाँटिए और व्यय का बारंबारता बंटन प्राप्त कीजिए।

(iii) उन घरों की संख्या ज्ञात कीजिए जिनका भोजन पर मासिक व्यय

(ए) रु 2000 से कम है

(ब) रु 3000 से अधिक है

(स) रु 1500 और रु 2500 के बीच है

6. एक शहर में 45 परिवारों से उनके द्वारा उपयोग किए जाने वाले सेल फोनों की संख्या के बारे में सर्वेक्षण किया गया। नीचे दर्ज उनकी प्रतिक्रियाओं के आधार पर एक आवृत्ति सरणी तैयार करें।

1 3 2 2 2 2 1 2 1 2 2 3 3 3 3
3 3 2 3 2 2 6 1 6 2 1 5 1 5 3
2 4 2 7 4 2 4 3 4 2 0 3 1 4 3

7. वर्गीकृत डेटा में ‘सूचना की हानि’ क्या है?

  1. क्या आप सहमत हैं कि वर्गीकृत डेटा कच्चे डेटा की तुलना में अधिक सुरक्षित है? क्यों?

9. एकचर और द्विचर आवृत्ति बंटन के बीच अंतर बताइए।

10. निम्नलिखित डेटा से 7 की वर्ग अंतराल लेते हुए समावर्ती विधि द्वारा एक आवृत्ति बंटन तैयार करें।

28 17 15 22 29 21 23 27 18 12 7 2 9 4
1 8 3 10 5 20 16 12 8 4 33 27 21 15
3 36 27 18 9 2 4 6 32 31 29 18 14 13
15 11 9 7 1 5 37 32 28 26 24 20 19 25
19 20 6 9

11. “The quick brown fox jumps over the lazy dog” उपरोक्त वाक्य को ध्यान से परीक्षित करें और प्रत्येक शब्द में अक्षरों की संख्या को नोट करें। अक्षरों की संख्या को एक चर मानते हुए, इस डेटा के लिए एक आवृत्ति सरणी तैयार करें।

सुझाई गई गतिविधि

  • अपने पुराने अंकपत्रों से पिछली कक्षा की अर्धवार्षिक या वार्षिक परीक्षाओं में गणित में प्राप्त किए गए अंक खोजें। उन्हें वर्षवार व्यवस्थित करें। जांचें कि आपने जिस विषय में अंक प्राप्त किए हैं, वह एक चर है या नहीं। यह भी देखें कि क्या वर्षों के दौरान आपने गणित में सुधार किया है।