अध्याय 04 डेटा का प्रस्तुतीकरण

1. परिचय

आपने पिछले अध्यायों में सीखा है कि आँकड़े कैसे एकत्र किए और संगठित किए जाते हैं। चूँकि आँकड़े आमतौर पर बड़ी मात्रा में होते हैं, उन्हें संक्षिप्त और प्रस्तुत करने योग्य रूप में रखना आवश्यक होता है। यह अध्याय आँकड़ों की सटीक प्रस्तुति से संबंधित है ताकि एकत्र किए गए विशाल आँकड़ों को तुरंत उपयोग में लाया जा सके और उन्हें आसानी से समझा जा सके। आमतौर पर आँकड़ों की प्रस्तुति के तीन रूप होते हैं:

  • पाठात्मक या वर्णनात्मक प्रस्तुति
  • सारणीबद्ध प्रस्तुति
  • आरेखीय प्रस्तुति

2. आँकड़ों की पाठात्मक प्रस्तुति

पाठात्मक प्रस्तुति में, आँकड़ों को पाठ के भीतर वर्णित किया जाता है। जब आँकड़ों की मात्रा अधिक नहीं होती है तो यह प्रस्तुति रूप अधिक उपयुक्त होता है। निम्नलिखित उदाहरणों को देखें:

केस 1

08 सितंबर 2005 को पेट्रोल और डीज़ल की कीमतों में वृद्धि के विरोध में दिए गए बंद आह्वान के दौरान, बिहार के एक कस्बे में 5 पेट्रोल पंप खुले पाए गए और 17 बंद थे जबकि 2 स्कूल बंद थे और शेष 9 स्कूल खुले पाए गए।

केस 2

भारत की जनगणना 2001 ने बताया कि भारत की जनसंख्या बढ़कर 102 करोड़ हो गई थी जिसमें केवल 49 करोड़ महिलाएँ थीं जबकि 53 करोड़ पुरुष थे। चौहत्तर करोड़ लोग ग्रामीण भारत में रहते थे और केवल 28 करोड़ लोग शहरों या कस्बों में रहते थे। जबकि पूरे देश में 62 करोड़ गैर-कार्यरत जनसंख्या थी जबकि 40 करोड़ कार्यरत थे। शहरी जनसंख्या में गैर-कार्यरत लोगों की हिस्सेदारी (19 करोड़) कार्यरत लोगों (9 करोड़) की तुलना में और भी अधिक थी जबकि ग्रामीण जनसंख्या में 74 करोड़ की कुल जनसंख्या में से 31 करोड़ कार्यरत थे…

दोनों ही मामलों में डेटा को केवल पाठ के रूप में प्रस्तुत किया गया है। प्रस्तुति की इस विधि का एक गंभीर नुकसान यह है कि समझने के लिए किसी को प्रस्तुति के संपूर्ण पाठ को पढ़ना पड़ता है। लेकिन यह भी सच है कि यह तरीका प्रायः प्रस्तुति के कुछ बिंदुओं पर जोर देने में सहायक होता है।

3. डेटा की सारणीबद्ध प्रस्तुति

सारणीबद्ध प्रस्तुति में डेटा को पंक्तियों (क्षैतिज रूप से पढ़ी जाती हैं) और स्तंभों (ऊध्र्वाधर रूप से पढ़े जाते हैं) में प्रस्तुत किया जाता है। उदाहरण के लिए सारणी 4.1 देखें जो साक्षरता दरों की जानकारी को सारणीबद्ध करता है। इसमें तीन पंक्तियाँ (पुरुष, महिला और कुल के लिए) और तीन स्तंभ (शहरी, ग्रामीण और कुल के लिए) हैं। इसे $3 \times 3$ सारणी कहा जाता है जो 9 बॉक्सों में 9 जानकारियाँ देती है, जिन्हें सारणी की “कोशिकाएँ” कहा जाता है। प्रत्येक कोशिका ऐसी जानकारी देती है जो लिंग के एक गुण (“पुरुष”, “महिला” या कुल) को एक संख्या (ग्रामीण लोगों, शहरी लोगों और कुल की साक्षरता प्रतिशत) से संबद्ध करती है। सारणीबद्ध करने का सबसे महत्वपूर्ण लाभ यह है कि यह डेटा को आगांविक सांख्यिकीय उपचार और निर्णय लेने के लिए संगठित करता है। सारणीबद्ध करने में प्रयुक्त वर्गीकरण चार प्रकार के होते हैं:

  • गुणात्मक
  • परिमाणात्मक
  • कालिक और
  • स्थानिक

गुणात्मक वर्गीकरण

जब वर्गीकरण विशेषताओं के अनुसार किया जाता है, जैसे सामाजिक स्थिति, शारीरिक स्थिति, राष्ट्रीयता आदि, तो इसे गुणात्मक वर्गीकरण कहा जाता है। उदाहरण के लिए, तालिका 4.1 में वर्गीकरण के लिए विशेषताएँ लिंग और स्थान हैं जो प्रकृति में गुणात्मक हैं।

तालिका 4.1 लिंग और स्थान के अनुसार भारत में साक्षरता (प्रतिशत)

स्थान कुल
लिंग ग्रामीण शहरी
पुरुष 79 90 82
महिला 59 80 65
कुल 68 84 74

स्रोत: भारत की जनगणना 2011। (साक्षरता दर 7 वर्ष और उससे अधिक आयु की आबादी से संबंधित है)

मात्रात्मक वर्गीकरण

मात्रात्मक वर्गीकरण में, आंकड़ों को उन विशेषताओं के आधार पर वर्गीकृत किया जाता है जो प्रकृति में मात्रात्मक होती हैं। दूसरे शब्दों में, इन विशेषताओं को मात्रात्मक रूप से मापा जा सकता है। उदाहरण के लिए, आयु, ऊंचाई, उत्पादन, आय आदि मात्रात्मक विशेषताएँ हैं। वर्ग उन मानों के लिए सीमाएँ निर्धारित करके बनाए जाते हैं जिन्हें वर्ग सीमाएँ कहा जाता है जो विचाराधीन विशेषता के मानों के लिए होती हैं। मात्रात्मक वर्गीकरण का एक उदाहरण तालिका 4.2 में दिया गया है। तालिका में लापता आंकड़ों की गणना कीजिए।

तालिका 4.2 बिहार में एक चुनाव अध्ययन में उनकी आयु के अनुसार 542 उत्तरदाताओं का वितरण

आयु समूह (वर्ष) उत्तरदाताओं की संख्या प्रतिशत
20-30 3 0.55
30-40 61 11.25
40-50 132 24.35
50-60 153 28.24
60-70 $?$ $?$
70-80 51 9.41
80-90 2 0.37
सभी ? 100.00

स्रोत: विधानसभा चुनाव पटना मध्य निर्वाचन क्षेत्र 2005, ए. एन. सिन्हा इंस्टीट्यूट ऑफ सोशल स्टडीज, पटना।

यहाँ वर्गीकरण की विशेषता आयु वर्षों में है और यह मात्रात्मक है।

गतिविधियाँ

  • चर्चा करें कि तालिका 4.1 में कुल मान कैसे आए हैं
  • एक तालिका बनाएँ जो आपकी कक्षा के छात्रों के स्टार न्यूज़, ज़ी न्यूज़, बीबीसी वर्ल्ड, सीएनएन, आज तक और डीडी न्यूज़ के प्रति प्राथमिकता संबंधी पसंद के आंकड़े प्रस्तुत करे।
  • एक तालिका तैयार करें

(i) ऊँचाइयों (सेमी में) और

(ii) वज़न (किग्रा में) आपकी कक्षा के छात्रों की।

अस्थायी वर्गीकरण

इस वर्गीकरण में समय वर्गीकरण चर बन जाता है और आंकड़ों को समय के अनुसार श्रेणीबद्ध किया जाता है। समय घंटों, दिनों, सप्ताहों, महीनों, वर्षों आदि में हो सकता है। उदाहरण के लिए, तालिका 4.3 देखें।

तालिका 4.3 1995 से 2000 तक एक चाय की दुकान की वार्षिक बिक्री

वर्ष बिक्री (रुपये लाख में)
1995 79.2
1996 81.3
1997 8.4
1998 80.5
1999 100.2
2000 91.2

आंकड़ा स्रोत: अप्रकाशित आंकड़े।

इस तालिका में वर्गीकरण की विशेषता वर्ष की बिक्री है और यह समय के पैमाने पर मान लेती है।

गतिविधि

  • अपने स्कूल के कार्यालय जाएँ और पिछले दस वर्षों में प्रत्येक कक्षा में अध्ययन करने वाले छात्रों की संख्या के आंकड़े एकत्र करें और उन्हें तालिका में प्रस्तुत करें।

स्थानिक वर्गीकरण

जब वर्गीकरण स्थान के आधार पर किया जाता है, तो इसे स्थानिक वर्गीकरण कहा जाता है। स्थान गाँव/नगर, ब्लॉक, ज़िला, राज्य, देश आदि हो सकता है।

तालिका 4.4 एक स्थानिक वर्गीकरण का उदाहरण है।

तालिका 4.4 वर्ष 2013-14 में भारत से शेष विश्व को निर्यात, कुल निर्यात में हिस्सा (प्रतिशत)

गंतव्य निर्यात हिस्सा
यूएसए 12.5
जर्मनी 2.4
अन्य यूरोपीय संघ 10.9
यूके 3.1
जापान 2.2
रूस 0.7
चीन 4.7
पश्चिम एशिया - खाड़ी सहयोग परिषद 15.3
अन्य एशिया 29.4
अन्य 18.8
सभी 100.0

(कुल निर्यात: अमेरिकी $\$$ 314.40 अरब)

गतिविधि

  • अपनी कक्षा के विद्यार्थियों के मूल राज्यों/आवासीय क्षेत्रों के अनुसार एकत्रित आँकड़ों को प्रस्तुत करने वाली एक तालिका बनाएँ।

4. आँकड़ों का सारणीबद्धन और तालिका के भाग

एक तालिका बनाने के लिए पहले यह जानना आवश्यक है कि एक अच्छी सांख्यिकीय तालिका के कौन-कौन से भाग होते हैं। जब इन भागों को क्रमबद्ध रूप से एक साथ रखा जाता है, तो वे एक तालिका बनाते हैं। तालिका को समझने का सबसे सरल तरीका यह है कि आँकड़ों को कुछ व्याख्यात्मक नोटों के साथ पंक्तियों और स्तंभों में प्रस्तुत किया जाए। सारणीबद्धन एकल-दिशा, द्वि-दिशा या त्रि-दिशा वर्गीकरण के अनुसार किया जा सकता है, यह इस बात पर निर्भर करता है कि कितनी विशेषताएँ शामिल हैं। एक अच्छी तालिका में अनिवार्य रूप से निम्नलिखित होना चाहिए:

(i) तालिका संख्या

टेबल संख्या को पहचान के उद्देश्य से एक टेबल को सौंपा जाता है। यदि एक से अधिक टेबल प्रस्तुत किए जाते हैं, तो यह टेबल संख्या ही होती है जो एक टेबल को दूसरे से अलग करती है। यह टेबल के शीर्षक के शीर्ष या प्रारंभ में दी जाती है। आमतौर पर, यदि किताब में कई टेबल हों तो टेबल संख्याएँ आरोही क्रम में पूर्ण संख्याएँ होती हैं। उपस्क्रिप्ट संख्याएँ, जैसे $1.2,3.1$, आदि, भी टेबल की स्थिति के अनुसार उसकी पहचान के लिए प्रयुक्त होती हैं। उदाहरण के लिए, टेबल 4.5 को चौथे अध्याय की पाँचवीं टेबल के रूप में पढ़ा जाना चाहिए, और इसी तरह (देखें टेबल 4.5)।

(ii) शीर्षक

टेबल का शीर्षक टेबल की सामग्री के बारे में बताता है। इसे स्पष्ट, संक्षिप्त और सावधानीपूर्वक शब्दों में होना चाहिए ताकि टेबल से की गई व्याख्याएँ स्पष्ट हों और अस्पष्टता से मुक्त हों। यह टेबल के शीर्ष पर टेबल संख्या के बाद या उसके ठीक नीचे स्थान पाता है (देखें टेबल 4.5)।

(iii) कैप्शन या स्तंभ शीर्षक

टेबल में प्रत्येक स्तंभ के शीर्ष पर स्तंभ का नाम दिया जाता है ताकि स्तंभ के आँकड़ों की व्याख्या हो सके। इसे कैप्शन या स्तंभ शीर्षक कहा जाता है (देखें टेबल 4.5)।

(iv) स्टब या पंक्ति शीर्षक

कैप्शन या स्तंभ शीर्षक की तरह, टेबल की प्रत्येक पंक्ति को भी एक शीर्षक देना होता है। पंक्तियों के नामों को स्टब या स्टब आइटम भी कहा जाता है, और पूरी बाईं ओर का स्तंभ स्टब स्तंभ के रूप में जाना जाता है। पंक्ति शीर्षकों का संक्षिप्त विवरण टेबल के बाईं ओर ऊपर भी दिया जा सकता है (देखें टेबल $4.5$)।

(v) टेबल का मुख्य भाग

सारणी का मुख्य भाग उसका ‘body’ होता है और इसमें वास्तविक आँकड़े होते हैं। सारणी में किसी एक आँकड़े/आकृति का स्थान निश्चित होता है और वह सारणी की पंक्ति तथा स्तंभ से निर्धारित होता है। उदाहरण के लिए, दूसरी पंक्ति और चौथे स्तंभ में दिया गया आँकड़ा बताता है कि वर्ष 2001 में ग्रामीण भारत में 25 करोड़ महिलाएँ गैर-कार्यरत थीं (देखिए सारणी 4.5)।

(vi) मापन की इकाई

सारणी में दी गई आकृतियों (वास्तविक आँकड़ों) की मापन की इकाई को हमेशा शीर्षक के साथ देना चाहिए। यदि सारणी की पंक्तियों या स्तंभों के लिए भिन्न-भिन्न इकाइयाँ हों, तो इन इकाइयों को ‘stubs’ या ‘captions’ के साथ अवश्य देना चाहिए। यदि आकड़े बड़े हों, तो उन्हें पूर्णांकित करना चाहिए और पूर्णांकन की विधि को स्पष्ट करना चाहिए (देखिए सारणी 4.5)।

(नोट: सारणी 4.5 वही आँकड़े सारणीबद्ध रूप में प्रस्तुत करती है जिन्हें पहले केस 2 के माध्यम से गद्य रूप में प्रस्तुत किया जा चुका है)

(vii) स्रोत

यह एक संक्षिप्त कथन या वाक्यांश होता है जो सारणी में प्रस्तुत आँकड़ों के स्रोत को दर्शाता है। यदि एक से अधिक स्रोत हों, तो सभी स्रोतों को स्रोत में लिखना चाहिए। स्रोत आमतौर पर सारणी के नीचे लिखा जाता है (देखिए सारणी 4.5)।

(viii) नोट

नोट सारणी का अंतिम भाग होता है। यह सारणी में दिए गए आँकड़ों की उस विशेष विशेषता को स्पष्ट करता है जो स्वतः स्पष्ट नहीं होती और जिसे पहले समझाया नहीं गया है।

गतिविधियाँ

  • एक सारणी बनाने के लिए अनिवार्यतः कितनी पंक्तियाँ और स्तंभों की आवश्यकता होती है?
  • क्या सारणी के स्तंभ/पंक्ति शीर्षक मात्रात्मक हो सकते हैं?
  • क्या आप सारणियों 4.2 और 4.3 को आँकड़ों को उपयुक्त रूप से पूर्णांकित करके प्रस्तुत कर सकते हैं?
  • पृष्ठ 41 पर दिए गए केस 2 के पहले दो वाक्यों को सारणी के रूप में प्रस्तुत कीजिए। इसके लिए कुछ विवरण इसी अध्याय के अन्य भागों में मिलेंगे।

5. आँकड़ों की आरेखीय प्रस्तुति

यह आँकड़ों को प्रस्तुत करने की तीसरी विधि है। यह विधि तालिकीय या पाठात्मक प्रस्तुति की तुलना में स्थिति को समझने का सबसे तेज़ तरीका प्रदान करती है। आँकड़ों की आरेखीय प्रस्तुति संख्याओं में निहित अत्यधिक अमूर्त विचारों को अधिक ठोस और सरल रूप में अनुवादित करती है।

आरेख कम सटीक हो सकते हैं, लेकिन आँकड़ों को प्रस्तुत करने में वे सारणियों की तुलना में अधिक प्रभावी होते हैं।

सामान्य प्रयोग में विभिन्न प्रकार के आरेख आते हैं। उनमें से महत्त्वपूर्ण निम्नलिखित हैं:

(i) ज्यामितीय आरेख

(ii) बारंबारता आरेख

(iii) अंकगणितीय रेखा ग्राफ

ज्यामितीय आरेख

बार आरेख और पाई आरेख ज्यामितीय आरेख की श्रेणी में आते हैं। बार आरेख तीन प्रकार के होते हैं – सरल, बहु और संघटक बार आरेख।

बार आरेख

सरल बार आरेख

दंड आरेख में प्रत्येक वर्ग या श्रेणी के लिए समान अंतराल और समान चौड़ाई के आयताकार दंडों का एक समूह होता है। दंड की ऊँचाई या लंबाई आँकड़े की परिमाण को दर्शाती है। दंड का निचला सिरा आधार रेखा को स्पर्श करता है ताकि दंड की ऊँचाई शून्य इकाई से प्रारंभ हो। दंड आरेख के दंडों की सापेक्ष ऊँचाई से दृश्य तुलना की जा सकती है और इस प्रकार आँकड़े शीघ्र समझे जाते हैं। इसके लिए आँकड़े बारंबारता प्रकार या अ-बारंबारता प्रकार के हो सकते हैं। अ-बारंबारता प्रकार के आँकड़ों में किसी विशेष लक्षण, जैसे उत्पादन, उपज, जनसंख्या आदि के विभिन्न समय बिंदुओं या विभिन्न राज्यों पर मान दर्ज किए जाते हैं और संबंधित लक्षण के मानों के अनुसार संगत ऊँचाई के दंड बनाकर आरेख बनाया जाता है। लक्षणों के मान (मापे गए या गिने गए) प्रत्येक मान की पहचान बनाए रखते हैं। चित्र 4.1 एक दंड आरेख का उदाहरण है।

गतिविधि

  • वर्तमान वर्ष में अपने विद्यालय में प्रत्येक कक्षा में अध्ययनरत छात्रों की संख्या एकत्र करें। उसी सारणी के लिए एक दंड आरेख बनाएँ।

विभिन्न प्रकार के आँकड़ों के लिए विभिन्न प्रकार की आलेखीय प्रस्तुति आवश्यक हो सकती है।
स्तंभ आरेख (Bar diagrams) आवृत्ति-प्रकार और गैर-आवृत्ति-प्रकार दोनों चरों और विशेषताओं के लिए उपयुक्त होते हैं।
परिवार के आकार, पासे पर बिंदु, परीक्षा में ग्रेड आदि जैसे विच्छिन्न चर और लिंग, धर्म, जाति, देश आदि जैसी विशेषताओं को स्तंभ आरेख द्वारा दर्शाया जा सकता है।
स्तंभ आरेख आय-व्यय प्रोफ़ाइल, वर्षों के दौरान निर्यात/आयात आदि गैर-आवृत्ति आँकड़ों के लिए अधिक सुविधाजनक होते हैं।

एक श्रेणी जिसका स्तंभ (केरल की साक्षरता) दूसरी श्रेणी (पश्चिम बंगाल की साक्षरता) की तुलना में लंबा है, उसमें मापी गई (या गिनी गई) विशेषता अधिक है।
स्तंभों (जिन्हें कॉलम भी कहा जाता है) का प्रयोग सामान्यतः समय श्रेणी आँकड़ों में किया जाता है (1980 से 2000 के बीच खाद्यान्न उत्पादन, दशकीय कार्य-भागीदारी दर में परिवर्तन, वर्षों के दौरान पंजीकृत बेरोज़गार, साक्षरता दर आदि) (चित्र 4.2)।

TABLE 4.6 भारत के प्रमुख राज्यों की साक्षरता दरें

2001 2011
प्रमुख भारतीय राज्य पुरुष महिला पुरुष महिला
आंध्र प्रदेश (AP) 70.3 50.4 75.6 59.7
असम (AS) 71.3 54.6 78.8 67.3
बिहार (BR) 59.7 33.1 73.4 53.3
झारखंड (JH) 67.3 38.9 78.4 56.2
गुजरात (GJ) 79.7 57.8 87.2 70.7
हरियाणा (HR) 78.5 55.7 85.3 66.8
कर्नाटक (KA) 76.1 56.9 82.9 68.1
केरल (KE) 94.2 87.7 96.0 92.0
मध्य प्रदेश (MP) 76.1 50.3 80.5 60.0
छत्तीसगढ़ (CH) 77.4 51.9 81.5 60.6
महाराष्ट्र (MR) 86.0 67.0 89.8 75.5
ओडिशा (OD) 75.3 50.5 82.4 64.4
पंजाब (PB) 75.2 63.4 81.5 71.3
राजस्थान (RJ) 75.7 43.9 80.5 52.7
तमिलनाडु (TN) 82.4 64.4 86.8 73.9
उत्तर प्रदेश (UP) 68.8 42.2 79.2 59.3
उत्तराखंड (UK) 83.3 59.6 88.3 70.7
पश्चिम बंगाल (WB) 77.0 59.6 82.7 71.2
भारत **75.3 ** **53.7 ** **82.1 ** **65.5 **

चित्र 4.1: भारत के प्रमुख राज्यों के पुरुष साक्षरता दर को दर्शाता दंड आरेख, 2011. (साक्षरता दर 7 वर्ष और उससे अधिक आयु की जनसंख्या से संबंधित है)

दंड आरेख विभिन्न रूपों में हो सकते हैं जैसे कि बहु-दंड आरेख और घटक दंड आरेख।

गतिविधियाँ

  • 2011 में भारत के प्रमुख राज्यों में से कितने राज्यों में महिला साक्षरता दर राष्ट्रीय औसत से अधिक थी?
  • क्या 2001 और 2011 की दो क्रमिक जनगणना वर्षों में राज्यों के बीच अधिकतम और न्यूनतम महिला साक्षरता दर के बीच का अंतर घटा है?

बहु-बार आरेख

बहु-बार आरेख (चित्र 4.2) का उपयोग दो या दो से अधिक डेटा सेटों की तुलना के लिए किया जाता है, उदाहरण के लिए विभिन्न वर्षों के लिए आय और व्यय या आयात और निर्यात, विभिन्न कक्षाओं में विभिन्न विषयों में प्राप्त अंक आदि।

घटक बार आरेख

घटक बार आरेख या चार्ट (चित्र 4.3), जिन्हें उप-आरेख भी कहा जाता है, विभिन्न घटक भागों के आकारों की तुलना करने में बहुत उपयोगी होते हैं (वे तत्व या भाग जिनसे कोई वस्तु बनी होती है) और इन अभिन्न भागों के बीच संबंध को समझाने में भी। उदाहरण के लिए, विभिन्न उत्पादों से बिक्री आय, एक विशिष्ट भारतीय परिवार में व्यय प्रतिरूप (घटक होते हैं भोजन, किराया, दवाई, शिक्षा, बिजली आदि), प्राप्तियों और व्ययों के लिए बजट व्यय, श्रम बल के घटक, जनसंख्या आदि। घटक बार आरेखों को आमतौर पर उपयुक्त रूप से छायांकित या रंगा जाता है।

चित्र 4.2: भारत के प्रमुख राज्यों द्वारा 2001 और 2011 की दो जनगणना वर्षों में महिला साक्षरता दर दर्शाने वाला बहु-बार (स्तंभ) आरेख। (डेटा स्रोत तालिका 4.6)

व्याख्या: चित्र 4.2 से यह बहुत आसानी से निकाला जा सकता है कि देश भर में वर्षों से महिला साक्षरता दर में वृद्धि हो रही थी। चित्र से इसी तरह की अन्य व्याख्याएँ भी की जा सकती हैं। उदाहरण के लिए, चित्र दिखाता है कि बिहार, झारखंड और उत्तर प्रदेश राज्यों में महिला साक्षरता में सबसे तेज़ वृद्धि हुई है, आदि।

तालिका 4.7 बिहार के एक जिले में विद्यालयों में लिंग के अनुसार नामांकन (प्रतिशत) 6-14 वर्ष आयु के बच्चों का

लिंग नामांकित (प्रतिशत) विद्यालय से बाहर (प्रतिशत)
लड़का 91.5 8.5
लड़की 58.6 41.4
सभी 78.0 22.0

डेटा स्रोत: अप्रकाशित डेटा

एक घटक स्तंभ आरेख स्तंभ और उसके दो या अधिक घटकों में विभाजन को दर्शाता है। उदाहरण के लिए, स्तंभ 6-14 वर्ष आयु-समूह के बच्चों की कुल जनसंख्या को दिखा सकता है। घटक वे अनुपात दिखाते हैं जो नामांकित हैं और जो नहीं हैं। एक घटक स्तंभ आरेख में दिए गए आयु समूह सीमा में लड़कों, लड़कियों और कुल बच्चों के लिए भिन्न घटक स्तंभ भी हो सकते हैं, जैसा कि चित्र 4.3 में दिखाया गया है। घटक स्तंभ आरेख बनाने के लिए, सबसे पहले $\mathrm{x}$-अक्ष पर एक स्तंब बनाया जाता है जिसकी ऊँचाई स्तंभ के कुल मान के बराबर होती है [प्रतिशत डेटा के लिए स्तंभ की ऊँचाई 100 इकाई होती है (चित्र 4.3)]। अन्यथा ऊँचाई स्तंभ के कुल मान के बराबर होती है और घटकों की समानुपातिक ऊँचाइयाँ यूनिटरी विधि का उपयोग करके निकाली जाती हैं। छोटे घटकों को स्तंभ को विभाजित करने में प्राथमिकता दी जाती है।

चित्र 4.3: बिहार के एक जिले में प्राथमिक स्तर पर नामांकन (घटक स्तंभ आरेख)

पाई आरेख

पाई आरेख भी एक घटक आरेख है, लेकिन स्तंभ आरेख के विपरीत, यहाँ यह एक वृत्त होता है जिसका क्षेत्रफल समानुपातिक रूप से उन घटकों के बीच विभाजित होता है (चित्र 4.4) जिनका यह प्रतिनिधित्व करता है। इसे पाई चार्ट भी कहा जाता है। वृत्त को केंद्र से परिधि तक सीधी रेखाएँ खींचकर उतने ही भागों में विभाजित किया जाता है जितने घटक होते हैं।

पाई चार्ट आमतौर पर किसी श्रेणी के निरपेक्ष मानों के साथ नहीं बनाए जाते हैं। प्रत्येक श्रेणी के मानों को पहले सभी श्रेणियों के कुल मान का प्रतिशत व्यक्त किया जाता है। पाई चार्ट में एक वृत्त, चाहे उसकी त्रिज्या का मान कुछ भी हो, को 100 समान भागों में माना जाता है जिनमें से प्रत्येक $3.6^{\circ}\left(360^{\circ} / 100 \right)$ का होता है। यह ज्ञात करने के लिए कि कोई घटक वृत्त के केंद्र पर कितना कोण बनाएगा, प्रत्येक घटक के प्रतिशत आंकड़े को $3.6^{\circ}$ से गुणा किया जाता है। वृत्त के कोणीय घटकों में घटकों के प्रतिशत के इस रूपांतरण का एक उदाहरण सारणी 4.8 में दिखाया गया है।

यह उल्लेखनीय हो सकता है कि एक घटक पट्ट आरेख द्वारा दर्शाए गए आंकड़ों को पाई चार्ट द्वारा भी समान रूप से अच्छी तरह दर्शाया जा सकता है, एकमात्र आवश्यकता यह है कि घटकों के निरपेक्ष मानों को प्रतिशत में बदलना होता है ताकि उन्हें पाई आरेख के लिए प्रयोग किया जा सके।

TABLE 4.8 भारतीय जनसंख्या का वितरण (2011) उनकी कार्य स्थिति के अनुसार (करोड़)

स्थिति जनसंख्या प्रतिशत कोणीय घटक
सीमांत श्रमिक 12 9.9 $36^{\circ}$
मुख्य-श्रमिक 36 29.8 $107^{\circ}$
गैर-श्रमिक 73 60.3 $217^{\circ}$
सभी 102 100.0 $360^{\circ}$

Fig. 4.4: 2011 में कार्य स्थिति के अनुसार भारतीय जनसंख्या के विभिन्न वर्गों के लिए पाई आरेख।


गतिविधियाँ

  • आकृति 4.4 द्वारा प्रस्तुत आंकड़ों को एक घटक पट्ट आरेख द्वारा दर्शाएँ।
  • क्या पाई का क्षेत्रफल पाई आरेख द्वारा दर्शाए जाने वाले आंकड़ों के कुल मान से कोई संबंध रखता है?

बारंबारता आरेख

समूहीकृत बारंबारता बंटन के रूप में आंकड़े आमतौर पर बारंबारता आरेखों जैसे हिस्टोग्राम, बारंबारता बहुभुज, बारंबारता वक्र और ओजाइव द्वारा दर्शाए जाते हैं।

हिस्टोग्राम

एक हिस्टोग्राम एक द्वि-आयामी आरेख है। यह आयतों के एक समूह से बना होता है जिनका आधार वर्ग सीमाओं के बीच के अंतराल होते हैं (X-अक्ष के अनुदिश) और जिनके क्षेत्रफल वर्ग आवृत्तियों के अनुपातिक होते हैं (चित्र 4.5)। यदि वर्ग अंतराल समान चौड़ाई के हों, जैसा कि आमतौर पर होता है, तो आयतों के क्षेत्रफल उनकी संबंधित आवृत्तियों के अनुपातिक होते हैं। हालांकि, कुछ प्रकार के आंकड़ों में, कभी-कभी वर्ग अंतरालों की भिन्न-भिन्न चौड़ाई का उपयोग करना सुविधाजनक होता है, कभी-कभी आवश्यक भी। उदाहरण के लिए, मृत्यु के समय की आयु के अनुसार मृत्युओं की सारणी बनाते समय, आरंभ में बहुत छोटी आयु अंतरालों (0,1,2,… वर्ष/0,7,28,… दिन) का उपयोग करना बहुत अर्थपूर्ण और उपयोगी होगा, जब मृत्यु दरें अत्यधिक अधिक होती हैं, जनसंख्या के अन्य अधिकांश उच्च आयु वर्गों की तुलना में। ऐसे आंकड़ों की आलेखीय निरूपण के लिए, आयत की ऊंचाई (या क्षेत्रफल) ऊंचाई (यहां आवृत्ति) और आधार (यहां वर्ग अंतराल की चौड़ाई) का भागफल होता है। जब अंतराल समान होते हैं, अर्थात् जब सभी आयतों का आधार समान होता है, तो तुलना के उद्देश्य से क्षेत्रफल को किसी भी अंतराल की आवृत्ति से सुविधाजनक रूप से निरूपित किया जा सकता है।

जब आधार की चौड़ाई भिन्न-भिन्न होती है, तो आयतों की ऊंचाइयों को तुलनात्मक माप प्राप्त करने के लिए समायोजित किया जाना चाहिए। ऐसी स्थिति में उत्तर है आवृत्ति घनत्व (वर्ग आवृत्ति को वर्ग अंतराल की चौड़ाई से विभाजित करने पर) न कि निरपेक्ष आवृत्ति।

तालिका 4.9 एक शहर के क्षेत्र में दैनिक वेतन भोगियों का वितरण

दैनिक कमाई (रु) मजदूरी कमाने वालों की संख्या (f)
45-49 2
50-54 3
55-59 5
60-64 3
65-69 6
70-74 7
75-79 12
80-84 13
85-89 9
90-94 7
95-99 6
100-104 4
105-109 2
110-114 3
115-119 3

स्रोत: अप्रकाशित आंकड़े

चूँकि हिस्टोग्राम आयताकार होते हैं, आधार रेखा के समानांतर और समान लंबाई की एक रेखा खींची जाती है जो ऊर्ध्वाधर दूरी पर होती है जो वर्ग अंतराल की बारंबारता (या बारंबारता घनत्व) के बराबर होती है। एक हिस्टोग्राम कभी नहीं खींचा जाता है। चूँकि, सतत चर के लिए, एक वर्ग अंतराल की निचली वर्ग सीमा पिछले अंतराल की ऊपरी वर्ग सीमा से मिल जाती है, चाहे वे समान हों या असमान, आयत सभी संलग्न होते हैं और दो क्रमिक आयतों के बीच कोई खाली स्थान नहीं होता है। यदि वर्ग सतत नहीं हैं तो उन्हें पहले सतत वर्गों में बदला जाता है जैसा कि अध्याय 3 में चर्चा की गई है। कभी-कभी दो संलग्न आयतों के बीच का सामान्य भाग (चित्र 4.6) को छोड़ दिया जाता है जिससे सततता की एक बेहतर छाप मिलती है। परिणामी आकृति एक दोहरी सीढ़ी की छाप देती है।

एक हिस्टोग्राम एक बार आरेख के समान दिखता है। लेकिन पहली नज़र में प्रतीत होने वाले समानताओं से अधिक अंतर होते हैं। बारों की दूरी, चौड़ाई या क्षेत्रफल सभी मनमाने होते हैं। यह बार की ऊँचाई है, न कि चौड़ाई या क्षेत्रफल, जो वास्तव में मायने रखती है। एक ही चौड़ाई की बार के समान उद्देश्य की पूर्ति एक एकल ऊर्ध्वाधर रेखा भी कर सकती है। इसके अतिरिक्त, हिस्टोग्राम में दो आयतों के बीच कोई स्थान नहीं छोड़ा जाता है, लेकिन बार आरेख में लगातार बारों के बीच कुछ स्थान अवश्य छोड़ना चाहिए (बहु-बार या घटक बार आरेख को छोड़कर)। यद्यपि बारों की समान चौड़ाई होती है, तुलना के उद्देश्य से बार की चौड़ाई महत्वहीन होती है। हिस्टोग्राम में चौड़ाई उतनी ही महत्वपूर्ण है जितनी इसकी ऊँचाई। हमारे पास विविक्त और सतत दोनों चरों के लिए बार आरेख हो सकता है, लेकिन हिस्टोग्राम केवल सतत चर के लिए ही बनाया जाता है। हिस्टोग्राम आवृत्ति बंटन के बहुलक का मान भी आलेखीय रूप से देता है जैसा कि चित्र 4.5 में दिखाया गया है और बिंदीदार ऊर्ध्वाधर रेखा का $\mathrm{x}$-निर्देशांक बहुलक देता है।

आवृत्ति बहुभुज

एक आवृत्ति बहुभुज एक समतल होता है जो सीधी रेखाओं से घिरा होता है, आमतौर पर चार या अधिक रेखाओं से। आवृत्ति बहुभुज हिस्टोग्राम का एक विकल्प है और यह स्वयं हिस्टोग्राम से ही व्युत्पन्न भी किया जाता है। एक आवृत्ति बहुभुज को किसी हिस्टोग्राम पर फिट किया जा सकता है ताकि वक्र के आकार का अध्ययन किया जा सके। आवृत्ति बहुभुज बनाने की सबसे सरल विधि यह है कि हिस्टोग्राम के लगातार आयतों के ऊपरी भाग के मध्य-बिंदुओं को मिलाया जाए। इससे हमारे पास दो सिरे आधार रेखा से दूर रह जाते हैं, जिससे वक्र के नीचे के क्षेत्रफल की गणना नहीं हो पाती। समाधान यह है कि इस प्रकार प्राप्त दोनों अंतिम बिंदुओं को वितरण के प्रत्येक सिरे पर तुरंत शून्य आवृत्ति वाली दो कक्षाओं के मध्य-मानों पर आधार रेखा से मिलाया जाए। टूटी हुई रेखाएँ या बिंदु इन दोनों सिरों को आधार रेखा से मिला सकते हैं। अब वक्र के नीचे का कुल क्षेत्रफल, हिस्टोग्राम के क्षेत्रफल की तरह, कुल आवृत्ति या नमूना आकार को दर्शाता है।

आकृति 4.5: एक कस्बे के क्षेत्र में 85 दैनिक वेतन भोगी मजदूरों के वितरण के लिए हिस्टोग्राम।

आवृत्ति बहुभुज समूहीकृत आवृत्ति बंटन को प्रस्तुत करने की सबसे सामान्य विधि है। $\mathrm{X}$-अक्ष पर वर्ग सीमाएँ और वर्ग-चिह्न दोनों ही प्रयुक्त किए जा सकते हैं, दो क्रमागत वर्ग-चिह्नों के बीच की दूरियाँ वर्ग अंतराल की चौड़ाई के अनुपातिक/बराबर होती हैं। यदि वर्ग-चिह्न ग्राफ पेपर की मोटी रेखाओं पर आ जाएँ तो आँकड़ों का आलेखन आसान हो जाता है। इससे कोई फर्क नहीं पड़ता कि $\mathrm{X}$-अक्ष पर वर्ग सीमाएँ या मध्य-बिंदु प्रयुक्त किए गए हैं, आवृत्तियाँ (कोटियों के रूप में) सदैव वर्ग अंतराल के मध्य-बिंदु के विरुद्ध आलेखित की जाती हैं। जब सभी बिंदु आलेख में आलेखित हो जाते हैं, तो उन्हें ध्यानपूर्वक छोटी-छोटी सीधी रेखाओं की श्रृंखला द्वारा जोड़ा जाता है। टूटी हुई रेखाएँ दो अंतरालों के मध्य-बिंदुओं को आरंभ में और अंत में, आलेखित वक्र के दोनों सिरों से जोड़ती हैं (चित्र 4.6)। जब एक ही अक्षों पर आलेखित दो या अधिक बंटनों की तुलना की जाती है, तो आवृत्ति बहुभुज अधिक उपयोगी हो सकता है क्योंकि दो या अधिक बंटनों की ऊर्ध्वाधर और क्षैतिज रेखाएँ हिस्टोग्राम में संपाती हो सकती हैं।

चित्र 4.6: तालिका 4.9 में दिए गए आँकड़ों के लिए आलेखित आवृत्ति बहुभुज

चित्र 4.7: तालिका 4.9 के लिए आवृत्ति वक्र

आवृत्ति वक्र

आवृत्ति वक्र प्राप्त किया जाता है आवृत्ति बहुभुज के बिंदुओं से यथासंभव निकट से गुजरने वाली एक सहज स्वतंत्र हाथ की वक्र खींचकर। यह आवश्यक नहीं कि यह आवृत्ति बहुभुज के सभी बिंदुओं से गुजरे, परंतु यह उनसे यथासंभव निकट से गुजरता है (चित्र 4.7)।

ओजाइव

ओजाइव को संचयी आवृत्ति वक्र भी कहा जाता है। चूँकि दो प्रकार की संचयी आवृत्तियाँ होती हैं, उदाहरण के लिए “से कम” प्रकार और “से अधिक” प्रकार, इसलिए किसी भी समूहबद्ध आवृत्ति बंटन आंकड़ों के लिए दो ओजाइव होते हैं। यहाँ आवृत्ति बहुभुज के मामले में सरल आवृत्तियों के स्थान पर, संचयी आवृत्तियाँ $y$-अक्ष के अनुदेश आवृत्ति बंटन की वर्ग सीमाओं के विरुद्ध आलेखित की जाती हैं। “से कम” ओजाइव के लिए संचयी आवृत्तियाँ वर्ग अंतरालों की संबंधित ऊपरी सीमाओं के विरुद्ध आलेखित की जाती हैं, जबकि “से अधिक” ओजाइवों के लिए संचयी आवृत्तियाँ वर्ग अंतरालों की संबंधित निचली सीमाओं के विरुद्ध आलेखित की जाती हैं। दोनों ओजाइवों की एक रोचक विशेषता यह है कि उनका प्रतिच्छेद बिंदु आवृत्ति बंटन की माध्यिका चित्र 4.8 (b) देता है। जैसा कि दोनों ओजाइवों के आकार सुझाते हैं, “से कम” ओजाइव कभी ह्रासमान नहीं होता और “से अधिक” ओजाइव कभी वर्धमान नहीं होता।

अंकगणितीय रेखा ग्राफ

एक अंकगणितीय रेखा ग्राफ को समय श्रेणी ग्राफ भी कहा जाता है। इस ग्राफ में समय (घंटा, दिन/तिथि, सप्ताह, माह, वर्ष आदि) को x-अक्ष पर और चर का मान (समय श्रेणी आंकड़े) को y-अक्ष पर प्लॉट किया जाता है। इन प्लॉट किए गए बिंदुओं को मिलाकर बनाई गई रेखा ग्राफ को अंकगणितीय रेखा ग्राफ (समय श्रेणी ग्राफ) कहा जाता है। यह दीर्घकालिक समय श्रेणी आंकड़ों में प्रवृत्ति, आवर्तिता आदि को समझने में सहायक होता है।

TABLE 4.10 गणित में प्राप्त अंकों की बारंबारता बंटन

Fig. 4.8(a): तालिका 4.10 में दिए गए आंकड़ों के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

Fig. 4.8(b): तालिका 4.10 में दिए गए आंकड़ों के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

यहाँ आप चित्र 4.9 से देख सकते हैं कि 1993-94 से 2013-14 की अवधि के दौरान पूरे समय आयात निर्यात से अधिक रहे। आप देख सकते हैं कि 2001-02 के बाद निर्यात और आयात दोनों के मान तेजी से बढ़ रहे हैं। साथ ही आयात और निर्यात के बीच का अंतर भी 2001-02 के बाद बढ़ गया है।

6. निष्कर्ष

अब तक आप यह सीख चुके होंगे कि डेटा को विभिन्न प्रस्तुति रूपों—पाठ्य, सारणीबद्ध और आरेखीय—का उपयोग करके कैसे प्रस्तुत किया जा सकता है। अब आप किसी दिए गए डेटा सेट के लिए डेटा प्रस्तुति के उपयुक्त रूप के साथ-साथ प्रयुक्त होने वाले आरेख के प्रकार का भी उचित चयन करने में सक्षम हैं। इस प्रकार आप डेटा की प्रस्तुति को अर्थपूर्ण, व्यापक और उद्देश्यपूर्ण बना सकते हैं।

TABLE 4.11 भारत के निर्यात और आयात का मूल्य (100 करोड़ रुपये में)

वर्ष निर्यात आयात
1993-94 698 731
1994-95 827 900
1995-96 1064 1227
1996-97 1188 1389
1997-98 1301 1542
1998-99 1398 1783
1999-2000 1591 2155
2000-01 2036 2309
2001-02 2090 2452
2002-03 2549 2964
2003-04 2934 3591
2004-05 3753 5011
2005-06 4564 6604
2006-07 5718 8815
2007-08 6559 10123
2008-09 8408 13744
2009-10 8455 13637
2010-11 11370 16835
2011-12 14660 23455
2012-13 16343 26692
2013-14 19050 27154

स्रोत: DGCI&S, कोलकाता

Fig. 4.9: सारणी 4.11 में दिए गए समय श्रेणी डेटा के लिए अंकगणितीय रेखा ग्राफ

सारांश

  • आँकड़े (चाहे कितने भी विशाल हों) प्रस्तुति के माध्यम से अर्थपूर्ण रूप से बोलते हैं।
  • छोटे आँकड़ों (मात्रा) के लिए पाठात्मक प्रस्तुति उद्देश्य को बेहतर ढंग से सेवा देती है।
  • बड़ी मात्रा के आँकड़ों के लिए सारणीबद्ध प्रस्तुति एक या अधिक चरों के लिए किसी भी मात्रा के आँकड़ों को समायोजित करने में सहायक होती है।
  • सारणीबद्ध आँकड़ों को आरेखों के माध्यम से प्रस्तुत किया जा सकता है जो अन्यथा प्रस्तुत तथ्यों की तेज़ समझ को सक्षम बनाते हैं।

अभ्यास

निम्नलिखित प्रश्नों 1 से 10 तक का उत्तर सही विकल्प चुनकर दीजिए

1. दंड आरेख एक है

(i) एक-आयामी आरेख

(ii) दो-आयामी आरेख

(iii) बिना आयाम का आरेख

(iv) उपर्युक्त में से कोई नहीं

2. हिस्टोग्राम के माध्यम से निरूपित आँकड़े आलेखीय रूप से ज्ञात करने में सहायक हो सकते हैं

(i) माध्य

(ii) बहुलक

(iii) माध्यिका

(iv) उपर्युक्त सभी

3. ओजाइव आलेखीय रूप से ज्ञात करने में सहायक हो सकते हैं

(i) बहुलक

(ii) माध्य

(iii) माध्यिका

(iv) उपर्युक्त में से कोई नहीं

4. अंकगणितीय रेखा आरेख के माध्यम से निरूपित आँकड़े समझने में सहायक होते हैं

(i) दीर्घकालिक प्रवृत्ति

(ii) आँकड़ों में चक्रीयता

(iii) आँकड़ों में मौसमीता

(iv) उपर्युक्त सभी

5. दंड आरेख में दंडों की चौड़ाई समान होना आवश्यक नहीं है (सत्य/असत्य)।

6. हिस्टोग्राम में आयतों की चौड़ाई अनिवार्यतः समान होनी चाहिए (सत्य/असत्य)।

7. हिस्टोग्राम केवल सतत वर्गीकरण वाले आँकड़ों से ही बनाया जा सकता है (सत्य/असत्य)।

8. हिस्टोग्राम और स्तंभ आरेख आँकड़ों की प्रस्तुति की एक ही विधि हैं। (सत्य/असत्य)

9. आवृत्ति बंटन का बहुलक हिस्टोग्राम की सहायता से आलेखीय रूप से जाना जा सकता है। (सत्य/असत्य)

10. आवृत्ति बंटन की माध्यिका ogives से ज्ञात नहीं की जा सकती। (सत्य/असत्य)

11. निम्न को दर्शाने के लिए किस प्रकार के आरेख अधिक प्रभावी हैं?

(i) वर्ष में मासिक वर्षा

(ii) धर्म के आधार पर दिल्ली की जनसंख्या की संरचना

(iii) एक कारखाने में लागत के घटक

12. मान लीजिए आप भारत में शहरी गैर-कार्यकर्ताओं के हिस्से में वृद्धि और नगरीकरण के निम्न स्तर को उदाहरण 4.2 में दिखाए गए अनुसार जोर देना चाहते हैं। आप इसे सारणीबद्ध रूप में कैसे करेंगे?

13. जब आवृत्ति सारणी में वर्ग अंतराल असमान होते हैं तब आयत चित्र बनाने की प्रक्रिया समान वर्ग अंतराल की तुलना में किस प्रकार भिन्न होती है?

14. इंडियन शुगर मिल्स एसोसिएशन ने रिपोर्ट किया कि, ‘दिसंबर 2001 के पहले पखवाड़े में चीनी उत्पादन लगभग 3,87,000 टन था, जबकि पिछले वर्ष (2000) के इसी पखवाड़े में यह 3,78,000 टन था। दिसंबर 2001 के पहले पखवाड़े में कारखानों से चीनी की बिक्री आंतरिक उपभोग के लिए 2,83,000 टन और निर्यात के लिए 41,000 टन थी, जबकि पिछले सीजन के इसी पखवाड़े में आंतरिक उपभोग के लिए 1,54,000 टन और निर्यात के लिए शून्य थी।’

(i) आंकड़ों को सारणीबद्ध रूप में प्रस्तुत करें।

(ii) मान लीजिए आपको इन आंकड़ों को आरेखीय रूप में प्रस्तुत करना हो तो आप किस आरेख का प्रयोग करेंगे और क्यों?

(iii) इन आंकड़ों को आरेखीय रूप में प्रस्तुत करें।

15. निम्न सारणी GDP के कारक लागत पर अनुमानित क्षेत्रीय वास्तविक वृद्धि दरों (पिछले वर्ष की तुलना में प्रतिशत परिवर्तन) को दर्शाती है।

वर्ष कृषि और संबद्ध क्षेत्र उद्योग सेवाएं
1994-95 5.0 9.2 7.0
1995-96 -0.9 11.8 10.3
1996-97 9.6 6.0 7.1
1997-98 -1.9 5.9 9.0
1998-99 7.2 4.0 8.3
1999-2000 0.8 6.9 8.2

इस डेटा को कई समय श्रृंखला ग्राफ़ के रूप में प्रस्तुत करें।