अध्याय 02 डेटा का संग्रह
1. परिचय
पिछले अध्याय में आपने पढ़ा कि अर्थशास्त्र क्या है। आपने अर्थशास्त्र में सांख्यिकी की भूमिका और महत्व के बारे में भी अध्ययन किया। इस अध्याय में आप डेटा के स्रोतों और डेटा संग्रह की विधि का अध्ययन करेंगे। डेटा संग्रह का उद्देश्य किसी समस्या के समाधान तक पहुँचने के लिए प्रमाण प्रस्तुत करना है।
अर्थशास्त्र में आप अक्सर इस प्रकार के कथन से सामना करते हैं,
“कई उतार-चढ़ावों के बाद खाद्यान्न का उत्पादन 1970-71 में 108 मिलियन टन से बढ़कर 1978-79 में 132 मिलियन टन हो गया, लेकिन 1979-80 में फिर घटकर 108 मिलियन टन हो गया। इसके बाद खाद्यान्न का उत्पादन लगातार बढ़ता रहा और 2015-16 में 252 मिलियन टन तथा 2016-17 में 272 मिलियन टन तक पहुँच गया।”
इस कथन में आप देख सकते हैं कि विभिन्न वर्षों में खाद्यान्न का उत्पादन समान नहीं रहता है। यह वर्ष दर वर्ष और फसल दर फसल बदलता रहता है। चूँकि ये मान बदलते रहते हैं, इन्हें चर कहा जाता है। चरों को आमतौर पर अक्षरों $\mathrm{X},\mathrm{Y}$ या $\mathrm{Z}$ द्वारा दर्शाया जाता है। किसी चर का प्रत्येक मान एक प्रेक्षण होता है। उदाहरण के लिए, भारत में खाद्यान्न का उत्पादन निम्न तालिका में दिखाए अनुसार 1970-71 में 108 मिलियन टन से लेकर 2016-17 में 272 मिलियन टन तक बदलता रहा है। वर्षों को चर $X$ और भारत में खाद्यान्न का उत्पादन (मिलियन टन में) को चर $Y$ द्वारा दर्शाया गया है।
तालिका 2.1 भारत में खाद्यान्न का उत्पादन (मिलियन टन)
| X | Y |
|---|---|
| 1970-71 | 108 |
| 1978-79 | 132 |
| 1990-91 | 176 |
| 1997-98 | 194 |
| 2001-02 | 212 |
| 2015-16 | 252 |
| 2016-17 | 272 |
यहाँ इन चरों $X$ और $Y$ के मान ‘डेटा’ हैं, जिनसे हम भारत में खाद्यान्न के उत्पादन के बारे में जानकारी प्राप्त कर सकते हैं। खाद्यान्न उत्पादन में उतार-चढ़ाव को जानने के लिए हमें विभिन्न वर्षों के लिए भारत में खाद्यान्न उत्पादन का ‘डेटा’ चाहिए। ‘डेटा’ एक उपकरण है, जो जानकारी प्रदान करके समस्याओं को समझने में मदद करता है।
आप सोच रहे होंगे कि ‘डेटा’ आता कहाँ से है और हम इन्हें कैसे एकत्र करते हैं? निम्नलिखित खंडों में हम डेटा के प्रकार, डेटा संग्रह की विधि और उपकरणों तथा डेटा प्राप्त करने के स्रोतों पर चर्चा करेंगे।
2. डेटा के स्रोत क्या हैं?
सांख्यिकीय डेटा दो स्रोतों से प्राप्त किया जा सकता है। शोधकर्ता किसी पूछताछ आयोजित करके डेटा एकत्र कर सकता है। ऐसे डेटा को प्राथमिक डेटा कहा जाता है, क्योंकि ये प्रथम-पक्ष की जानकारी पर आधारित होते हैं। मान लीजिए आप किसी फिल्म स्टार की स्कूली छात्रों में लोकप्रियता के बारे में जानना चाहते हैं। इसके लिए आपको बड़ी संख्या में स्कूली छात्रों से पूछताछ करनी होगी, उनसे प्रश्न पूछकर वांछित जानकारी एकत्र करनी होगी। आपको जो डेटा मिलता है, वह प्राथमिक डेटा का एक उदाहरण है।
यदि डेटा किसी अन्य एजेंसी द्वारा एकत्रित और संसाधित (जांचे और सारणीबद्ध) किए गए हैं, तो उन्हें द्वितीयक डेटा कहा जाता है। इन्हें या तो प्रकाशित स्रोतों जैसे सरकारी रिपोर्टों, दस्तावेजों, समाचार पत्रों, अर्थशास्त्रियों द्वारा लिखी गई पुस्तकों से प्राप्त किया जा सकता है या किसी अन्य स्रोत से, उदाहरण के लिए, एक वेबसाइट से। इस प्रकार, डेटा उस स्रोत के लिए प्राथमिक होते हैं जो उन्हें पहली बार एकत्रित और संसाधित करता है और द्वितीयक उन सभी स्रोतों के लिए होते हैं जो बाद में ऐसे डेटा का उपयोग करते हैं। द्वितीयक डेटा के उपयोग से समय और लागत की बचत होती है। उदाहरण के लिए, फिल्म स्टार की छात्रों के बीच लोकप्रियता पर डेटा एकत्र करने के बाद, आप एक रिपोर्ट प्रकाशित करते हैं। यदि कोई आपके द्वारा एकत्र किए गए डेटा का उपयोग किसी समान अध्ययन के लिए करता है, तो वह द्वितीयक डेटा बन जाता है।
3. हम डेटा कैसे एकत्र करते हैं?
क्या आप जानते हैं कि कोई निर्माता किसी उत्पाद के बारे में कैसे निर्णय लेता है या कोई राजनीतिक दल उम्मीदवार के बारे में कैसे निर्णय लेता है? वे एक बड़े समूह से किसी विशेष उत्पाद या उम्मीदवार के बारे में प्रश्न पूछकर सर्वेक्षण करते हैं। सर्वेक्षणों का उद्देश्य कुछ विशेषताओं का वर्णन करना होता है जैसे मूल्य, गुणवत्ता, उपयोगिता (उत्पाद के मामले में) और लोकप्रियता, ईमानदारी, निष्ठा (उम्मीदवार के मामले में)। सर्वेक्षण का उद्देश्य डेटा एकत्र करना है। सर्वेक्षण व्यक्तियों से जानकारी एकत्र करने की एक विधि है।
उपकरण की तैयारी
सर्वेक्षणों में प्रयोग किए जाने वाला सबसे सामान्य प्रकार का साधन प्रश्नावली/साक्षात्कार अनुसूची है। प्रश्नावली या तो उत्तरदाता द्वारा स्वयं भरी जाती है या शोधकर्ता (गणक) या प्रशिक्षित अन्वेषक द्वारा भरी जाती है। प्रश्नावली/साक्षात्कार अनुसूची तैयार करते समय आपको निम्नलिखित बातों को ध्यान में रखना चाहिए;
- प्रश्नावली अत्यधिक लंबी नहीं होनी चाहिए। प्रश्नों की संख्या यथासंभव न्यूनतम होनी चाहिए।
प्रश्नावली समझने में आसान होनी चाहिए और अस्पष्ट या कठिन शब्दों से बचना चाहिए।
- प्रश्नों को इस प्रकार क्रमबद्ध किया जाना चाहिए कि उत्तर देने वाला व्यक्ति सहज महसूस करे।
- प्रश्नों की श्रृंखला सामान्य से विशिष्ट की ओर बढ़नी चाहिए। प्रश्नावली सामान्य प्रश्नों से शुरू होकर अधिक विशिष्ट प्रश्नों की ओर आगे बढ़नी चाहिए। उदाहरण के लिए:
खराब $Q$
(i) बिजली शुल्क में वृद्धि उचित है?
(ii) क्या आपके क्षेत्र में बिजली आपूर्ति नियमित है?
अच्छा $Q$
(i) क्या आपके क्षेत्र में बिजली आपूर्ति नियमित है?
(ii) बिजली शुल्क में वृद्धि उचित है?
- प्रश्न सटीक और स्पष्ट होने चाहिए। उदाहरण के लिए,
खराब $Q$
आप अपनी आय का कितना प्रतिशत भाग प्रस्तुत करने योग्य दिखने के लिए कपड़ों पर खर्च करते हैं?
अच्छा $Q$
आप अपनी आय का कितना प्रतिशत भाग कपड़ों पर खर्च करते हैं?
- प्रश्न अस्पष्ट नहीं होने चाहिए। उन्हें उत्तरदाताओं को तेजी से, सही और स्पष्ट रूप से उत्तर देने में सक्षम बनाना चाहिए। उदाहरण के लिए:
खराब $Q$
क्या आप एक महीने में किताबों पर बहुत सारा पैसा खर्च करते हैं?
अच्छा $Q$
(उचित विकल्प पर टिक करें)
आप महीने में कितना खर्च करते हैं किताबों पर?
(i) ₹200 से कम
(ii) ₹200-300
(iii) ₹300-400
(iv) ₹400 से अधिक
- प्रश्न में दोहले नकारात्मक शब्दों का प्रयोग नहीं होना चाहिए। “क्या आप नहीं सोचते…” या “क्या आप नहीं…” से शुरू होने वाले प्रश्नों से बचना चाहिए, क्योंकि ये पूर्वाग्रहित उत्तर देने की ओर ले जा सकते हैं। उदाहरण:
खराब $Q$
क्या आप नहीं सोचते कि धूम्रपान पर प्रतिबंध होना चाहिए?
अच्छा $Q$
क्या आप सोचते हैं कि धूम्रपान पर प्रतिबंध होना चाहिए?
- प्रश्न अग्रदूत (leading) नहीं होना चाहिए, जो उत्तरदाता को यह संकेत दे कि उसे कैसे उत्तर देना है। उदाहरण:
खराब $Q$
आपको इस उच्च गुणवत्ता वाली चाय का स्वाद कैसा लगा?
अच्छा $Q$
आपको इस चाय का स्वाद कैसा लगा?
- प्रश्न में उत्तर के विकल्पों का संकेत नहीं होना चाहिए। उदाहरण:
खराब $Q$
कॉलेज के बाद आप नौकरी करना चाहेंगी या गृहिणी बनना?
अच्छा $Q$
कॉलेज के बाद आप क्या करना चाहेंगी?
प्रश्नावली बंद-समाप्त (या संरचित) प्रश्नों या खुले-समाप्त (या असंरचित) प्रश्नों से बनी हो सकती है। उपरोक्त प्रश्न, जिसमें पूछा गया है कि विद्यार्थी कॉलेज के बाद क्या करना चाहता है, एक खुला-समाप्त प्रश्न है।
बंद-समाप्त या संरचित प्रश्न या तो दो-मार्गी प्रश्न हो सकते हैं या बहुविकल्पी प्रश्न। जब केवल दो संभावित उत्तर हों, ‘हाँ’ या ‘नहीं’, तो उसे दो-मार्गी प्रश्न कहा जाता है।
जब दो से अधिक उत्तर विकल्प हों, तो बहुविकल्पी प्रश्न अधिक उपयुक्त होते हैं। उदाहरण,
प्र. आपने अपनी ज़मीन क्यों बेची?
(i) कर्ज़ चुकाने के लिए।
(ii) बच्चों की शिक्षा के लिए।
(iii) किसी अन्य संपत्ति में निवेश करना।
(iv) कोई अन्य (कृपया निर्दिष्ट करें)।
बंद प्रश्नों का उपयोग करना, अंक देना और विश्लेषण के लिए कोडित करना आसान होता है, क्योंकि सभी उत्तरदाता दिए गए विकल्पों में से चयन कर सकते हैं। लेकिन इन्हें लिखना कठिन होता है क्योंकि विकल्पों को स्पष्ट रूप से लिखा जाना चाहिए ताकि वे मुद्दे के दोनों पक्षों को दर्शा सकें। इसके अतिरिक्त, यह भी संभावना होती है कि किसी व्यक्ति की वास्तविक प्रतिक्रिया दिए गए विकल्पों में मौजूद न हो। इसके लिए ‘कोई अन्य’ का विकल्प दिया जाता है, जहाँ उत्तरदाता वह प्रतिक्रिया लिख सकता है जिसकी अनुसंधानकर्ता ने कल्पना नहीं की थी। इसके अतिरिक्त, बहुविकल्पी प्रश्नों की एक और सीमितता यह है कि ये विकल्प प्रदान करके उत्तरों को सीमित कर देते हैं, जिनके बिना उत्तरदाता कुछ और उत्तर दे सकते थे।
खुले प्रश्न अधिक व्यक्तिगत उत्तरों की अनुमति देते हैं, लेकिन इनकी व्याख्या करना कठिन होता है और इन्हें अंक देना भी कठिन होता है, क्योंकि उत्तरों में बहुत विविधता होती है। उदाहरण,
प्र. वैश्वीकरण के बारे में आपका क्या दृष्टिकोण है?
डेटा संग्रह की विधि
क्या आपने कभी कोई टेलीविज़न शो देखा है जिसमें रिपोर्टर बच्चों, गृहिणियों या आम जनता से उनकी परीक्षा प्रदर्शन या साबुन की किसी ब्रांड या किसी राजनीतिक दल के बारे में प्रश्न पूछते हैं? प्रश्न पूछने का उद्देश्य सर्वेक्षण करके डेटा एकत्र करना होता है। डेटा एकत्र करने के तीन मूलभूत तरीके हैं: (i) व्यक्तिगत साक्षात्कार, (ii) मेल (प्रश्नावली) सर्वेक्षण, और (iii) टेलीफोन साक्षात्कार।
व्यक्तिगत साक्षात्कार
इस विधि का प्रयोग तब किया जाता है जब शोधकर्ता को सभी सदस्यों तक पहुँच होती है। शोधकर्ता (या अन्वेषक) उत्तरदाताओं के सान सामने साक्षात्कार करता है।
व्यक्तिगत साक्षात्कार विभिन्न कारणों से पसंद किए जाते हैं। उत्तरदाता और साक्षात्कारकर्ता के बीच व्यक्तिगत संपर्क स्थापित होता है। साक्षात्कारकर्ता को अध्ययन की व्याख्या करने और उत्तरदाताओं के प्रश्नों के उत्तर देने का अवसर मिलता है। साक्षात्कारकर्ता उत्तरदाता से विशेष रूप से महत्वपूर्ण उत्तरों का विस्तार करने का अनुरोध कर सकता है। गलत व्याख्या और गलतफहमी से बचा जा सकता है। उत्तरदाताओं की प्रतिक्रियाओं को देखकर अतिरिक्त जानकारी प्राप्त की जा सकती है।
व्यक्तिगत साक्षात्कार के कुछ दोष भी हैं। यह महंगा होता है, क्योंकि इसके लिए प्रशिक्षित साक्षात्कारकर्ताओं की आवश्यकता होती है। सर्वेक्षण को पूरा होने में अधिक समय लगता है। शोधकर्ता की उपस्थिति उत्तरदाताओं को वह कहने से रोक सकती है जो वे वास्तव में सोचते हैं।
मेल द्वारा प्रश्नावली
जब किसी सर्वेक्षण में डेटा डाक द्वारा एकत्र किया जाता है, तो प्रत्येक व्यक्ति को एक प्रश्नावली डाक द्वारा भेजी जाती है और एक निश्चित तिथि तक उसे भरकर वापस भेजने का अनुरोध किया जाता है। इस विधि के लाभ यह हैं कि यह कम खर्चीली होती है। यह शोधकर्ता को दूर-दराज के क्षेत्रों में रहने वाले लोगों तक भी पहुंचने की अनुमति देती है, जिन तक व्यक्तिगत रूप से या टेलीफोन द्वारा पहुंचना कठिन हो सकता है। यह साक्षात्कारकर्ता द्वारा उत्तरदाताओं को प्रभावित करने की अनुमति नहीं देता। यह उत्तरदाताओं को प्रश्नों के विचारपूर्ण उत्तर देने के लिए पर्याप्त समय लेने की भी अनुमति देता है।
इन दिनों ऑनलाइन सर्वेक्षण या लघु संदेश सेवा, अर्थात् SMS के माध्यम से सर्वेक्षण लोकप्रिय हैं। क्या आप जानते हैं कि ऑनलाइन सर्वेक्षण कैसे आयोजित किया जाता है?
डाक सर्वेक्षण के नुकसान यह हैं कि निर्देशों को स्पष्ट करने में सहायता प्रदान करने के कम अवसर होते हैं, इसलिए प्रश्नों को गलत समझने की संभावना रहती है। डाक द्वारा सर्वेक्षण करने पर कुछ कारकों के कारण कम प्रतिक्रिया दर प्राप्त होने की भी संभावना रहती है, जैसे कि प्रश्नावली को बिना भरे हुए वापस भेजना, प्रश्नावली को बिल्कुल भी वापस न भेजना, डाक में ही प्रश्नावली के खो जाने आदि।
टेलीफोन साक्षात्कार
टेलीफोन साक्षात्कार में, जांचकर्ता टेलीफोन पर प्रश्न पूछता है। टेलीफोन साक्षात्कारों के लाभ यह हैं कि ये व्यक्तिगत साक्षात्कारों की तुलना में सस्ते होते हैं और कम समय में आयोजित किए जा सकते हैं। ये शोधकर्ता को प्रश्नों को स्पष्ट करके उत्तरदाता की सहायता करने की अनुमति देते हैं। टेलीफोनिक साक्षात्कार उन मामलों में बेहतर होता है जहां उत्तरदाता व्यक्तिगत साक्षात्कारों में कुछ प्रश्नों का उत्तर देने में अनिच्छुक होते हैं।
इस विधि का नुकसान लोगों तक पहुंच है, क्योंकि कई लोगों के पास टेलीफोन नहीं हो सकते हैं।
पायलट सर्वे
एक बार जब प्रश्नावली तैयार हो जाती है, तो एक छोटे समूह के साथ इसका परीक्षण करना उचित होता है, जिसे पायलट सर्वे या प्रश्नावली की पूर्व-परीक्षण कहा जाता है। पायलट सर्वे सर्वे के बारे में प्रारंभिक विचार प्रदान करने में मदद करता है। यह प्रश्नावली की पूर्व-परीक्षण में मदद करता है, ताकि प्रश्नों की कमियों और खामियों को जाना जा सके। पायलट सर्वे प्रश्नों की उपयुक्तता, निर्देशों की स्पष्टता, गणनाकर्ताओं के प्रदर्शन और वास्तविक सर्वे में लगने वाले खर्च और समय का आकलन करने में भी मदद करता है।
गतिविधियाँ
- आपको एक ऐसे व्यक्ति से जानकारी एकत्र करनी है, जो भारत के एक दूरदराज के गाँव में रहता है। डेटा संग्रह का कौन सा तरीया उपयुक्त होगा और क्यों? चर्चा करें।
- आपको स्कूल में शिक्षण की गुणवत्ता के बारे में अभिभावकों का साक्षात्कार करना है। यदि स्कूल का प्रधानाचार्य वहाँ मौजूद है, तो किस प्रकार की समस्याएँ उत्पन्न हो सकती हैं?
4. जनगणना और प्रतिदर्श सर्वेक्षण
जनगणना या पूर्ण गणना
एक सर्वेक्षण, जिसमें जनसंख्या के प्रत्येक तत्व को शामिल किया जाता है, को जनगणना या पूर्ण गणना विधि के रूप में जाना जाता है। यदि कुछ एजेंसियां भारत में कुल जनसंख्या का अध्ययन करने में रुचि रखती हैं, तो उन्हें ग्रामीण और शहरी भारत के सभी घरों से जानकारी प्राप्त करनी होगी। यह हर दस वर्ष में किया जाता है। भारत के सभी घरों को कवर करते हुए घर-घर जाकर पूछताछ की जाती है। जन्म और मृत्यु दर, साक्षरता, रोजगार, जीवन प्रत्याशा, जनसंख्या का आकार और संरचना आदि पर जनसांख्यिकीय आंकड़े भारत के रजिस्ट्रार जनरल द्वारा एकत्र किए जाते हैं और प्रकाशित किए जाते हैं। भारत की अंतिम जनगणना 2011 में आयोजित की गई थी।
जनगणना 2011 के अनुसार, भारत की जनसंख्या 121.09 करोड़ थी, जो 2001 में 102.87 करोड़ थी। जनगणना 1901 से संकेत मिलता है कि देश की जनसंख्या 23.83 करोड़ थी। तब से, 110 वर्षों की अवधि में, देश की जनसंख्या में 97 करोड़ से अधिक की वृद्धि हुई है। जनसंख्या की औसत वार्षिक वृद्धि दर, जो 1971-81 के दशक में प्रति वर्ष 2.2 प्रतिशत थी, 1991-2001 में घटकर 1.97 प्रतिशत और 2001-2011 के दौरान 1.64 प्रतिशत हो गई।
जनसंख्या और नमूना
सांख्यिकी में जनसंख्या या ब्रह्मांड का अर्थ उन वस्तुओं की कुलता है जिनका अध्ययन किया जा रहा है। इस प्रकार, जनसंख्या या ब्रह्मांड वह समूह है जिस पर अध्ययन के परिणाम लागू होने का इरादा होता है। एक जनसंख्या हमेशा वे सभी व्यक्ति/वस्तुएँ होती हैं जो किसी निश्चित विशेषता (या विशेषताओं के समूह) को रखते हैं, सर्वेक्षण के उद्देश्य के अनुसार। नमूना चुनने में पहला कार्य जनसंख्या की पहचान करना होता है। एक बार जनसंख्या की पहचान हो जाने पर, शोधकर्ता उसका अध्ययन करने की विधि चुनता है। यदि शोधकर्ता पाता है कि पूरी जनसंख्या का सर्वेक्षण संभव नहीं है, तो वह एक प्रतिनिधि नमूना चुनने का निर्णय ले सकता है। नमूना उस समूह या खंड को संदर्भित करता है जो जनसंख्या से है और जिससे सूचना प्राप्त की जानी है। एक अच्छा नमूना (प्रतिनिधि नमूना) आमतौर पर जनसंख्या से छोटा होता है और यह जनसंख्या के बारे में उचित रूप से सटीक सूचना काफी कम लागत और कम समय में देने में सक्षम होता है।
मान लीजिए आप किसी निश्चित क्षेत्र के लोगों की औसत आय का अध्ययन करना चाहते हैं। जनगणना विधि के अनुसार, आपको उस क्षेत्र के प्रत्येक व्यक्ति की आय ज्ञात करनी होगी, उन्हें जोड़ना होगा और व्यक्तियों की संख्या से विभाजित करना होगा ताकि उस क्षेत्र के लोगों की औसत आय प्राप्त हो सके। इस विधि में भारी खर्च की आवश्यकता होगी, क्योंकि बड़ी संख्या में गणनाकर्ताओं को नियोजित करना पड़ता है। वैकल्पिक रूप से, आप उस क्षेत्र से कुछ व्यक्तियों का एक प्रतिनिधि नमूना चुनते हैं और उनकी आय ज्ञात करते हैं। चयनित व्यक्तियों के समूह की औसत आय को पूरे क्षेत्र के व्यक्तियों की औसत आय के अनुमान के रूप में प्रयोग किया जाता है।
उदाहरण
- अनुसंधान समस्या; मणिपुर के चुराचांदपुर जिले के कृषि श्रमिकों की आर्थिक स्थिति का अध्ययन करना।
- जनसंख्या; चुराचांदपुर जिले के सभी कृषि श्रमिक।
- नमूना; चुराचांदपुर जिले के कृषि श्रमिकों का दस प्रतिशत।
अधिकांश सर्वेक्षण नमूना सर्वेक्षण होते हैं। ये सांख्यिकी में कई कारणों से पसंद किए जाते हैं। एक नमूना कम लागत और कम समय में उचित रूप से विश्वसनीय और सटीक जानकारी प्रदान कर सकता है। चूंकि नमूने जनसंख्या से छोटे होते हैं, इसलिए गहन पूछताछ करके अधिक विस्तृत जानकारी एकत्र की जा सकती है। चूंकि हमें गणनाकर्ताओं की छोटी टीम की आवश्यकता होती है, इसलिए उन्हें प्रशिक्षित करना और उनके कार्य पर अधिक प्रभावी ढंग से निगरानी रखना आसान होता है। अब प्रश्न यह है कि आप नमूना कैसे लेते हैं? नमूनों के दो मुख्य प्रकार होते हैं, यादृच्छिक और अयादृच्छिक।
गतिविधियाँ
- भारत और चीन में अगली जनगणना किन-किन वर्षों में होगी?
- यदि आपको कक्षा XI की नई अर्थशास्त्र की पाठ्यपुस्तक के बारे में विद्यार्थियों की राय जाननी हो, तो आपकी जनसंख्या और नमूना क्या होंगे?
- यदि कोई शोधकर्ता पंजाब में गेहूँ की औसत पैदावार का अनुमान लगाना चाहता है, तो उसकी जनसंख्या और नमूना क्या होंगे?
निम्न विवरण इनके अंतर को स्पष्ट करेगा।
यादृच्छिक प्रतिदर्शन
जैसा नाम से स्पष्ट है, यादृच्छिक प्रतिदर्शन वह विधि है जिसमें जनसंख्या से व्यक्तिगत इकाइयों (प्रतिदर्शों) का चयन यादृच्छिक रूप से किया जाता है। सरकार किसी विशेष क्षेत्र में पेट्रोल की कीमतों में वृद्धि के घरेलू बजट पर प्रभाव को जानना चाहती है। इसके लिए 30 घरों का एक प्रतिनिधि (यादृच्छिक) प्रतिदर्श लेकर अध्ययन करना होगा। उस क्षेत्र के सभी 300 घरों के नाम कागज़ पर लिखकर मिला दिए जाते हैं, फिर एक-एक कर 30 नाम चुने जाते हैं जिनसे साक्षात्कार लिया जाएगा।
यादृच्छिक प्रतिदर्शन में प्रत्येक व्यक्ति के चुने जाने की समान संभावना होती है। उपरोक्त उदाहरण में, जनसंख्या की सभी 300 प्रतिदर्श इकाइयों (जिन्हें प्रतिदर्श फ्रेम भी कहा जाता है) को 30 इकाइयों के प्रतिदर्श में शामिल होने की समान संभावना मिली और इस प्रकार चुना गया प्रतिदर्श एक यादृच्छिक प्रतिदर्श है। इसे लॉटरी विधि भी कहा जाता है। आजकल यादृच्छिक प्रतिदर्श चुनने के लिए कंप्यूटर कार्यक्रमों का उपयोग किया जाता है।
एग्ज़िट पोल्स
आपने देखा होगा कि जब कोई चुनाव होता है, तो टेलीविज़न नेटवर्क चुनाव कवरेज प्रदान करते हैं। वे परिणामों की भविष्यवाणी करने की भी कोशिश करते हैं। यह एग्ज़िट पोल्स के माध्यम से किया जाता है, जिसमें मतदान केंद्र से बाहर निकलने वाले मतदाताओं के एक यादृच्छिक नमूने से पूछा जाता है कि उन्होंने किसे वोट दिया है। मतदाताओं के इस नमूने के आंकड़ों से भविष्यवाणी की जाती है। आपने देखा होगा कि एग्ज़िट पोल्स हमेशा सही भविष्यवाणी नहीं करते। क्यों?
गतिविधि
- आपको पिछले पचास वर्षों में भारत में अनाज उत्पादन के रुझान का विश्लेषण करना है। चूंकि सभी वर्षों के लिए आंकड़े इकट्ठा करना कठिन है, आपसे दस वर्षों के उत्पादन का एक नमूना चुनने को कहा गया है।
रैंडम नंबर टेबल्स का उपयोग करके आप अपने नमूने के वर्षों का चयन कैसे करेंगे?
गैर-यादृच्छिक नमूना चयन
ऐसी स्थिति हो सकती है कि आपको किसी क्षेत्र में 100 घरों में से 10 घरों का चयन करना है। आपको यह तय करना है कि किस घर को चुना जाए और किसे छोड़ा जाए। आप सुविधाजनक रूप से स्थित घरों या उन घरों का चयन कर सकते हैं जो आपको या आपके मित्र को ज्ञात हैं। इस स्थिति में, आप 10 घरों के चयन में अपने विवेक (पूर्वाग्रह) का उपयोग कर रहे हैं। 100 में से 10 घरों का यह चयन यादृच्छिक चयन नहीं है। गैर-यादृच्छिक नमूना चयन विधि में जनसंख्या की सभी इकाइयों के चयनित होने की समान संभावना नहीं होती है और अन्वेषक की सुविधा या विवेक नमूने के चयन में महत्वपूर्ण भूमिका निभाता है। ये मुख्य रूप से विवेक, उद्देश्य, सुविधा या कोटे के आधार पर चुने जाते हैं और गैर-यादृच्छिक नमूने होते हैं।
5. नमूने और गैर-नमूने की त्रुटियाँ
नमूने की त्रुटियाँ
संख्यात्मक मानों वाली जनसंख्या के दो महत्वपूर्ण लक्षण होते हैं जो यहाँ प्रासंगिक हैं। पहला, केंद्रीय प्रवृत्ति जिसे माध्य, माध्यिका या बहुलक से मापा जा सकता है। दूसरा, विचरण, जिसे “मानक विचलन”, “माध्य विचलन”, “परास” आदि की गणना करके मापा जा सकता है।
नमूने का उद्देश्य जनसंख्या के प्राचलों का एक या अधिक अनुमान प्राप्त करना है। नमूने की त्रुटि से तात्पर्य नमूना अनुमान और संबंधित जनसंख्या प्राचल (उदाहरण के लिए औसत आय आदि जनसंख्या के लक्षण का वास्तविक मान) के बीच के अंतर से है। इस प्रकार, जनसंख्या के किसी प्राचल के वास्तविक मान और उसके अनुमान (नमूने से) के बीच का अंतर नमूने की त्रुटि है। बड़ा नमूना लेकर नमूने की त्रुटि की मात्रा को कम किया जा सकता है।
उदाहरण
मान लीजिए मणिपुर के 5 किसानों की आय का मामला है। चर $\mathrm{x}$ (किसानों की आय) के मान 500, 550, $600,650,700$ हैं। हम देखते हैं कि $(500 +550 +600 +650 +700)$ $\div 5 =3000 \div 5 =600$ जनसंख्या औसत है।
अब मान लीजिए हम दो व्यक्तियों का नमूना चुनते हैं जहाँ $x$ के मान 500 और 600 हैं। नमूना औसत $(500 +600)\div 2$ $=1100 \div 2 =550$ है।
यहाँ अनुमान की नमूने की त्रुटि $=600$ (सत्य मान) -550 (अनुमान) $=50$ है।
गैर-नमूने की त्रुटियाँ
गैर-नमूनी त्रुटियाँ नमूनी त्रुटियों से अधिक गंभीर होती हैं क्योंकि नमूनी त्रुटि को बड़ा नमूना लेकर कम किया जा सकता है। गैर-नमूनी त्रुटि को कम करना कठिन होता है, यहाँ तक कि बड़ा नमूना लेने पर भी। एक जनगणना भी गैर-नमूनी त्रुटियाँ रख सकती है। कुछ गैर-नमूनी त्रुटियाँ इस प्रकार हैं:
नमूनी पूर्वाग्रह
नमूनी पूर्वाग्रह तब होता है जब नमूना योजना ऐसी हो कि लक्षित जनसंख्या के कुछ सदस्य नमूने में शामिल ही नहीं हो सकते।
अनुत्तर त्रुटियाँ
अनुत्तर तब होता है जब साक्षात्कारकर्ता नमूने में सूचीबद्ध व्यक्ति से संपर्क नहीं कर पाता या नमूने से चुना व्यक्ति उत्तर देने से इनकार कर देता है। इस स्थिति में नमूना प्रेक्षण प्रतिनिधि नहीं हो सकता।
आंकड़ा अर्जन में त्रुटियाँ
इस प्रकार की त्रुटि गलत उत्तरों के अभिलेखन से उत्पन्न होती है। मान लीजिए, शिक्षक विद्यार्थियों से कक्षा में शिक्षक की मेज की लंबाई मापने को कहता है। विद्यार्थियों की माप भिन्न हो सकती है। अंतर मापने वाली फीते में अंतर, विद्यार्थियों की लापरवाही आदि के कारण हो सकता है। इसी प्रकार, मान लीजिए हम संतरे के मूल्यों पर आंकड़े इकट्ठा करना चाहते हैं। हम जानते हैं कि मूल्य दुकान से दुकान और बाजार से बाजार भिन्न होते हैं। मूल्य गुणवत्ता के अनुसार भी भिन्न होते हैं। इसलिए हम केवल औसत मूल्यों पर विचार कर सकते हैं। अभिलेखन की गलतियाँ भी हो सकती हैं क्योंकि गणनाकार्ता या उत्तरदाता आंकड़ों को अभिलेखित या ट्रांसक्राइब करते समय त्रुटि कर सकते हैं, उदाहरण के लिए, वह 31 के स्थान पर 13 अभिलेखित कर सकता है।
6. भारत की जनगणना और एनएसएसओ
राष्ट्रीय और राज्य स्तर पर कुछ एजेंसियाँ हैं जो सांख्यिकीय आँकड़ों को एकत्र, संसाधित और सारणीबद्ध करती हैं। राष्ट्रीय स्तर पर कुछ एजेंसियाँ भारत की जनगणना, राष्ट्रीय नमूना सर्वेक्षण (NSS), केंद्रीय सांख्यिकी कार्यालय (CSO), भारत के रजिस्ट्रार जनरल (RGI), महानिदेशक वाणिज्यिक खुफिया और सांख्यिकी (DGCIS), श्रम ब्यूरो आदि हैं।
भारत की जनगणना जनसंख्या का सबसे पूर्ण और निरंतर जनसांख्यिकीय रिकॉर्ड प्रदान करती है। जनगणना 1881 से हर दस वर्ष में नियमित रूप से आयोजित की जाती रही है। स्वतंत्रता के बाद पहली जनगणना 1951 में आयोजित की गई थी। जनगणना अधिकारी जनसंख्या के विभिन्न पहलुओं जैसे आकार, घनत्व, लिंग अनुपात, साक्षरता, प्रवास, ग्रामीण-शहरी वितरण आदि की जानकारी एकत्र करते हैं। जनगणना आँकड़ों की व्याख्या और विश्लेषण भारत में कई आर्थिक और सामाजिक मुद्दों को समझने के लिए किया जाता है।
एनएसएस को भारत सरकार द्वारा सामाजिक-आर्थिक मुद्दों पर देशव्यापी सर्वेक्षण करने के लिए स्थापित किया गया था। एनएसएस लगातार क्रमिक दौरों में सर्वेक्षण करता है। एनएसएस द्वारा एकत्रित आंकड़े रिपोर्टों और इसकी त्रैमासिक पत्रिका सर्वेक्षण के माध्यम से जारी किए जाते हैं। एनएसएस साक्षरता, स्कूल नामांकन, शैक्षिक सेवाओं के उपयोग, रोजगार, बेरोजगारी, विनिर्माण और सेवा क्षेत्र के उद्यमों, रोगग्रस्तता, प्रसूति, बाल देखभाल, सार्वजनिक वितरण प्रणाली के उपयोग आदि के आवधिक अनुमान प्रदान करता है। एनएसएस का 60वां दौर सर्वेक्षण (जनवरी-जून 2004) रोगग्रस्तता और स्वास्थ्य सेवा पर था। एनएसएस का 68वां दौर सर्वेक्षण (2011-12) उपभोक्ता व्यय पर था। एनएसएस विभिन्न वस्तुओं के औद्योगिक गतिविधियों और खुदरा मूल्यों का विवरण भी एकत्र करता है। इनका उपयोग भारत सरकार योजना उद्देश्यों के लिए करती है।
7. निष्कर्ष
आर्थिक तथ्य, जिन्हें संख्याओं के रूप में व्यक्त किया जाता है, आंकड़े कहलाते हैं। आंकड़े एकत्र करने का उद्देश्य किसी समस्या और उसके पीछे के कारणों को समझना, व्याख्या करना और विश्लेषण करना है। प्राथमिक आंकड़े किसी सर्वेक्षण के माध्यम से प्राप्त किए जाते हैं। सर्वेक्षण में विभिन्न चरण शामिल होते हैं, जिनकी सावधानीपूर्वक योजना बनाने की आवश्यकता होती है। विभिन्न एजेंसियां हैं जो सांख्यिकीय आंकड़े एकत्र करती हैं, संसाधित करती हैं, सारणीबद्ध करती हैं और प्रकाशित करती हैं। इनका उपयोग द्वितीयक आंकड़ों के रूप में किया जाता है। हालांकि, आंकड़ों के स्रोत और आंकड़े एकत्र करने की विधि का चयन अध्ययन के उद्देश्य पर निर्भर करता है।
सारांश
- आँकड़ा एक ऐसा उपकरण है जो किसी भी समस्या पर सही निष्कर्ष तक पहुँचने में मदद करता है।
- प्राथमिक आँकड़े प्रथम-हस्त सूचना पर आधारित होते हैं।
- सर्वेक्षण व्यक्तिगत साक्षात्कार, प्रश्नावली भेजने और टेलीफोन साक्षात्कार द्वारा किया जा सकता है।
- जनगणना जनसंख्या से सम्बद्ध प्रत्येक व्यक्ति/इकाई को सम्मिलित करती है।
- नमूना जनसंख्या से चयनित एक छोटा समूह है जिससे सम्बन्धित सूचना प्राप्त की जाती है।
- यादृच्छिक प्रतिदर्श में प्रत्येक व्यक्ति को सूचना देने के लिए चयनित होने का समान अवसर दिया जाता है।
- प्रतिदर्श त्रुटि प्रतिदर्श अनुमान के मान और सम्बन्धित जनसंख्या प्राचल के मान के अन्तर के कारण होती है।
- गैर-प्रतिदर्श त्रुटियाँ आँकड़ा प्राप्त करने, अनुत्तरदायित्व या चयन में पूर्वाग्रह के कारण उत्पन्न हो सकती हैं।
- भारत की जनगणना और राष्ट्रीय प्रतिदर्श सर्वेक्षण दो महत्वपूर्ण राष्ट्रीय स्तरीय एजेंसियाँ हैं जो कई महत्वपूर्ण आर्थिक और सामाजिक मुद्दों पर आँकड़े एकत्रित, संसाधित और सारणीबद्ध करती हैं।
अभ्यास
1. निम्नलिखित प्रश्नों के लिए कम-से-कम चार उपयुक्त बहुविकल्पी विकल्प बनाइए:
(i) जब आप नया पोशाक खरीदते हैं तो निम्नलिखित में से सबसे महत्वपूर्ण क्या होता है?
(ii) आप कितनी बार कंप्यूटर का उपयोग करते हैं?
(iii) आप नियमित रूप से कौन-से समाचार-पत्र पढ़ते हैं?
(iv) पेट्रोल की कीमत में वृद्धि उचित है।
(v) आपके परिवार की मासिक आय क्या है?
2. पाँच द्वि-मार्गी प्रश्न बनाइए (जिनका उत्तर ‘हाँ’ या ‘नहीं’ में हो)।
3. निम्नलिखित कथनों को सत्य या असत्य बताइए।
(i) आँकड़ों के कई स्रोत होते हैं।
(ii) जब जनसंख्या साक्षर हो और एक बड़े क्षेत्र में फैली हो, तो टेलीफोन सर्वे डेटा एकत्र करने की सबसे उपयुक्त विधि होती है।
(iii) जांचकर्ता द्वारा एकत्र किया गया डेटा द्वितीयक डेटा कहलाता है।
(iv) प्रतिदर्शों के गैर-यादृच्छिक चयन में एक निश्चित पूर्वाग्रह शामिल होता है।
(v) गैर-प्रतिदर्श त्रुटियों को बड़े प्रतिदर्श लेकर न्यूनतम किया जा सकता है।
4. आप निम्नलिखित प्रश्नों के बारे में क्या सोचते हैं? क्या आपको इन प्रश्नों में कोई समस्या दिखाई देती है? वर्णन कीजिए।
(i) आप सबसे निकटतम बाजार से कितनी दूर रहते हैं?
(ii) यदि प्लास्टिक थैले हमारे कूड़े-कचरे का केवल 5 प्रतिशत हैं, तो क्या इसे प्रतिबंधित किया जाना चाहिए?
(iii) क्या आप पेट्रोल की कीमत में वृद्धि के विरोधी नहीं होंगे?
(iv) क्या आप रासायनिक उर्वरकों के उपयोग से सहमत हैं?
(v) क्या आप अपने खेतों में उर्वरकों का उपयोग करते हैं?
(vi) आपके खेत में प्रति हेक्टेयर उपज क्या है?
5. आप बच्चों के बीच वेजिटेबल अट्टा नूडल्स की लोकप्रियता पर शोध करना चाहते हैं। इस जानकारी को एकत्र करने के लिए एक उपयुक्त प्रश्नावली तैयार कीजिए।
6. 200 खेतों वाले एक गाँव में फसलों की प्रणाली जानने के लिए एक अध्ययन किया गया। सर्वेक्षण किए गए 50 खेतों में से $50 %$ ने केवल गेहूँ उगाया। जनसंख्या और प्रतिदर्श का आकार क्या है?
7. प्रतिदर्श, जनसंख्या और चर के दो-दो उदाहरण दीजिए।
8. निम्नलिखित में से कौन-सी विधि बेहतर परिणाम देती है और क्यों?
(a) जनगणना
(b) प्रतिदर्श
9. निम्नलिखित में से कौन-सी त्रुटि अधिक गंभीर है और क्यों?
(a) प्रतिदर्श त्रुटि
(b) गैर-प्रतिदर्श त्रुटि
10. मान लीजिए आपकी कक्षा में 10 विद्यार्थी हैं। आप उनमें से तीन को चुनना चाहते हैं। कितने नमूने संभव हैं?
11. चर्चा कीजिए कि आप 10 में से 3 विद्यार्थियों को चुनने के लिए लॉटरी विधि का उपयोग कैसे करेंगे।
12. क्या लॉटरी विधि हमेशा आपको एक यादृच्छिक नमूना देती है? समझाइए।
13. यादृच्छिक संख्या सारणियों का उपयोग करके 10 में से 3 विद्यार्थियों के एक यादृच्छिक नमूने के चयन की प्रक्रिया समझाइए।
14. क्या नमूने सर्वेक्षणों की तुलना में बेहतर परिणाम देते हैं? अपने उत्तर के कारण दीजिए।