अध्याय 02 डेटा प्रोसेसिंग
आपने पिछले अध्याय में सीखा है कि आँकड़ों को संगठित और प्रस्तुत करने से वे समझ में आने योग्य बन जाते हैं। यह आँकड़ों की प्रोसेसिंग को सुविधाजनक बनाता है। आँकड़ों का विश्लेषण करने के लिए कई सांख्यिकीय तकनीकें प्रयोग की जाती हैं, जैसे:
- केंद्रीय प्रवृत्ति के माप
- विचरण के माप
- सम्बन्ध के माप
जहाँ केंद्रीय प्रवृत्ति के माप उस मान को प्रदान करते हैं जो प्रेक्षणों के समूह का एक आदर्श प्रतिनिधि होता है, वहीं विचरण के माप आँकड़ों के आंतरिक विचरण को ध्यान में रखते हैं, प्रायः किसी केंद्रीय प्रवृत्ति के माप के चारों ओर। सम्बन्ध के माप, दूसरी ओर, किन्हीं दो या अधिक सम्बन्धित घटनाओं—जैसे वर्षा और बाढ़ की घटना या उर्वरक के उपयोग और फसल उत्पादन—के बीच सम्बन्ध की डिग्री बताते हैं। इस अध्याय में आप केंद्रीय प्रवृत्ति के माप सीखेंगे।
केंद्रीय प्रवृत्ति के माप
मापने योग्य विशेषताएँ—जैसे वर्षा, ऊँचाई, जनसंख्या घनत्व, शैक्षिक उपलब्धि के स्तर या आयु वर्ग—भिन्न-भिन्न होते हैं। यदि हम इन्हें समझना चाहें तो हम कैसे करेंगे? शायद हमें एक ऐसे एकल मान या संख्या की आवश्यकता होगी जो सभी प्रेक्षणों का सर्वोत्तम प्रतिनिधित्व करे। यह एकल मान प्रायः बंटन के केंद्र के निकट होता है न कि किसी चरम बिंदु पर। बंटनों के केंद्र को ज्ञात करने के लिए प्रयुक्त सांख्यिकीय तकनीकों को केंद्रीय प्रवृत्ति के माप कहा जाता है। केंद्रीय प्रवृत्ति को दर्शाने वाली संख्या संपूर्ण आँकड़ा समुच्चय के लिए प्रतिनिधि आकृति होती है क्योंकि यह वह बिंदु है जिसके चारों ओर मदों के समूहित होने की प्रवृत्ति होती है।
केन्द्रीय प्रवृत्ति के मापकों को सांख्यिकीय औसत भी कहा जाता है। केन्द्रीय प्रवृत्ति के मापकों की कई विधियाँ होती हैं, जैसे माध्य, माध्यिका और बहुलक।
माध्य
माध्य वह मान है जो सभी मानों को जोड़कर और उसे प्रेक्षणों की संख्या से विभाजित करके प्राप्त किया जाता है।
माध्यिका
माध्यिका वह क्रम का मान है जो व्यवस्थित श्रेणी को दो समान संख्याओं में विभाजित करता है। यह वास्तविक मान से स्वतंत्र होता है। आँकड़ों को आरोही या अवरोही क्रम में व्यवस्थित करना और फिर मध्य क्रमांक संख्या का मान खोजना माध्यिका की गणना में सबसे महत्वपूर्ण है। सम संख्या के मामले में दो मध्य क्रमांक मानों का औसत माध्यिका होगा।
बहुलक
बहुलक किसी विशेष बिंदु या मान पर अधिकतम आवृत्ति या बारंबारता है। आप देख सकते हैं कि ये सभी माप विभिन्न प्रकार के आँकड़ा समुच्चयों के लिए उपयुक्त एकल प्रतिनिधि संख्या निर्धारित करने की भिन्न-भिन्न विधियाँ हैं।
माध्य
माध्य किसी चर के विभिन्न मानों का सरल अंकगणितीय औसत है। असमूहित और समूहित आँकड़ों के लिए माध्य की गणना की विधियाँ आवश्यक रूप से भिन्न होती हैं। समूहित और असमूहित दोनों प्रकार के आँकड़ों के लिए माध्य को प्रत्यक्ष या अप्रत्यक्ष विधियों से गणना किया जा सकता है।
असमूहित आँकड़ों से माध्य की गणना
प्रत्यक्ष विधि
अवर्गीकृत आँकड़ों से प्रत्यक्ष विधि द्वारा माध्य निकालते समय प्रत्येक प्रेक्षण के मानों को जोड़ा जाता है और सभी प्रेक्षणों के योग को कुल घटनाओं की संख्या से विभाजित किया जाता है। माध्य निम्नलिखित सूत्र द्वारा निकाला जाता है:
$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$
जहाँ,
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { माध्य }\ \sum\quad &\text { एक श्रृंखला के मापों का }\ &\text { योग } \end{aligned} $$
$x\quad=$ मापों की श्रृंखला में एक कच्चा अंक
$\sum\mathrm{x}=$ सभी मापों का योग
$\mathrm{N}\quad$ = मापों की संख्या
उदाहरण 2.1: मध्य प्रदेश के मालवा पठार के लिए माध्य वर्षा की गणना कीजिए, जो क्षेत्र के जिलों की वर्षा से दी गई है, जो सारणी 2.1 में दी गई है:
$\hspace{1cm}$ सारणी 2.1; माध्य वर्षा की गणना
| मालवा पठार के जिले |
सामान्य वर्षा मिमी में |
अप्रत्यक्ष विधि |
|---|---|---|
| x प्रत्यक्ष विधि | $d=x-800^{*}$ | |
| इंदौर | 979 | 179 |
| देवास | 1083 | 283 |
| धार | 833 | 33 |
| रतलाम | 896 | 96 |
| उज्जैन | 891 | 91 |
| मंदसौर | 825 | 25 |
| शाजापुर | 977 | 177 |
| $\sum x$ और $\sum d$ | 6484 | 884 |
| $\frac{\sum x}{N}$ और $\frac{\sum d}{N}$ | 926.29 | 126.29 |
- जहाँ 800 माना गया माध्य है।
$\mathrm{d}$ माना गया माध्य से विचलन है।
सारणी 2.1 में दिए गए आँकड़ों के लिए माध्य इस प्रकार निकाला गया है:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N}\ & =\frac{6,484}{7}\ & =926.29 \end{aligned} $$
यह बात माध्य की गणना से देखी जा सकती है कि कच्चे वर्षा आंकड़ों को सीधे जोड़ा गया है और योग को प्रेक्षणों की संख्या, अर्थात् जिलों की संख्या से विभाजित किया गया है। इसलिए इसे प्रत्यक्ष विधि कहा जाता है।
अप्रत्यक्ष विधि
बड़ी संख्या में प्रेक्षणों के लिए, माध्य की गणना करने के लिए सामान्यतः अप्रत्यक्ष विधि का प्रयोग किया जाता है। यह प्रेक्षणों के मानों को उनसे एक नियत संख्या घटाकर छोटे मानों में परिवर्तित करने में सहायक होता है। उदाहरण के लिए, जैसा कि तालिका 2.1 में दिखाया गया है, वर्षा के मान 800 और $1100 \mathrm{~mm}$ के बीच हैं। हम इन मानों को ‘अनुमानित माध्य’ चुनकर और प्रत्येक मान से चुनी गई संख्या घटाकर कम कर सकते हैं। वर्तमान उदाहरण में हमने 800 को अनुमानित माध्य लिया है। इस प्रकार की प्रक्रिया को कोडिंग कहा जाता है। फिर इन कम किए गए मानों (तालिका 2.1 का स्तंभ 3) से माध्य निकाला जाता है।
अप्रत्यक्ष विधि से माध्य की गणना करने के लिए निम्नलिखित सूत्र का प्रयोग किया जाता है:
$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$
जहाँ,
$$ \begin{aligned} A & =\text { घटाई गई नियत संख्या }\ \sum d & =\text { कोडित स्कोरों का योग }\ N & =\text { श्रेणी में व्यक्तिगत प्रेक्षणों की संख्या } \end{aligned} $$
तालिका 2.1 में दिखाए गए आंकड़ों के लिए माध्य को निम्नलिखित प्रकार से अप्रत्यक्ष विधि द्वारा निकाला जा सकता है:
$$ \begin{aligned} \overline{\mathrm{X}} & =800 +\frac{884}{7}\ & =800 +\frac{884}{7}\ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$
ध्यान दें कि माध्य का मान दोनों में से किसी भी विधि से निकाला जाए, समान आता है।
समूहीकृत आँकड़ों से माध्य की गणना
समूहीकृत आँकड़ों से भी माध्य की गणना प्रत्यक्ष या अप्रत्यक्ष विधि द्वारा की जाती है।
प्रत्यक्ष विधि
जब अंकों को बारंबारता बंटन में समूहीकृत किया जाता है, तो व्यक्तिगत मान अपनी पहचान खो देते हैं। ये मान उन वर्ग अंतरालों के मध्य बिंदुओं द्वारा दर्शाए जाते हैं जिनमें वे स्थित होते हैं। समूहीकृत आँकड़ों से प्रत्यक्ष विधि द्वारा माध्य की गणना करते समय प्रत्येक वर्ग अंतराल के मध्य बिंदु को उसकी संगत बारंबारता $(f)$ से गुणा किया जाता है; सभी $f x$ के मानों (यहाँ $\mathrm{X}$ मध्य बिंदु हैं) को जोड़कर $\sum f x$ प्राप्त किया जाता है जिसे अंत में प्रेक्षणों की संख्या अर्थात् $\mathrm{N}$ से विभाजित किया जाता है। इस प्रकार, माध्य निम्न सूत्र द्वारा परिकलित किया जाता है:
$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$
जहाँ: $$ \begin{aligned} \overline{\mathrm{X}} & =\text { माध्य }\ f & =\text { बारंबारताएँ }\ x & =\text { वर्ग अंतरालों के मध्य बिंदु }\ N &\left.=\text { प्रेक्षणों की संख्या (इसे }\sum f \text{ भी कहा जा सकता है }\right) \end{aligned} $$
उदाहरण 2.2: सारणी 2.2 में दिए गए आँकड़ों का उपयोग कर कारखाने के श्रमिकों की औसत मजदूरी दर की गणना करें:
सारणी 2.2; कारखाने के श्रमिकों की मजदूरी दर
| मजदूरी दर (रु./दिन) | श्रमिकों की संख्या () |
|---|---|
| वर्ग | $\boldsymbol{f}$ |
| $50-70$ | 10 |
| $70-90$ | 20 |
| $90-110$ | 25 |
| $110-130$ | 35 |
| $130-150$ | 9 |
सारणी 2.3; माध्य की गणना
| वर्ग | आवृत्ति (f) |
मध्य- बिंदु $(x)$ |
$f x x$ | $d=x-100$ | $f d$ | $U=$ $(x-100)$ 20 |
$f u$ |
|---|---|---|---|---|---|---|---|
| $50-70$ | 10 | 60 | 600 | -40 | -400 | -2 | -20 |
| $70-90$ | 20 | 80 | 1,600 | -20 | -400 | -1 | -20 |
| $\mathbf{9 0 - 1 1 0}$ | $\mathbf{2 5}$ | $\mathbf{1 0 0}$ | 2,500 | $\mathbf{0}$ | 0 | 0 | 0 |
| $110-130$ | 35 | 120 | 4,200 | 20 | 700 | 1 | 35 |
| $130-150$ | 9 | 140 | 1,260 | 40 | 360 | 2 | 18 |
| $\sum f x$ | |||||||
| और | $\sum f=99$ | $\sum f x=$ | $\sum f d=$ | $\sum f u=$ | |||
| $\sum f x$ | 10,160 | 260 | 13 |
जहाँ $\mathrm{N}=\sum f=99$
तालिका 2.3 समूहबद्ध आंकड़ों के लिए माध्य की गणना की प्रक्रिया प्रदान करती है। दी गई आवृत्ति बंटन में, निन्यानवे श्रमिकों को मजदूरी दरों के पाँच वर्गों में समूहबद्ध किया गया है। इन समूहों के मध्य बिंदु तीसरे स्तंभ में सूचीबद्ध हैं। माध्य ज्ञात करने के लिए, प्रत्येक मध्य बिंदु $(\mathrm{X})$ को आवृत्ति $(f)$ से गुणा किया गया है और उनका योग ( $\sum f_{x}$ ) को $N$ से विभाजित किया गया है।
माध्य को दिए गए सूत्र का उपयोग करके इस प्रकार गणना किया जा सकता है:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N}\ & =\frac{10,160}{99}\ & =102.6 \end{aligned} $$
अप्रत्यक्ष विधि
समूहबद्ध आंकड़ों के लिए अप्रत्यक्ष विधि के लिए निम्नलिखित सूत्र का उपयोग किया जा सकता है। इस सूत्र के सिद्धांत असमूहबद्ध आंकड़ों के लिए दिए गए अप्रत्यक्ष विधि के समान हैं। इसे इस प्रकार व्यक्त किया गया है
$$ \bar{x}=A\pm\frac{\sum f d}{N} $$
जहाँ,
= अभीत माध्य वर्ग का मध्यबिंदु
(तालिका 2.3 में अभीत माध्य वर्ग 90 – 110 है, जिसका मध्यबिंदु 100 है।)
f = बारंबारता
d = अभीत माध्य वर्ग (A) से विचलन
N = प्रेक्षणों का योग अर्थात् ∑ f
i = वर्ग अंतराल की चौड़ाई (इस स्थिति में यह 20 है)
तालिका 2.3 से माध्य निकालने की प्रत्यक्ष विधि में शामिल निम्नलिखित चरण निकाले जा सकते हैं:
(i) माध्य को 90 - 110 वर्ग में अभीत माना गया है। इसे श्रेणी के मध्य के निकटतम वर्ग से मानना सर्वोत्तम होता है, जिससे गणना की जटिलता न्यूनतम रहती है। तालिका 2.3 में A (अभीत माध्य) 100 है, जो वर्ग $90-110$ का मध्यबिंदु है।
(ii) पाँचवाँ स्तंभ (u) प्रत्येक वर्ग के मध्यबिंदु का अभीत माध्य वर्ग $(90-110)$ के मध्यबिंदु से विचलन दर्शाता है।
(iii) छठा स्तंभ प्रत्येक $f$ को संगत $d$ से गुणा करके प्राप्त $f d$ के मान दिखाता है। फिर $f d$ के धनात्मक तथा ऋणात्मक मानों को पृथक-पृथक जोड़ा जाता है और उनका निरपेक अंतर निकाला जाता है ($\sum f d$)। ध्यान दें कि $\sum f d$ से जुड़ा चिह्न सूत्र में A के बाद दिए गए $\pm$ के स्थान पर रखा जाता है।
अप्रत्यक्ष विधि से माध्य इस प्रकार निकाला जाता है:
$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A}\pm\frac{\sum\boldsymbol{f}\boldsymbol{d}}{\boldsymbol{N}}\ & =100 +\frac{260}{99}\ & =100 +2.6 \ & =102.6 \end{aligned} $$
नोट: अप्रत्यक्ष माध्य विधि समान तथा असमान वर्ग अंतराल दोनों के लिए कार्य करती है।
माध्यिका
माध्यिका एक स्थितीय औसत है। इसे “एक वितरण में उस बिंदु के रूप में परिभाषित किया जा सकता है जिसके दोनों ओर समान संख्या में प्रेक्षण हों”। माध्यिका को प्रतीक $\mathrm{M}$ द्वारा व्यक्त किया जाता है।
अग्रुपित आँकड़ों के लिए माध्यिका की गणना
जब अंक अग्रुपित हों, तो इन्हें आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। माध्यिका को व्यवस्थित श्रृंखला में केंद्रीय प्रेक्षण या मान को ढूँढकर निकाला जा सकता है। केंद्रीय मान को आरोही या अवरोही क्रम में व्यवस्थित श्रृंखला के किसी भी सिरे से स्थित किया जा सकता है। माध्यिका की गणना के लिए निम्नलिखित समीकरण का प्रयोग किया जाता है:
$\left(\frac{\mathrm{N}+1}{2}\right)$वाँ मान
उदाहरण 2.3: हिमालय के कुछ भागों में पर्वत शिखरों की माध्यिका ऊँचाई निम्नलिखित आँकड़ों से गणना करें:
$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$।
गणना: माध्यिका (M) को निम्नलिखित चरणों में गणना किया जा सकता है:
(i) दिए गए आँकड़ों को आरोही या अवरोही क्रम में व्यवस्थित करें।
(ii) श्रृंखला में केंद्रीय मान को खोजने के लिए सूत्र लगाएँ। इस प्रकार:
( $\frac{\mathrm{N}+1}{2}$ )वाँ मान
$=\left(\frac{7 +1}{2}\right)$वाँ मान
$=\left(\frac{8}{2}\right)$वाँ मान
व्यवस्थित श्रृंखला में 4वाँ मान माध्यिका होगा।
आँकड़ों को आरोही क्रम में व्यवस्थित करने पर -
7,$817; 8,076; 8,126; 8,172; 8,598; 8,611; 8,848$
अतः,
4वाँ मान
$$ \mathrm{M}=8,172 \mathrm{~m} $$
ग्रुपित आँकड़ों के लिए माध्यिका की गणना
जब अंकों को समूहीकृत किया जाता है, तो हमें उस बिंदु का मान ज्ञात करना होता है जहाँ कोई व्यक्ति या प्रेक्षण समूह के केंद्र में स्थित होता है। इसे निम्नलिखित सूत्र का उपयोग करके परिकलित किया जा सकता है:
$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$
जहाँ,
M = समूहीकृत आंकड़ों के लिए माध्यिका
l = माध्यिका वर्ग की निचली सीमा
i = अंतराल
f = माध्यिका वर्ग की आवृत्ति
N = आवृत्तियों की कुल संख्या या प्रेक्षणों की संख्या
c = पूर्व-माध्यिका वर्ग की संचयी आवृत्ति।
उदाहरण 2.4: निम्नलिखित बंटन के लिए माध्यिका की गणना करें:
| वर्ग | $50-60$ | $60-70$ | $70-80$ | $80-90$ | $90-100$ | $100-110$ |
|---|---|---|---|---|---|---|
| $\boldsymbol{f}$ | 3 | 7 | 11 | 16 | 8 | 5 |
तालिका 2.4; माध्यिका की गणना
| वर्ग | आवृत्ति (f) |
संचयी आवृत्ति (iv) |
गणना माध्यिका वर्ग की |
|---|---|---|---|
| $50-60$ $60-70$ $70-80$ $\mathbf{8 0 - 9 0}$ (माध्यिका समूह) $90-100$ $100-110$ |
3 7 11 $16 \boldsymbol{f}$ 8 5 5 |
3 10 $21 c$ $\mathbf{3 7}$ 45 50 |
$M=\frac{N}{2}$ $=\frac{50}{4}$ |
| $\sum_{\mathbf{N}=\mathbf{5 0}} f$ या |
माध्यिका को नीचे दिए गए चरणों में परिकलित किया जाता है:
(i) आवृत्ति तालिका तालिका 2.4 के अनुसार तैयार की जाती है।
(ii) संचयी बारंबारताएँ (F) प्राप्त की जाती हैं क्रमागत अंतराल समूहों की प्रत्येक सामान्य बारंबारता को जोड़कर, जैसा कि सारणी 2.4 के स्तंभ 3 में दिया गया है।
(iii) माध्यिका संख्या प्राप्त की जाती है $\frac{N}{2}$ द्वारा अर्थात् $\frac{50}{2}=\mathbf{2 5}$ इस स्थिति में, जैसा कि सारणी 2.4 के स्तंभ 4 में दिखाया गया है।
(iv) संचयी बारंबारता बंटन (F) में ऊपर से नीचे की ओर तब तक गिनती करें जब तक $\frac{N}{2}$ से अगला बड़ा मान न प्राप्त हो जाए। इस उदाहरण में, $\frac{N}{2}$ 25 है, जो 40-44 की वर्ग अंतराल में आता है जिसकी संचयी बारंबारता 37 है, इस प्रकार पूर्व-माध्यिका वर्ग की संचयी बारंबारता 21 है और माध्यिका वर्ग की वास्तविक बारंबारता 16 है।
(v) फिर माध्यिका की गणना चरण 4 में निर्धारित सभी मानों को निम्न समीकरण में प्रतिस्थापित करके की जाती है:
$$ M=l+\frac{i}{f}(m-c) $$
$$ \begin{aligned} & =80 +\frac{10}{16}(25-21)\ & =80 +\frac{5}{8}\times 4 \ & =80 +\frac{5}{2}\ & =80 +2.5 \ M & =82.5 \end{aligned} $$
बहुलक
वह मान जो किसी बंटन में सर्वाधिक बार आता है बहुलक कहलाता है। इसे $\mathbf{Z}$ या $\mathbf{M}_{\mathbf{0}}$ द्वारा प्रतीकित किया जाता है। बहुलक एक ऐसा मापक है जिसका उपयोग माध्य और माध्यिका की तुलना में कम व्यापक रूप से किया जाता है। किसी दिए गए आंकड़ा समुच्चय में एक से अधिक प्रकार के बहुलक हो सकते हैं।
असमूहीकृत आंकड़ों के लिए बहुलक की गणना
जब दिए गए आंकड़ा समुच्चय से बहुलक की गणना की जाती है तो सभी मापकों को पहले आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। यह सबसे अधिक बार आने वाले मापक को आसानी से पहचानने में सहायता करता है।
उदाहरण 2.5: भूगोल में दस विद्यार्थियों के निम्नलिखित टेस्ट स्कोरों के लिए बहुलक की गणना करें:
$$ 61,10,88,37,61,72,55,61,46,22 $$
गणना: बहुलक ज्ञात करने के लिए मापों को आरोही क्रम में इस प्रकार व्यवस्थित किया जाता है:
$10,22,37,46,55,\mathbf{6 1},\mathbf{6 1},\mathbf{6 1}, 72,88$.
श्रेणी में तीन बार आने वाला माप 61 दिए गए डेटासेट का बहुलक है। चूँकि डेटासेट में कोई अन्य संख्या इसी प्रकार नहीं आती, इसलिए यह एकल-बहुलक (unimodal) होने का गुण रखता है।
उदाहरण 2.6: दस अन्य विद्यार्थियों के एक भिन्न नमूने, जिनके स्कोर हैं:
$82,11,57,82,08,11,82,95,41,11$,
का उपयोग कर बहुलक की गणना करें।
गणना: दिए गए मापों को आरोही क्रम में इस प्रकार व्यवस्थित करें:
$$ 08,11,11,11,41,57,82,82,82,95 $$
इसमें आसानी से देखा जा सकता है कि माप 11 और 82 दोनों ही वितरण में तीन-तीन बार आ रहे हैं। अतः डेटासेट द्वि-बहुलक (bimodal) प्रतीत होता है। यदि तीन मानों की समान और सर्वाधिक आवृत्ति हो, तो श्रेणी त्रि-बहुलक (trimodal) होती है। इसी प्रकार, श्रेणी में अनेक मापों की बार-बार आवृत्ति उसे बहु-बहुलक (multimodal) बनाती है। यद्यपि, जब श्रेणी में कोई भी माप दोहराया न जाए, तो उसे बिना बहुलक (without mode) कहा जाता है।
माध्य, माध्यिका और बहुलक की तुलना
केन्द्रीय प्रवृत्ति के तीनों मापकों की तुलना सामान्य वितरण वक्र की सहायता से आसानी से की जा सकती है। सामान्य वक्र एक आवृत्ति वितरण को दर्शाता है जिसमें अंकों का ग्राफ प्रायः घंटी-आकार का होता है। अनेक मानव लक्षण—जैसे बुद्धि, व्यक्तित्व अंक और विद्यार्थियों की उपलब्धियाँ—सामान्य वितरण रखते हैं। घंटी-आकार का वक्र इसलिए इस रूप का होता है क्योंकि यह सममित होता है; अन्य शब्दों में, अधिकांश प्रेक्षण मध्य मान के आसपास होते हैं। जैसे-जैसे चरम मानों की ओर बढ़ा जाता है, प्रेक्षणों की संख्या सममित रूप से घटती जाती है। एक सामान्य वक्र में डेटा का प्रसार अधिक या कम हो सकता है। सामान्य वितरण वक्र का एक उदाहरण चित्र 2.3 में दिया गया है।
चित्र 2.3; सामान्य वितरण वक्र
सामान्य वितरण का एक महत्त्वपूर्ण लक्षण यह है कि माध्य, माध्यिका और बहुलक एक ही अंक होते हैं (चित्र 2.3 में 100 अंक), क्योंकि सामान्य वितरण सममित होता है। सर्वाधिक आवृत्ति वाला अंक वितरण के ठीक मध्य में आता है और ठीक आधे अंक मध्य से ऊपर तथा आधे नीचे होते हैं। अधिकांश अंक वितरण के मध्य या माध्य के आसपास आते हैं। बहुत अधिक और बहुत कम अंक प्रायः नहीं आते, इसलिए उन्हें दुर्लभ माना जाता है।
यदि डेटा किसी प्रकार से विषम या विकृत हैं, तो माध्य, माध्यिका और बहुलक संपाती नहीं होंगे और विषम डेटा के प्रभाव पर विचार करने की आवश्यकता होगी (चित्र 2.4 और 2.5)।
चित्र 2.4; धनात्मक विषमता
चित्र 2.5: ऋणात्मक विषमता
अभ्यास
1. नीचे दिए गए चार विकल्पों में से सही उत्तर चुनें:
(i) केंद्रीय प्रवृत्ति का वह माप जो चरम मानों से प्रभावित नहीं होता:
(a) माध्य
(b) माध्य और बहुलक
(c) बहुलक
(d) माध्यिका
(ii) केंद्रीय प्रवृत्ति का वह माप जो किसी भी बंटन के उभार के साथ सदैव संपाती होता है:
(a) माध्यिका
(b) माध्यिका और बहुलक
(c) माध्य
(d) बहुलक
2. निम्नलिखित प्रश्नों के उत्तर लगभग 30 शब्दों में दें:
(i) माध्य की परिभाषा दें।
(ii) बहुलक के प्रयोग के क्या लाभ हैं?
3. निम्नलिखित प्रश्नों के उत्तर लगभग 125 शब्दों में दें:
(i) सामान्य बंटन और विषम बंटन में माध्य, माध्यिका और बहुलक के सापेक्ष स्थानों की व्याख्या चित्रों की सहायता से कीजिए।
(ii) माध्य, माध्यिका और बहुलक की प्रयोज्यता पर टिप्पणी कीजिए (संकेत; उनके गुणों और दोषों से)।
गतिविधि
1. भौगोलिक विश्लेषण पर लागू एक काल्पनिक उदाहरण लीजिए और असमूहीकृत आँकड़ों से माध्य निकालने की प्रत्यक्ष और अप्रत्यक्ष विधियों की व्याख्या कीजिए।