अध्याय 02 डेटा प्रोसेसिंग

आपने पिछले अध्याय में सीखा है कि आँकड़ों को संगठित और प्रस्तुत करने से वे समझ में आने योग्य बन जाते हैं। यह आँकड़ों की प्रोसेसिंग को सुविधाजनक बनाता है। आँकड़ों का विश्लेषण करने के लिए कई सांख्यिकीय तकनीकें प्रयोग की जाती हैं, जैसे:

  1. केंद्रीय प्रवृत्ति के माप
  2. विचरण के माप
  3. सम्बन्ध के माप

जहाँ केंद्रीय प्रवृत्ति के माप उस मान को प्रदान करते हैं जो प्रेक्षणों के समूह का एक आदर्श प्रतिनिधि होता है, वहीं विचरण के माप आँकड़ों के आंतरिक विचरण को ध्यान में रखते हैं, प्रायः किसी केंद्रीय प्रवृत्ति के माप के चारों ओर। सम्बन्ध के माप, दूसरी ओर, किन्हीं दो या अधिक सम्बन्धित घटनाओं—जैसे वर्षा और बाढ़ की घटना या उर्वरक के उपयोग और फसल उत्पादन—के बीच सम्बन्ध की डिग्री बताते हैं। इस अध्याय में आप केंद्रीय प्रवृत्ति के माप सीखेंगे।

केंद्रीय प्रवृत्ति के माप

मापने योग्य विशेषताएँ—जैसे वर्षा, ऊँचाई, जनसंख्या घनत्व, शैक्षिक उपलब्धि के स्तर या आयु वर्ग—भिन्न-भिन्न होते हैं। यदि हम इन्हें समझना चाहें तो हम कैसे करेंगे? शायद हमें एक ऐसे एकल मान या संख्या की आवश्यकता होगी जो सभी प्रेक्षणों का सर्वोत्तम प्रतिनिधित्व करे। यह एकल मान प्रायः बंटन के केंद्र के निकट होता है न कि किसी चरम बिंदु पर। बंटनों के केंद्र को ज्ञात करने के लिए प्रयुक्त सांख्यिकीय तकनीकों को केंद्रीय प्रवृत्ति के माप कहा जाता है। केंद्रीय प्रवृत्ति को दर्शाने वाली संख्या संपूर्ण आँकड़ा समुच्चय के लिए प्रतिनिधि आकृति होती है क्योंकि यह वह बिंदु है जिसके चारों ओर मदों के समूहित होने की प्रवृत्ति होती है।

केन्द्रीय प्रवृत्ति के मापकों को सांख्यिकीय औसत भी कहा जाता है। केन्द्रीय प्रवृत्ति के मापकों की कई विधियाँ होती हैं, जैसे माध्य, माध्यिका और बहुलक।

माध्य

माध्य वह मान है जो सभी मानों को जोड़कर और उसे प्रेक्षणों की संख्या से विभाजित करके प्राप्त किया जाता है।

माध्यिका

माध्यिका वह क्रम का मान है जो व्यवस्थित श्रेणी को दो समान संख्याओं में विभाजित करता है। यह वास्तविक मान से स्वतंत्र होता है। आँकड़ों को आरोही या अवरोही क्रम में व्यवस्थित करना और फिर मध्य क्रमांक संख्या का मान खोजना माध्यिका की गणना में सबसे महत्वपूर्ण है। सम संख्या के मामले में दो मध्य क्रमांक मानों का औसत माध्यिका होगा।

बहुलक

बहुलक किसी विशेष बिंदु या मान पर अधिकतम आवृत्ति या बारंबारता है। आप देख सकते हैं कि ये सभी माप विभिन्न प्रकार के आँकड़ा समुच्चयों के लिए उपयुक्त एकल प्रतिनिधि संख्या निर्धारित करने की भिन्न-भिन्न विधियाँ हैं।

माध्य

माध्य किसी चर के विभिन्न मानों का सरल अंकगणितीय औसत है। असमूहित और समूहित आँकड़ों के लिए माध्य की गणना की विधियाँ आवश्यक रूप से भिन्न होती हैं। समूहित और असमूहित दोनों प्रकार के आँकड़ों के लिए माध्य को प्रत्यक्ष या अप्रत्यक्ष विधियों से गणना किया जा सकता है।

असमूहित आँकड़ों से माध्य की गणना

प्रत्यक्ष विधि

अवर्गीकृत आँकड़ों से प्रत्यक्ष विधि द्वारा माध्य निकालते समय प्रत्येक प्रेक्षण के मानों को जोड़ा जाता है और सभी प्रेक्षणों के योग को कुल घटनाओं की संख्या से विभाजित किया जाता है। माध्य निम्नलिखित सूत्र द्वारा निकाला जाता है:

$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$

जहाँ,

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { माध्य }\ \sum\quad &\text { एक श्रृंखला के मापों का }\ &\text { योग } \end{aligned} $$

$x\quad=$ मापों की श्रृंखला में एक कच्चा अंक

$\sum\mathrm{x}=$ सभी मापों का योग

$\mathrm{N}\quad$ = मापों की संख्या

उदाहरण 2.1: मध्य प्रदेश के मालवा पठार के लिए माध्य वर्षा की गणना कीजिए, जो क्षेत्र के जिलों की वर्षा से दी गई है, जो सारणी 2.1 में दी गई है:

$\hspace{1cm}$ सारणी 2.1; माध्य वर्षा की गणना

मालवा पठार के
जिले
सामान्य वर्षा
मिमी में
अप्रत्यक्ष विधि
x प्रत्यक्ष विधि $d=x-800^{*}$
इंदौर 979 179
देवास 1083 283
धार 833 33
रतलाम 896 96
उज्जैन 891 91
मंदसौर 825 25
शाजापुर 977 177
$\sum x$ और $\sum d$ 6484 884
$\frac{\sum x}{N}$ और $\frac{\sum d}{N}$ 926.29 126.29
  • जहाँ 800 माना गया माध्य है।
    $\mathrm{d}$ माना गया माध्य से विचलन है।

सारणी 2.1 में दिए गए आँकड़ों के लिए माध्य इस प्रकार निकाला गया है:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N}\ & =\frac{6,484}{7}\ & =926.29 \end{aligned} $$

यह बात माध्य की गणना से देखी जा सकती है कि कच्चे वर्षा आंकड़ों को सीधे जोड़ा गया है और योग को प्रेक्षणों की संख्या, अर्थात् जिलों की संख्या से विभाजित किया गया है। इसलिए इसे प्रत्यक्ष विधि कहा जाता है।

अप्रत्यक्ष विधि

बड़ी संख्या में प्रेक्षणों के लिए, माध्य की गणना करने के लिए सामान्यतः अप्रत्यक्ष विधि का प्रयोग किया जाता है। यह प्रेक्षणों के मानों को उनसे एक नियत संख्या घटाकर छोटे मानों में परिवर्तित करने में सहायक होता है। उदाहरण के लिए, जैसा कि तालिका 2.1 में दिखाया गया है, वर्षा के मान 800 और $1100 \mathrm{~mm}$ के बीच हैं। हम इन मानों को ‘अनुमानित माध्य’ चुनकर और प्रत्येक मान से चुनी गई संख्या घटाकर कम कर सकते हैं। वर्तमान उदाहरण में हमने 800 को अनुमानित माध्य लिया है। इस प्रकार की प्रक्रिया को कोडिंग कहा जाता है। फिर इन कम किए गए मानों (तालिका 2.1 का स्तंभ 3) से माध्य निकाला जाता है।

अप्रत्यक्ष विधि से माध्य की गणना करने के लिए निम्नलिखित सूत्र का प्रयोग किया जाता है:

$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$

जहाँ,

$$ \begin{aligned} A & =\text { घटाई गई नियत संख्या }\ \sum d & =\text { कोडित स्कोरों का योग }\ N & =\text { श्रेणी में व्यक्तिगत प्रेक्षणों की संख्या } \end{aligned} $$

तालिका 2.1 में दिखाए गए आंकड़ों के लिए माध्य को निम्नलिखित प्रकार से अप्रत्यक्ष विधि द्वारा निकाला जा सकता है:

$$ \begin{aligned} \overline{\mathrm{X}} & =800 +\frac{884}{7}\ & =800 +\frac{884}{7}\ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$

ध्यान दें कि माध्य का मान दोनों में से किसी भी विधि से निकाला जाए, समान आता है।

समूहीकृत आँकड़ों से माध्य की गणना

समूहीकृत आँकड़ों से भी माध्य की गणना प्रत्यक्ष या अप्रत्यक्ष विधि द्वारा की जाती है।

प्रत्यक्ष विधि

जब अंकों को बारंबारता बंटन में समूहीकृत किया जाता है, तो व्यक्तिगत मान अपनी पहचान खो देते हैं। ये मान उन वर्ग अंतरालों के मध्य बिंदुओं द्वारा दर्शाए जाते हैं जिनमें वे स्थित होते हैं। समूहीकृत आँकड़ों से प्रत्यक्ष विधि द्वारा माध्य की गणना करते समय प्रत्येक वर्ग अंतराल के मध्य बिंदु को उसकी संगत बारंबारता $(f)$ से गुणा किया जाता है; सभी $f x$ के मानों (यहाँ $\mathrm{X}$ मध्य बिंदु हैं) को जोड़कर $\sum f x$ प्राप्त किया जाता है जिसे अंत में प्रेक्षणों की संख्या अर्थात् $\mathrm{N}$ से विभाजित किया जाता है। इस प्रकार, माध्य निम्न सूत्र द्वारा परिकलित किया जाता है:

$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$

जहाँ: $$ \begin{aligned} \overline{\mathrm{X}} & =\text { माध्य }\ f & =\text { बारंबारताएँ }\ x & =\text { वर्ग अंतरालों के मध्य बिंदु }\ N &\left.=\text { प्रेक्षणों की संख्या (इसे }\sum f \text{ भी कहा जा सकता है }\right) \end{aligned} $$

उदाहरण 2.2: सारणी 2.2 में दिए गए आँकड़ों का उपयोग कर कारखाने के श्रमिकों की औसत मजदूरी दर की गणना करें:

सारणी 2.2; कारखाने के श्रमिकों की मजदूरी दर

मजदूरी दर (रु./दिन) श्रमिकों की संख्या ()
वर्ग $\boldsymbol{f}$
$50-70$ 10
$70-90$ 20
$90-110$ 25
$110-130$ 35
$130-150$ 9

सारणी 2.3; माध्य की गणना

वर्ग आवृत्ति
(f)
मध्य-
बिंदु
$(x)$
$f x x$ $d=x-100$ $f d$ $U=$
$(x-100)$
20
$f u$
$50-70$ 10 60 600 -40 -400 -2 -20
$70-90$ 20 80 1,600 -20 -400 -1 -20
$\mathbf{9 0 - 1 1 0}$ $\mathbf{2 5}$ $\mathbf{1 0 0}$ 2,500 $\mathbf{0}$ 0 0 0
$110-130$ 35 120 4,200 20 700 1 35
$130-150$ 9 140 1,260 40 360 2 18
$\sum f x$
और $\sum f=99$ $\sum f x=$ $\sum f d=$ $\sum f u=$
$\sum f x$ 10,160 260 13

जहाँ $\mathrm{N}=\sum f=99$

तालिका 2.3 समूहबद्ध आंकड़ों के लिए माध्य की गणना की प्रक्रिया प्रदान करती है। दी गई आवृत्ति बंटन में, निन्यानवे श्रमिकों को मजदूरी दरों के पाँच वर्गों में समूहबद्ध किया गया है। इन समूहों के मध्य बिंदु तीसरे स्तंभ में सूचीबद्ध हैं। माध्य ज्ञात करने के लिए, प्रत्येक मध्य बिंदु $(\mathrm{X})$ को आवृत्ति $(f)$ से गुणा किया गया है और उनका योग ( $\sum f_{x}$ ) को $N$ से विभाजित किया गया है।

माध्य को दिए गए सूत्र का उपयोग करके इस प्रकार गणना किया जा सकता है:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N}\ & =\frac{10,160}{99}\ & =102.6 \end{aligned} $$

अप्रत्यक्ष विधि

समूहबद्ध आंकड़ों के लिए अप्रत्यक्ष विधि के लिए निम्नलिखित सूत्र का उपयोग किया जा सकता है। इस सूत्र के सिद्धांत असमूहबद्ध आंकड़ों के लिए दिए गए अप्रत्यक्ष विधि के समान हैं। इसे इस प्रकार व्यक्त किया गया है

$$ \bar{x}=A\pm\frac{\sum f d}{N} $$

जहाँ,

= अभीत माध्य वर्ग का मध्यबिंदु
(तालिका 2.3 में अभीत माध्य वर्ग 90 – 110 है, जिसका मध्यबिंदु 100 है।)
f = बारंबारता
d = अभीत माध्य वर्ग (A) से विचलन
N = प्रेक्षणों का योग अर्थात् ∑ f
i = वर्ग अंतराल की चौड़ाई (इस स्थिति में यह 20 है)

तालिका 2.3 से माध्य निकालने की प्रत्यक्ष विधि में शामिल निम्नलिखित चरण निकाले जा सकते हैं:

(i) माध्य को 90 - 110 वर्ग में अभीत माना गया है। इसे श्रेणी के मध्य के निकटतम वर्ग से मानना सर्वोत्तम होता है, जिससे गणना की जटिलता न्यूनतम रहती है। तालिका 2.3 में A (अभीत माध्य) 100 है, जो वर्ग $90-110$ का मध्यबिंदु है।

(ii) पाँचवाँ स्तंभ (u) प्रत्येक वर्ग के मध्यबिंदु का अभीत माध्य वर्ग $(90-110)$ के मध्यबिंदु से विचलन दर्शाता है।

(iii) छठा स्तंभ प्रत्येक $f$ को संगत $d$ से गुणा करके प्राप्त $f d$ के मान दिखाता है। फिर $f d$ के धनात्मक तथा ऋणात्मक मानों को पृथक-पृथक जोड़ा जाता है और उनका निरपेक अंतर निकाला जाता है ($\sum f d$)। ध्यान दें कि $\sum f d$ से जुड़ा चिह्न सूत्र में A के बाद दिए गए $\pm$ के स्थान पर रखा जाता है।

अप्रत्यक्ष विधि से माध्य इस प्रकार निकाला जाता है:

$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A}\pm\frac{\sum\boldsymbol{f}\boldsymbol{d}}{\boldsymbol{N}}\ & =100 +\frac{260}{99}\ & =100 +2.6 \ & =102.6 \end{aligned} $$

नोट: अप्रत्यक्ष माध्य विधि समान तथा असमान वर्ग अंतराल दोनों के लिए कार्य करती है।

माध्यिका

माध्यिका एक स्थितीय औसत है। इसे “एक वितरण में उस बिंदु के रूप में परिभाषित किया जा सकता है जिसके दोनों ओर समान संख्या में प्रेक्षण हों”। माध्यिका को प्रतीक $\mathrm{M}$ द्वारा व्यक्त किया जाता है।

अग्रुपित आँकड़ों के लिए माध्यिका की गणना

जब अंक अग्रुपित हों, तो इन्हें आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। माध्यिका को व्यवस्थित श्रृंखला में केंद्रीय प्रेक्षण या मान को ढूँढकर निकाला जा सकता है। केंद्रीय मान को आरोही या अवरोही क्रम में व्यवस्थित श्रृंखला के किसी भी सिरे से स्थित किया जा सकता है। माध्यिका की गणना के लिए निम्नलिखित समीकरण का प्रयोग किया जाता है:

$\left(\frac{\mathrm{N}+1}{2}\right)$वाँ मान

उदाहरण 2.3: हिमालय के कुछ भागों में पर्वत शिखरों की माध्यिका ऊँचाई निम्नलिखित आँकड़ों से गणना करें:

$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$।

गणना: माध्यिका (M) को निम्नलिखित चरणों में गणना किया जा सकता है:

(i) दिए गए आँकड़ों को आरोही या अवरोही क्रम में व्यवस्थित करें।

(ii) श्रृंखला में केंद्रीय मान को खोजने के लिए सूत्र लगाएँ। इस प्रकार:

( $\frac{\mathrm{N}+1}{2}$ )वाँ मान

$=\left(\frac{7 +1}{2}\right)$वाँ मान

$=\left(\frac{8}{2}\right)$वाँ मान

व्यवस्थित श्रृंखला में 4वाँ मान माध्यिका होगा।

आँकड़ों को आरोही क्रम में व्यवस्थित करने पर -

7,$817; 8,076; 8,126; 8,172; 8,598; 8,611; 8,848$

अतः,

4वाँ मान

$$ \mathrm{M}=8,172 \mathrm{~m} $$

ग्रुपित आँकड़ों के लिए माध्यिका की गणना

जब अंकों को समूहीकृत किया जाता है, तो हमें उस बिंदु का मान ज्ञात करना होता है जहाँ कोई व्यक्ति या प्रेक्षण समूह के केंद्र में स्थित होता है। इसे निम्नलिखित सूत्र का उपयोग करके परिकलित किया जा सकता है:

$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$

जहाँ,

M = समूहीकृत आंकड़ों के लिए माध्यिका
l = माध्यिका वर्ग की निचली सीमा
i = अंतराल
f = माध्यिका वर्ग की आवृत्ति
N = आवृत्तियों की कुल संख्या या प्रेक्षणों की संख्या
c = पूर्व-माध्यिका वर्ग की संचयी आवृत्ति।

उदाहरण 2.4: निम्नलिखित बंटन के लिए माध्यिका की गणना करें:

वर्ग $50-60$ $60-70$ $70-80$ $80-90$ $90-100$ $100-110$
$\boldsymbol{f}$ 3 7 11 16 8 5

तालिका 2.4; माध्यिका की गणना

वर्ग आवृत्ति
(f)
संचयी
आवृत्ति (iv)
गणना
माध्यिका वर्ग की
$50-60$
$60-70$
$70-80$
$\mathbf{8 0 - 9 0}$
(माध्यिका समूह)
$90-100$
$100-110$
3
7
11
$16 \boldsymbol{f}$

8
5
5
3
10
$21 c$
$\mathbf{3 7}$
45
50
$M=\frac{N}{2}$
$=\frac{50}{4}$
$\sum_{\mathbf{N}=\mathbf{5 0}} f$ या

माध्यिका को नीचे दिए गए चरणों में परिकलित किया जाता है:

(i) आवृत्ति तालिका तालिका 2.4 के अनुसार तैयार की जाती है।

(ii) संचयी बारंबारताएँ (F) प्राप्त की जाती हैं क्रमागत अंतराल समूहों की प्रत्येक सामान्य बारंबारता को जोड़कर, जैसा कि सारणी 2.4 के स्तंभ 3 में दिया गया है।

(iii) माध्यिका संख्या प्राप्त की जाती है $\frac{N}{2}$ द्वारा अर्थात् $\frac{50}{2}=\mathbf{2 5}$ इस स्थिति में, जैसा कि सारणी 2.4 के स्तंभ 4 में दिखाया गया है।

(iv) संचयी बारंबारता बंटन (F) में ऊपर से नीचे की ओर तब तक गिनती करें जब तक $\frac{N}{2}$ से अगला बड़ा मान न प्राप्त हो जाए। इस उदाहरण में, $\frac{N}{2}$ 25 है, जो 40-44 की वर्ग अंतराल में आता है जिसकी संचयी बारंबारता 37 है, इस प्रकार पूर्व-माध्यिका वर्ग की संचयी बारंबारता 21 है और माध्यिका वर्ग की वास्तविक बारंबारता 16 है।

(v) फिर माध्यिका की गणना चरण 4 में निर्धारित सभी मानों को निम्न समीकरण में प्रतिस्थापित करके की जाती है:

$$ M=l+\frac{i}{f}(m-c) $$

$$ \begin{aligned} & =80 +\frac{10}{16}(25-21)\ & =80 +\frac{5}{8}\times 4 \ & =80 +\frac{5}{2}\ & =80 +2.5 \ M & =82.5 \end{aligned} $$

बहुलक

वह मान जो किसी बंटन में सर्वाधिक बार आता है बहुलक कहलाता है। इसे $\mathbf{Z}$ या $\mathbf{M}_{\mathbf{0}}$ द्वारा प्रतीकित किया जाता है। बहुलक एक ऐसा मापक है जिसका उपयोग माध्य और माध्यिका की तुलना में कम व्यापक रूप से किया जाता है। किसी दिए गए आंकड़ा समुच्चय में एक से अधिक प्रकार के बहुलक हो सकते हैं।

असमूहीकृत आंकड़ों के लिए बहुलक की गणना

जब दिए गए आंकड़ा समुच्चय से बहुलक की गणना की जाती है तो सभी मापकों को पहले आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। यह सबसे अधिक बार आने वाले मापक को आसानी से पहचानने में सहायता करता है।

उदाहरण 2.5: भूगोल में दस विद्यार्थियों के निम्नलिखित टेस्ट स्कोरों के लिए बहुलक की गणना करें:

$$ 61,10,88,37,61,72,55,61,46,22 $$

गणना: बहुलक ज्ञात करने के लिए मापों को आरोही क्रम में इस प्रकार व्यवस्थित किया जाता है:

$10,22,37,46,55,\mathbf{6 1},\mathbf{6 1},\mathbf{6 1}, 72,88$.

श्रेणी में तीन बार आने वाला माप 61 दिए गए डेटासेट का बहुलक है। चूँकि डेटासेट में कोई अन्य संख्या इसी प्रकार नहीं आती, इसलिए यह एकल-बहुलक (unimodal) होने का गुण रखता है।

उदाहरण 2.6: दस अन्य विद्यार्थियों के एक भिन्न नमूने, जिनके स्कोर हैं:

$82,11,57,82,08,11,82,95,41,11$,

का उपयोग कर बहुलक की गणना करें।

गणना: दिए गए मापों को आरोही क्रम में इस प्रकार व्यवस्थित करें:

$$ 08,11,11,11,41,57,82,82,82,95 $$

इसमें आसानी से देखा जा सकता है कि माप 11 और 82 दोनों ही वितरण में तीन-तीन बार आ रहे हैं। अतः डेटासेट द्वि-बहुलक (bimodal) प्रतीत होता है। यदि तीन मानों की समान और सर्वाधिक आवृत्ति हो, तो श्रेणी त्रि-बहुलक (trimodal) होती है। इसी प्रकार, श्रेणी में अनेक मापों की बार-बार आवृत्ति उसे बहु-बहुलक (multimodal) बनाती है। यद्यपि, जब श्रेणी में कोई भी माप दोहराया न जाए, तो उसे बिना बहुलक (without mode) कहा जाता है।

माध्य, माध्यिका और बहुलक की तुलना

केन्द्रीय प्रवृत्ति के तीनों मापकों की तुलना सामान्य वितरण वक्र की सहायता से आसानी से की जा सकती है। सामान्य वक्र एक आवृत्ति वितरण को दर्शाता है जिसमें अंकों का ग्राफ प्रायः घंटी-आकार का होता है। अनेक मानव लक्षण—जैसे बुद्धि, व्यक्तित्व अंक और विद्यार्थियों की उपलब्धियाँ—सामान्य वितरण रखते हैं। घंटी-आकार का वक्र इसलिए इस रूप का होता है क्योंकि यह सममित होता है; अन्य शब्दों में, अधिकांश प्रेक्षण मध्य मान के आसपास होते हैं। जैसे-जैसे चरम मानों की ओर बढ़ा जाता है, प्रेक्षणों की संख्या सममित रूप से घटती जाती है। एक सामान्य वक्र में डेटा का प्रसार अधिक या कम हो सकता है। सामान्य वितरण वक्र का एक उदाहरण चित्र 2.3 में दिया गया है।

चित्र 2.3; सामान्य वितरण वक्र

सामान्य वितरण का एक महत्त्वपूर्ण लक्षण यह है कि माध्य, माध्यिका और बहुलक एक ही अंक होते हैं (चित्र 2.3 में 100 अंक), क्योंकि सामान्य वितरण सममित होता है। सर्वाधिक आवृत्ति वाला अंक वितरण के ठीक मध्य में आता है और ठीक आधे अंक मध्य से ऊपर तथा आधे नीचे होते हैं। अधिकांश अंक वितरण के मध्य या माध्य के आसपास आते हैं। बहुत अधिक और बहुत कम अंक प्रायः नहीं आते, इसलिए उन्हें दुर्लभ माना जाता है।

यदि डेटा किसी प्रकार से विषम या विकृत हैं, तो माध्य, माध्यिका और बहुलक संपाती नहीं होंगे और विषम डेटा के प्रभाव पर विचार करने की आवश्यकता होगी (चित्र 2.4 और 2.5)।

चित्र 2.4; धनात्मक विषमता

चित्र 2.5: ऋणात्मक विषमता

अभ्यास

1. नीचे दिए गए चार विकल्पों में से सही उत्तर चुनें:

(i) केंद्रीय प्रवृत्ति का वह माप जो चरम मानों से प्रभावित नहीं होता:

(a) माध्य
(b) माध्य और बहुलक
(c) बहुलक
(d) माध्यिका

(ii) केंद्रीय प्रवृत्ति का वह माप जो किसी भी बंटन के उभार के साथ सदैव संपाती होता है:

(a) माध्यिका
(b) माध्यिका और बहुलक
(c) माध्य
(d) बहुलक

2. निम्नलिखित प्रश्नों के उत्तर लगभग 30 शब्दों में दें:

(i) माध्य की परिभाषा दें।
(ii) बहुलक के प्रयोग के क्या लाभ हैं?

3. निम्नलिखित प्रश्नों के उत्तर लगभग 125 शब्दों में दें:

(i) सामान्य बंटन और विषम बंटन में माध्य, माध्यिका और बहुलक के सापेक्ष स्थानों की व्याख्या चित्रों की सहायता से कीजिए।
(ii) माध्य, माध्यिका और बहुलक की प्रयोज्यता पर टिप्पणी कीजिए (संकेत; उनके गुणों और दोषों से)।

गतिविधि

1. भौगोलिक विश्लेषण पर लागू एक काल्पनिक उदाहरण लीजिए और असमूहीकृत आँकड़ों से माध्य निकालने की प्रत्यक्ष और अप्रत्यक्ष विधियों की व्याख्या कीजिए।