अध्याय 06 सहसंबंध

1. भूमिका

पिछले अध्यायों में आपने सीखा है कि बड़े पैमाने पर आँकड़ों से सारांश माप कैसे बनाए जाते हैं और समान चरों में होने वाले परिवर्तनों को कैसे देखा जाता है। अब आप सीखेंगे कि दो चरों के बीच संबंध की जाँच कैसे की जाती है। जैसे-जैसे गर्मी बढ़ती है, पहाड़ी स्थलों पर अधिक से अधिक पर्यटक आते हैं। आइसक्रीम की बिक्री तेज हो जाती है। इस प्रकार, तापमान आगंतुकों की संख्या और आइसक्रीम की बिक्री से संबंधित है। इसी तरह, जब आपके स्थानीय मंडी में टमाटर की आपूर्ति बढ़ती है, तो उसकी कीमत गिर जाती है। जब स्थानीय फसल बाजार में आने लगती है, तो टमाटर की कीमत ₹40 प्रति $\mathrm{kg}$ से घटकर ₹4 प्रति kg या उससे भी कम हो जाती है। इस प्रकार आपूर्ति मूल्य से संबंधित है। सहसंबंध विश्लेषण ऐसे संबंधों को व्यवस्थित रूप से जाँचने का एक साधन है। यह ऐसे प्रश्नों से संबंधित है:

  • क्या दो चरों के बीच कोई संबंध है?
  • क्या एक चर का मान बदलने पर दूसरे का मान भी बदलता है?
  • क्या दोनों चर एक ही दिशा में बढ़ते हैं?
  • संबंध कितना मजबूत है?

2. संबंधों के प्रकार

आइए विभिन्न प्रकार के संबंधों को देखें। मांग की मात्रा में हलचल और किसी वस्तु की कीमत के बीच संबंध मांग के सिद्धांत का एक अभिन्न हिस्सा है, जिसे आप कक्षा बारहवीं में पढ़ेंगे। कृषि उत्पादकता का कम होना कम वर्षा से संबंधित है। ऐसे संबंधों के उदाहरणों को कारण और प्रभाव की व्याख्या दी जा सकती है। अन्य केवल संयोग हो सकते हैं। किसी अभयारण्य में प्रवासी पक्षियों के आगमन और स्थानीय जन्म दर के बीच संबंध को कोई कारण और प्रभाव की व्याख्या नहीं दी जा सकती। ये संबंध केवल संयोग हैं। जूते के आकार और आपकी जेब में पैसों के बीच संबंध एक और ऐसा ही उदाहरण है। यदि संबंध मौजूद भी हैं, तो उन्हें समझाना कठिन है।

एक अन्य उदाहरण में, दो चरों पर किसी तीसरे चर का प्रभाव उन दोनों के बीच संबंध उत्पन्न कर सकता है। आइसक्रीम की तेज बिक्री डूबने से होने वाली मौतों की अधिक संख्या से संबंधित हो सकती है। पीड़ित आइसक्रीम खाने से नहीं डूबते। तापमान बढ़ने से आइसक्रीम की तेज बिकली होती है। इसके अलावा, गर्मी से बचने के लिए अधिक लोग तरणतालों में जाने लगते हैं। इससे डूबने से मौतों की संख्या बढ़ सकती है। इस प्रकार, आइसक्रीम की बिक्री और डूबने से मौतों के बीच उच्च सहसंबंध के पीछे तापमान है।

सहसंबंध क्या मापता है?

सहसंबंध चरों के बीच संबंध की दिशा और तीव्रता का अध्ययन और माप करता है। सहसंबंध सह-परिवर्तन को मापता है, कारण-कार्य संबंध को नहीं। सहसंबंध को कभी भी कारण और प्रभाव संबंध का संकेत मानने की गलती नहीं करनी चाहिए। दो चरों $\mathrm{X}$ और Y के बीच सहसंबंध की उपस्थिति का सीधा अर्थ यह है कि जब एक चर का मान एक दिशा में बदलता है, तो दूसरे चर का मान या तो उसी दिशा में (अर्थात् धनात्मक परिवर्तन) या विपरीत दिशा में (अर्थात् ऋणात्मक परिवर्तन) परंतु एक निश्चित तरीके से बदलता है। सरलता के लिए हम यह मान लेते हैं कि सहसंबंध, यदि मौजूद है, तो रैखिक है, अर्थात् दोनों चरों की सापेक्ष गति को ग्राफ पेपर पर एक सीधी रेखा खींचकर दर्शाया जा सकता है।

सहसंबंध के प्रकार

सहसंबंध को सामान्यतः ऋणात्मक और धनात्मक सहसंबंध में वर्गीकृत किया जाता है। सहसंबंध को धनात्मक कहा जाता है जब चर एक ही दिशा में साथ-साथ चलते हैं। जब आय बढ़ती है, खपत भी बढ़ती है। जब आय घटती है, खपत भी घटती है। आइसक्रीम की बिक्री और तापमान एक ही दिशा में चलते हैं। सहसंबंध ऋणात्मक होता है जब वे विपरीत दिशाओं में चलते हैं। जब सेब की कीमतें गिरती हैं तो इसकी मांग बढ़ती है। जब कीमतें बढ़ती हैं तो इसकी मांग घटती है। जब आप अध्ययन में अधिक समय बिताते हैं, तो आपके फेल होने की संभावना घटती है। जब आप अपनी पढ़ाई में कम घंटे बिताते हैं, तो कम अंक/ग्रेड प्राप्त करने की संभावना बढ़ती है। ये ऋणात्मक सहसंबंध के उदाहरण हैं। चर विपरीत दिशा में चलते हैं।

3. सहसंबंध मापने की तकनीकें

सहसंबंध का अध्ययन करने के लिए प्रयुक्त तीन महत्वपूर्ण उपकरण हैं: बिखरा हुआ आरेख, कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन की रैंक सहसंबंध।
एक बिखरा हुआ आरेख दृष्टिगत रूप से संबंध की प्रकृति को प्रस्तुत करता है बिना किसी विशिष्ट संख्यात्मक मान दिए। दो चरों के बीच रैखिक संबंध का संख्यात्मक माप कार्ल पियर्सन के सहसंबंध गुणांक द्वारा दिया जाता है। एक संबंध को रैखिक कहा जाता है यदि उसे एक सीधी रेखा द्वारा दर्शाया जा सकता है। स्पीयरमैन का सहसंबंध गुणांक उन रैंकों के बीच रैखिक संबंध मापता है जो व्यक्तिगत वस्तुओं को उनके गुणों के अनुसार दी जाती हैं। गुण वे चर होते हैं जिन्हें संख्यात्मक रूप से मापा नहीं जा सकता, जैसे लोगों की बुद्धि, शारीरिक सौंदर्य, ईमानदारी आदि।

बिखरा हुआ आरेख

बिखरा हुआ आरेख संबंध के रूप की दृष्टिगत जांच करने की एक उपयोगी तकनीक है, बिना किसी संख्यात्मक मान की गणना किए। इस तकनीक में, दो चरों के मानों को ग्राफ पेपर पर बिंदुओं के रूप में चित्रित किया जाता है। एक बिखरे हुए आरेख से संबंध की प्रकृति का काफी अच्छा अंदाजा लगाया जा सकता है। बिखरे हुए आरेख में बिखरे बिंदुओं की निकटता की डिग्री और उनकी समग्र दिशा हमें संबंध की जांच करने में सक्षम बनाती है। यदि सभी बिंदु एक रेखा पर स्थित हैं, तो सहसंबंध पूर्ण होता है और इसे एकता में कहा जाता है। यदि बिखरे बिंदु रेखा के चारों ओर व्यापक रूप से फैले हुए हैं, तो सहसंबंध कम होता है। यदि बिखरे बिंदु किसी रेखा के निकट या रेखा पर स्थित हैं, तो सहसंबंध को रैखिक कहा जाता है।

चित्र 6.1 से चित्र 6.5 तक फैले बिंदु आरेख हमें दो चरों के बीच संबंध की एक झलक देते हैं। चित्र 6.1 एक ऊपर की ओर उठती रेखा के आसपास बिंदुओं का प्रसरण दिखाता है, जिससे संकेत मिलता है कि चर एक ही दिशा में चल रहे हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ भी बढ़ता है। यह धनात्मक सहसंबंध है। चित्र 6.2 में बिंदु एक नीचे की ओर झुकती रेखा के आसपास प्रसरित पाए जाते हैं। इस बार चर विपरीत दिशा में चलते हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ घटता है और इसके विपरीत। यह ऋणात्मक सहसंबंध है। चित्र 6.3 में न तो ऊपर उठती और न ही नीचे झुकती कोई रेखा है जिसके आसपास बिंदु प्रसरित हों। यह असहसंबंध का उदाहरण है। चित्र 6.4 और चित्र 6.5 में बिंदु अब ऊपर उठती या नीचे गिरती रेखा के आसपास प्रसरित नहीं हैं; बिंदु स्वयं रेखाओं पर स्थित हैं। इन्हें क्रमशः पूर्ण धनात्मक सहसंबंध और पूर्ण ऋणात्मक सहसंबंध कहा जाता है।

गतिविधि

  • अपनी कक्षा के कक्षा $X$ के विद्यार्थियों की ऊँचाई, भार और किन्हीं दो विषयों में प्राप्त अंकों के आँकड़े एकत्र करें। इन चरों में से दो-दो को लेकर बिंदु आरेख बनाइए। आपको किस प्रकार का संबंध दिखाई देता है?

बिंदु आरेख का सावधानीपूर्वक अवलोकन संबंध की प्रकृति और तीव्रता का अनुमान देता है।

कार्ल पियर्सन का सहसंबंध गुणांक

इसे उत्पाद आघूर्ण सहसंबंध गुणांक या सरल सहसंबंध गुणांक भी कहा जाता है। यह दो चरों $\mathrm{X}$ और $Y$ के बीच रैखिक संबंध की डिग्री का एक सटीक संख्यात्मक मान देता है।

यह ध्यान देना महत्वपूर्ण है कि कार्ल पियर्सन का सहसंबंध गुणांक तभी प्रयोग किया जाना चाहिए जब चरों के बीच एक रैखिक संबंध हो। जब $\mathrm{X}$ और $\mathrm{Y}$ के बीच एक अरैखिक संबंध हो, तो कार्ल पियर्सन का सहसंबंध गुणांक गणना करना भ्रामक हो सकता है। इस प्रकार, यदि सच्चा संबंध रैखिक प्रकार का है जैसा कि आकृतियों 6.1, $6.2,6.4$ और 6.5 में दिखाए गए बिंदु आरेखों द्वारा प्रदर्शित है, तो कार्ल पियर्सन का सहसंबंध गुणांक गणना किया जाना चाहिए और यह हमें चरों के बीच संबंध की दिशा और तीव्रता बताएगा। लेकिन यदि सच्चा संबंध आकृतियों 6.6 या 6.7 में दिखाए गए बिंदु आरेखों के प्रकार का है, तो इसका अर्थ है कि $\mathrm{X}$ और $\mathrm{Y}$ के बीच एक अरैखिक संबंध है और हमें कार्ल पियर्सन के सहसंबंध गुणांक का प्रयोग करने का प्रयास नहीं करना चाहिए।

इसलिए, कार्ल पियर्सन के सहसंबंध गुणांक की गणना करने से पहले चरों के बीच संबंध के बिंदु आरेख की जांच करना उचित है।

मान लीजिए $X _{1}, X _{2},\ldots, X _{N}$ क्रमशः $X$ के $N$ मान हैं और $\mathrm{Y} _{1},\mathrm{Y} _{2},\ldots,\mathrm{Y} _{\mathrm{N}}$ क्रमशः Y के संगत मान हैं। आगे की प्रस्तुतियों में सरलता के लिए इकाई को दर्शाने वाले अधोलेख हटा दिए गए हैं। $\mathrm{X}$ और $\mathrm{Y}$ के समांतर माध्य इस प्रकार परिभाषित हैं

$$ \overline{\mathrm{X}}=\frac{\sum\mathrm{X}}{\mathrm{N}};\quad\overline{\mathrm{Y}}=\frac{\sum\mathrm{Y}}{\mathrm{N}} $$

और उनके प्रसरण इस प्रकार हैं

$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$

और $$\quad\sigma^{2}\mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum\mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$

$\mathrm{X}$ और $\mathrm{Y}$ के मानक विचलन क्रमशः उनके प्रसरणों के धनात्मक वर्गमूल हैं। $\mathrm{X}$ और $\mathrm{Y}$ का सहप्रसरण इस प्रकार परिभाषित है

$\operatorname{Cov}(\mathrm{X},\mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum\mathrm{xy}}{\mathrm{N}}$

जहाँ $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ और $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के $i^{\text {वें }}$ मान के उनके माध्य मानों से विचलन हैं।

$\mathrm{X}$ और $\mathrm{Y}$ के बीच कोवेरिएंस का चिह्न सहसंबंध गुणांक के चिह्न को निर्धारित करता है। मानक विचलन सदैव धनात्मक होते हैं। यदि कोवेरिएंस शून्य हो, तो सहसंबंध गुणांक सदैव शून्य होता है। उत्पाद आघूर्ण सहसंबंध या कार्ल पियर्सन का सहसंबंध माप निम्न द्वारा दिया जाता है

$$ \begin{equation*} \mathrm{r}={ }^{\Sigma\mathrm{xy}} / N\sigma _{\mathrm{x}}\sigma _{\mathrm{y}}\tag{1} \end{equation*} $$

या

$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}}\sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}}\tag{2} \end{equation*} $$

या

$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}}\sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$

या

$$ \begin{equation*} r=\frac{N\sum XY-(\sum X)(\sum Y)}{\sqrt{N\sum X^2-(\sum X)^2}\cdot\sqrt{N\sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$

सहसंबंध गुणांक के गुण

आइए अब सहसंबंध गुणांक के गुणों पर चर्चा करें

  • $r$ की कोई इकाई नहीं होती। यह एक शुद्ध संख्या है। इसका अर्थ है कि माप की इकाइयाँ $r$ का हिस्सा नहीं होतीं। उदाहरण के लिए, फुट में ऊँचाई और किलोग्राम में वजन के बीच $r$ का मान 0.7 हो सकता है।
  • $r$ का ऋणात्मक मान एक व्युत्क्रम संबंध को दर्शाता है। एक चर में परिवर्तन दूसरे चर में विपरीत दिशा में परिवर्तन से जुड़ा होता है। जब किसी वस्तु की कीमत बढ़ती है, तो उसकी मांग घट जाती है। जब ब्याज दर बढ़ती है, तो धन की मांग भी घट जाती है, क्योंकि अब धन महँगा हो गया है।
  • यदि $r$ धनात्मक है, तो दोनों चर एक ही दिशा में चलते हैं। जब चाय के प्रतिस्थापक कॉफी की कीमत बढ़ती है, तो चाय की मांग भी बढ़ जाती है। सिंचाई की सुविधाओं में सुधार उच्च पैदावार से जुड़ा होता है। जब तापमान बढ़ता है, तो आइसक्रीम की बिक्री तेज हो जाती है।
  • सहसंबंध गुणांक का मान ऋण एक और धन एक के बीच होता है, $-1 \leq r\leq 1$। यदि किसी अभ्यास में $r$ का मान इस सीमा से बाहर हो, तो यह गणना में त्रुटि को दर्शाता है।
  • $r$ का परिमाण मूल बिंदु परिवर्तन और पैमाना परिवर्तन से अप्रभावित रहता है। दो चर $\mathrm{X}$ और $\mathrm{Y}$ लेते हुए, दो नए चर परिभाषित करते हैं।

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}};\mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जहाँ $A$ और $C$ को क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के माना गया माध्य हैं। $\mathrm{B}$ और $\mathrm{D}$ सामान्य गुणनखंड हैं और एक ही चिह्न के हैं। तब

$r _{x y}=r _{u v}$

यह गुण सहसंबंध गुणांक को अत्यंत सरल तरीके से गणना करने के लिए प्रयोग किया जाता है, जैसे कि पद विचलन विधि में।

  • यदि $r=0$ है तो दो चर असहसंबद्ध हैं। उनके बीच कोई रैखिक संबंध नहीं है। हालांकि अन्य प्रकार के संबंध हो सकते हैं।
  • यदि $r=1$ या $r=-1$ है तो सहसंबंध पूर्ण है और सटीक रैखिक संबंध है।
  • $r$ का उच्च मान प्रबल रैखिक संबंध को दर्शाता है। इसका मान उच्च कहा जाता है जब यह +1 या -1 के निकट होता है।
  • $r$ का निम्न मान (शून्य के निकट) एक दुर्बल रैखिक संबंध को दर्शाता है। लेकिन एक अरैखिक संबंध हो सकता है।

जैसा कि आपने अध्याय 1 में पढ़ा है, सांख्यिकीय विधियाँ सामान्य बुद्धि का विकल्प नहीं हैं। यहाँ एक और उदाहरण है, जो सहसंबंध की गणना और व्याख्या करने से पहले डेटा को ठीक से समझने की आवश्यकता को रेखांकित करता है। कुछ गाँवों में एक महामारी फैलती है और सरकार प्रभावित गाँवों में डॉक्टरों की एक टीम भेजती है। गाँवों में भेजे गए डॉक्टरों की संख्या और मौतों की संख्या के बीच सहसंबंध सकारात्मक पाया गया है। सामान्यतः, डॉक्टरों द्वारा दी जाने वाली स्वास्थ्य सेवाओं से मौतों की संख्या में कमी आने की अपेक्षा होती है, जो एक ऋणात्मक सहसंबंध दिखाती है। यह अन्य कारणों से हुआ है। डेटा एक विशिष्ट समय अवधि से संबंधित है। रिपोर्ट की गई कई मौतें ऐसी अंतिम अवस्था की हो सकती हैं जहाँ डॉक्टर कुछ नहीं कर सकते थे। इसके अतिरिक्त, डॉक्टरों की उपस्थिति का लाभ कुछ समय बाद ही दिखाई देता है। यह भी संभव है कि रिपोर्ट की गई मौतें महामारी के कारण न हों। एक सुनामी अचानक राज्य में आती है और मृतकों की संख्या बढ़ जाती है।

आइए किसानों की स्कूली शिक्षा के वर्षों और प्रति एकड़ वार्षिक उपज के बीच संबंध की जाँच करके $r$ की गणना को दर्शाएँ।

उदाहरण 1

किसानों की स्कूली शिक्षा के वर्षों की संख्या वार्षिक उपज प्रति एकड़ ‘Ooo (रु) में
0 4
2 4
4 6
6 10
8 10
10 8
12 7

सूत्र 1 को $\sum\mathrm{Xy},\sigma _{\mathrm{x}},\sigma _{\mathrm{y}}$ का मान चाहिए

तालिका 6.1 से हमें प्राप्त होता है,

$$ \begin{aligned} &\sum\mathrm{xy}=42,\\ &\sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}},\\ &\sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$

इन मानों को सूत्र (1) में रखने पर

$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}}\sqrt{\frac{38}{7}}}=0.644 $$

वही मान सूत्र (2) से भी प्राप्त किया जा सकता है।

$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}\sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}}\tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112}\sqrt{38}}=0.644 \end{gather*} $$

इस प्रकार, किसानों की शिक्षा के वर्ष और प्रति एकड़ वार्षिक उत्पादन सकारात्मक रूप से सहसंबद्ध हैं। $r$ का मान भी बड़ा है। इसका तात्पर्य है कि किसान जितने अधिक वर्ष शिक्षा में निवेश करते हैं, प्रति एकड़ उत्पादन उतना ही अधिक होगा। यह किसानों की शिक्षा के महत्व को रेखांकित करता है।

सूत्र (3) का उपयोग करने के लिए

TABLE 6.1 किसानों की स्कूली शिक्षा के वर्षों और वार्षिक उत्पादन के बीच r की गणना

शिक्षा के वर्ष (X) $(X-\bar{X})$ $(X-\bar{X})^{2}$ एकड़ प्रति वार्षिक उत्पादन ‘000 रु में (Y) $(Y-\bar{Y})$ $(Y-\bar{Y})^{2}$ $(X-\bar{X})(Y-\bar{Y})$
0 -6 36 4 -3 9 18
2 -4 16 4 -3 9 12
4 -2 4 6 -1 1 2
6 0 0 10 3 9 0
8 2 4 10 3 9 6
10 4 16 8 1 1 4
12 6 36 7 0 0 0
$\Sigma X=42$ $\sum (X-\overline{\mathrm{X}})^{2}=112$ $\Sigma Y=49$ $\Sigma(Y-\bar{Y})^{2}=38$ $\Sigma(X-\bar{X})(Y-\bar{Y})=42$

$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}}\sqrt{\Sigma\mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$

निम्नलिखित व्यंजकों के मानों की गणना करनी है अर्थात्

$\Sigma\mathrm{XY},\Sigma\mathrm{X}^{2},\Sigma\mathrm{Y}^{2}$.

अब $r$ का मान प्राप्त करने के लिए सूत्र (3) लगाएँ।

$r$ के विभिन्न मानों की व्याख्या जानते हैं। अंग्रेज़ी और सांख्यिकी में प्राप्त अंकों के बीच सहसंबंध गुणांक, मान लीजिए, 0.1 है। इसका अर्थ है कि यद्यपि दोनों विषयों में प्राप्त अंक सकारात्मक रूप से सहसंबद्ध हैं, संबंध की ताकत कमज़ोर है। अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी सांख्यिकी में अपेक्षाकृत कम अंक प्राप्त कर सकते हैं। यदि $r$ का मान, मान लीजिए, 0.9 होता, तो अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी निश्चित रूप से सांख्यिकी में भी अधिक अंक प्राप्त करते।

ऋणात्मक सहसंबंध का एक उदाहरण स्थानीय मंडी में सब्जियों के आगमन और सब्जियों की कीमत के बीच का संबंध है। यदि $r$ -0.9 है, तो स्थानीय मंडी में सब्जी की आपूर्ति के साथ सब्जियों की कीमत कम होगी। यदि यह -0.1 होता, तो बड़ी मात्रा में सब्जी की आपूर्ति के साथ कीमत कम होती, लेकिन उतनी कम नहीं जितनी तब होती जब $r$ -0.9 होता है। कीमत में गिरावट की सीमा $r$ के परम मान पर निर्भर करती है। यदि यह शून्य होता, तो बाजार में बड़ी आपूर्ति के बाद भी कीमत में कोई गिरावट नहीं आती। यह संभावना भी तब होती है जब आपूर्ति में वृद्धि को अन्य बाजारों में स्थानांतरित करने वाले एक अच्छे परिवहन नेटवर्क द्वारा संभाल लिया जाता है।

गतिविधि

  • निम्नलिखित सारणी को देखें। चालू कीमत पर राष्ट्रीय आय की वार्षिक वृद्धि और सकल घरेलू बचत (जीडीपी के प्रतिशत के रूप में) के बीच $r$ की गणना करें।

सहसंबंध गुणांक की गणना करने की चरण विचलन विधि।

जब चरों के मान बड़े होते हैं, तो गणना के बोझ को काफी कम किया जा सकता है $r$ के एक गुण का उपयोग करके। यह है कि $r$ मूल और स्केल में परिवर्तन से स्वतंत्र होता है। इसे चरण विचलन विधि भी कहा जाता है। इसमें चरों $\mathrm{X}$ और $\mathrm{Y}$ का निम्नलिखित रूप में रूपांतरण शामिल होता है:

**TABLE 6.2 **

वर्ष राष्ट्रीय आय की वार्षिक वृद्धि सकल घरेलू बचत जीडीपी के प्रतिशत के रूप में
1992-93 14 24
1993-94 17 23
1994-95 18 26
1995-96 17 27
1996-97 16 25
1997-98 12 25
1998-99 16 23
1999-00 11 25
2000-01 8 24
2001-02 10 23

स्रोत: आर्थिक सर्वेक्षण, (2004-05) पृ. 8,9

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}};\mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जहाँ $A$ और $B$ माना गया माध्य हैं, $h$ और $\mathrm{k}$ सामान्य गुणनखंड हैं और समान चिह्न रखते हैं।

तब $\mathrm{r} _{\mathrm{uv}}=\mathrm{r} _{\mathrm{XY}}$

इसे मूल्य सूचकांक और मुद्रा आपूर्ति के बीच सहसंबंध का विश्लेषण करने के अभ्यास से दर्शाया जा सकता है।

उदाहरण 2

मूल्य सूचकांक $(\mathrm{X})$ $ 120 \quad 150 \quad 190 \quad 220 \quad 230$

मुद्रा आपूर्ति रुपये करोड़ में $(\mathrm{Y})$ $\quad 1800 \quad 2000 \quad 2500 \quad 2700 \quad 3000$

सरलीकरण, चरण विचलन विधि का उपयोग करते हुए नीचे दर्शाया गया है। मान लीजिए $\mathrm{A}=100;\mathrm{h}=10;\mathrm{B}=1700$ और $\mathrm{k}=100$

रूपांतरित चरों की सारणी इस प्रकार है:

मूल्य सूचकांक और मुद्रा आपूर्ति के बीच $r$ की गणना चरण विचलन विधि का उपयोग कर

**सारणी 6.3 **

$U$ $V$
$\left(\frac{\mathrm{x}-100}{10}\right)$ $\left(\frac{\mathrm{y}-1700}{100}\right)$ $U^{2}$ $V^{2}$ $U V$
2 1 4 1 2
5 3 25 9 15
9 8 81 64 72
12 10 144 100 120
13 13 169 169 169

$\Sigma\mathrm{U}=41;\Sigma\mathrm{U}=35;\Sigma\mathrm{U}^{2}=423;$ $\Sigma\mathrm{V}^{2}=343;\Sigma\mathrm{UV}=378$

इन मानों को सूत्र (3) में रखने पर

$$ \begin{aligned} &\mathrm{r}=\frac{\Sigma\mathrm{UV}-\frac{(\Sigma\mathrm{U})(\Sigma\mathrm{U})}{\mathrm{N}}}{\sqrt{\Sigma\mathrm{U}^{2}-\frac{(\Sigma\mathrm{U})^{2}}{\mathrm{~N}}}\sqrt{\Sigma\mathrm{V}^{2}-\frac{(\Sigma\mathrm{V})^{2}}{\mathrm{~N}}}}…(3) \end{aligned} $$

$$=\frac{378-\frac{41 \times 35}{5}}{\sqrt{423-\frac{(41)^2}{5}}\sqrt{343-\frac{(35)^2}{5}}}$$

$$ \begin{aligned} & =0.98 \end{aligned} $$

मूल्य सूचकांक और मुद्रा आपूर्ति के बीच मजबूत सकारात्मक सहसंबंध मौद्रिक नीति का एक महत्वपूर्ण आधार है। जब मुद्रा आपूर्ति बढ़ती है तो मूल्य सूचकांक भी बढ़ता है।

गतिविधि

  • भारत की जनसंख्या और राष्ट्रीय आय से संबंधित आंकड़ों का उपयोग करते हुए, चरण विचलन विधि का उपयोग करके उनके बीच सहसंबंध की गणना करें।

स्पीयरमैन का रैंक सहसंबंध

स्पीयरमैन का रैंक सहसंबंध ब्रिटिश मनोवैज्ञानिक सी. ई. स्पीयरमैन द्वारा विकसित किया गया था। इसका उपयोग निम्नलिखित स्थितियों में किया जाता है:

  1. मान लीजिए हम किसी दूरदराज़ गाँव के विद्यार्थियों की ऊँचाई और वज़न के बीच सहसंबंध का आकलन करने का प्रयास कर रहे हैं, जहाँ न तो मापने वाली छड़ें हैं और न ही तोलने वाली मशीनें। ऐसी स्थिति में हम ऊँचाई या वज़न को माप नहीं सकते, पर हम विद्यार्थियों को वज़न और ऊँचाई के अनुसार क्रमित अवश्य कर सकते हैं। इन क्रमों का उपयोग करके स्पीयरमैन का क्रम सहसंबंध गुणांक परिकलित किया जा सकता है।

  2. मान लीजिए हम ऐसी चीज़ों से निपट रहे हैं जैसे निष्पक्षता, ईमानदारी या सौंदर्य। इन्हें उसी तरह मापा नहीं जा सकता जैसे हम आय, वज़न या ऊँचाई को मापते हैं। अधिकतम इन्हें सापेक्ष रूप से मापा जा सकता है, उदाहरण के लिए हम लोगों को सौंदर्य के अनुसार क्रमित कर सकते हैं (कुछ लोग तर्क देंगे कि यह भी संभव नहीं है क्योंकि सौंदर्य के मानदंड और मापदंड व्यक्ति से व्यक्ति और संस्कृति से संस्कृति भिन्न हो सकते हैं)। यदि हम चरों के बीच संबंध ज्ञात करना चाहें, जिनमें से कम-से-कम एक इस प्रकार का हो, तो स्पीयरमैन का क्रम सहसंबंध गुणांक प्रयुक्त किया जाता है।

  3. स्पीयरमैन का क्रम सहसंबंध गुणांक कुछ ऐसे मामलों में प्रयुक्त किया जा सकता है जहाँ संबंध की दिशा स्पष्ट हो पर वह रैखिक न हो, जैसा कि आकृति 6.6 और 6.7 में दिखाए गए प्रकार के बिखर आरेखों में प्रकट होता है।

  4. स्पीयरमैन का सहसंबंध गुणांक चरम मानों से प्रभावित नहीं होता। इस दृष्टि से यह कार्ल पियर्सन के सहसंबंध गुणांक से बेहतर है। इस प्रकार यदि आँकड़ों में कुछ चरम मान हों, तो स्पीयरमैन का सहसंबंध गुणांक अत्यंत उपयोगी हो सकता है।

रैंक सहसंबंध गुणांक और सरल सहसंबंध गुणांक की व्याख्या समान होती है। इसका सूत्र सरल सहसंबंध गुणांक से व्युत्पन्न किया गया है जहाँ व्यक्तिगत मानों को रैंकों से प्रतिस्थापित किया गया है। ये रैंक सहसंबंध की गणना के लिए उपयोग किए जाते हैं। यह गुणांक इन इकाइयों को दी गई रैंकों के बीच रैखिक संघनन का माप प्रदान करता है, न कि उनके मानों का। स्पीयरमैन का रैंक सहसंबंध सूत्र है

$$ \begin{equation*} r _{a}=1-\frac{6 \sum D^{2}}{n^{3}-n}\tag{4} \end{equation*} $$

जहाँ $n$ प्रेक्षणों की संख्या है और $\mathrm{D}$ एक चर को दी गई रैंकों से दूसरे चर को दी गई रैंकों का विचलन है।

सरल सहसंबंध गुणांक के सभी गुण यहाँ लागू होते हैं। पीर्सोनियन सहसंबंध गुणांक की तरह यह 1 और -1 के बीच होता है। हालाँकि, आमतौर पर यह सामान्य विधि जितना सटीक नहीं होता है। यह इस तथ्य के कारण है कि डेटा से संबंधित सभी जानकारी का उपयोग नहीं किया जाता है।

पहला अंतर क्रमागत मानों का अंतर होता है। श्रेणी में आइटमों के मानों के पहले अंतर, जिन्हें परिमाण के क्रम में व्यवस्थित किया गया है, लगभग कभी भी नियत नहीं होते हैं। आमतौर पर डेटा केंद्रीय मानों के आसपास समूहित होते हैं जहाँ सरणी के मध्य में छोटे अंतर होते हैं।

यदि पहले अंतर नियत होते, तो $r$ और $r _{\mathrm{k}}$ समान परिणाम देंगे। सामान्यतः $r _{\mathrm{k}}$ $r$ से कम या बराबर होता है।

रैंक सहसंबंध गुणांक की गणना

रैंक सहसंबंध की गणना तीन परिस्थितियों में दिखाई जाएगी।

  1. रैंक दी गई हैं।
  2. रैंक नहीं दी गई हैं। उन्हें आंकड़ों से निकालना होगा।
  3. रैंक दोहराई गई हैं।

स्थिति 1; जब रैंक दी गई हों

उदाहरण 3

एक सौंदर्य प्रतियोगिता में पाँच व्यक्तियों का मूल्यांकन तीन न्यायाधीशों द्वारा किया गया है। हमें यह पता लगाना है कि न्यायाधीशों का कौन-सा युग्म सौंदर्य की सामान्य धारणा के प्रति सबसे निकट दृष्टिकोण रखता है।

प्रतियोगी

Judge 1 2 3 4 5
A 1 2 3 4 5
B 2 4 1 5 3
C 1 3 5 2 4

न्यायाधीशों के तीन युग्म हैं, जिनके लिए रैंक सहसंबंध तीन बार गिनना होगा। सूत्र (4) का प्रयोग किया जाएगा।

$$ \begin{equation*} \mathrm{r} _{\mathrm{s}}=1-\frac{6 \Sigma\mathrm{D}^{2}}{\mathrm{n}^{3}-\mathrm{n}}\tag{4} \end{equation*} $$

A और B के बीच रैंक सहसंबंध इस प्रकार गिना जाता है:

$A$ $B$ $D$ $D^{2}$
1 2 -1 1
2 4 -2 4
3 1 2 4
4 5 -1 1
5 3 2 4
Total 14

इन मानों को सूत्र (4) में रखने पर

$$ \begin{equation*} r _{s}=1-\frac{6 \Sigma D^{2}}{n^{3}-n}\tag{4} \end{equation*} $$

$=1-\frac{6 \times 14}{5^{3}-5}=1-\frac{84}{120}=1-0.7 =0.3$

A और $\mathrm{C}$ के बीच रैंक सहसंबंध इस प्रकार गिना जाता है:

$A$ $C$ $D$ $D^{2}$
1 1 0 0
2 3 -1 1
3 5 -2 4
4 2 2 4
5 4 1 1
कुल 10

इन मानों को सूत्र (4) में प्रतिस्थापित करने पर रैंक सहसंबंध 0.5 है। इसी प्रकार, न्यायाधीशों $\mathrm{B}$ और $\mathrm{C}$ की रैंकिंग के बीच रैंक सहसंबंध 0.9 है। इस प्रकार, न्यायाधीशों $A$ और $C$ की धारणाएं सबसे निकटतम हैं। न्यायाधीशों B और C के स्वाद बहुत भिन्न हैं।

केस 2; जब रैंक नहीं दी गई हैं

**उदाहरण 4 **

हमें 5 छात्रों द्वारा अर्थशास्त्र और सांख्यिकी में प्राप्त किए गए अंकों का प्रतिशत दिया गया है। फिर रैंकिंग निकालनी होगी और रैंक सहसंबंध की गणना करनी होगी।

छात्र सांख्यिकी में
अंक
(X)
अर्थशास्त्र में
अंक
(Y)
A 85 60
B 60 48
C 55 49
D 65 50
E 75 55

छात्र सांख्यिकी में
रैंकिंग
$\left(R _{x}\right)$
अर्थशास्त्र में
रैंकिंग
$\left(R _{\gamma}\right)$
A 1 1
B 4 5
C 5 4
D 3 3
E 2 2

एक बार रैंकिंग पूरी हो जाने पर रैंक सहसंबंध की गणना के लिए सूत्र (4) का उपयोग किया जाता है।

केस 3; जब रैंक दोहराई गई हैं और रैंक नहीं दी गई हैं

**उदाहरण 5 **

मान $\mathrm{X}$ और $\mathrm{Y}$ निम्नलिखित रूप में दिए गए हैं

$X$ $Y$
1200 75
1150 65
1000 50
990 100
800 90
780 85
760 90
750 40
730 50
700 60
620 50
600 75

रैंक सहसंबंध निकालने के लिए, मानों की रैंक निकाली जाती हैं। दोहराए गए मदों को सामान्य रैंक दी जाती हैं। सामान्य रैंक वह औसत रैंक होता है जो उन मदों को मिलता यदि वे एक-दूसरे से थोड़े भिन्न होते। अगली मद को वह रैंक दिया जाता है जो पहले से तय रैंक के ठीक बाद आता है।

यहाँ $Y$ का मान 50 है 9वें, 10वें और 11वें स्थान पर। इसलिए तीनों को औसत रैंक अर्थात् 10 दिया गया,

Rank of $X$ Rank of $Y$ Deviation
in Ranks
$D^{2}$
1 5.5 -4.5 20.25
2 7 -5 25.00
3 10 -7 49.00
4 1 3 9.00
5 2.5 2.5 6.25
6 4 2 4.00
7 2.5 4.5 20.25
8 12 -4 16.00
9 10 -1 1.00
10 8 2 4.00
11 10 1 1.00
12 5.5 6.5 42.25
198.00

जब रैंक दोहराई जाती हैं तो स्पीयरमैन का रैंक सहसंबंध गुणांक निम्न सूत्र से निकाला जाता है

$$ \begin{aligned} &\mathrm{r} _{\mathrm{s}}=1-\\frac{6 \left[\Sigma\mathrm{D}^{2}+\frac{\left(\mathrm{m} _{1}^{3}-\mathrm{m} _{1}\right)}{12}+\frac{\left(\mathrm{m} _{2}^{3}-\mathrm{m} _{2}\right)}{12}+\ldots\right]}{n\left(\mathrm{n}^{2}-1 \right)} \end{aligned} $$

जहाँ $\mathrm{m} _{1},\mathrm{~m} _{2},\ldots$, रैंकों की बार-बार आने वाली संख्याएँ हैं और $\frac{\mathrm{m}^{3}{ } _{1}-\mathrm{m} _{1}}{12}\ldots$, उनके संगत संशोधन गुणांक। इस आँकड़े के लिए आवश्यक संशोधन इस प्रकार है

$\frac{3^{3}-3}{12}+\frac{2^{3}-2}{12}=\frac{30}{12}=2.5$

इन व्यंजकों के मान प्रतिस्थापित करने पर

$r _{s}=1-\frac{6(198 +2.5)}{12^{3}-12}=(1-0.70)=0.30$

इस प्रकार, $\mathrm{X}$ और $\mathrm{Y}$ के बीच धनात्मक रैंक सहसंबंध है। $\mathrm{X}$ और $\mathrm{Y}$ दोनों एक ही दिशा में चलते हैं। हालाँकि, इस संबंध को प्रबल नहीं कहा जा सकता।

गतिविधि

  • कक्षा IX और X की परीक्षाओं में अपने 10 सहपाठियों द्वारा प्राप्त अंकों के आँकड़े इकट्ठा करें। उनके बीच रैंक सहसंबंध गुणांक की गणना करें। यदि आपके आँकड़ों में कोई पुनरावृत्ति नहीं है, तो पुनरावृत्त रैंक वाले आँकड़े लेकर यह अभ्यास दोहराएँ। ऐसी क्या परिस्थितियाँ हैं जिनमें रैंक सहसंबंध गुणांक को साधारण सहसंबंध गुणांक से अधिक पसंद किया जाता है? यदि आँकड़े सटीक रूप से मापे गए हों, तो क्या आप फिर भी रैंक सहसंबंध गुणांक को साधारण सहसंबंध गुणांक से अधिक पसंद करेंगे? आप कब इस चयन के प्रति उदासीन रह सकते हैं? कक्षा में चर्चा करें।

4. निष्कर्ष

हमने दो चरों के बीच संबंध, विशेष रूप से रैखिक संबंध का अध्ययन करने की कुछ तकनीकों पर चर्चा की है। बिखरा हुआ आरेख संबंध की दृश्य प्रस्तुति देता है और यह केवल रैखिक संबंधों तक सीमित नहीं होता है। कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन की रैंक सहसंबंध चरों के बीच रैखिक संबंध को मापते हैं। जब चरों को सटीक रूप से मापा नहीं जा सकता है, तब रैंक सहसंबंध का उपयोग किया जा सकता है। ये माप हालांकि कारण-प्रभाव नहीं दर्शाते हैं। सहसंबंध का ज्ञान हमें इस बात की जानकारी देता है कि जब सहसंबंधित चर बदलता है तो किसी चर में परिवर्तन की दिशा और तीव्रता क्या होती है।

सारांश

  • सहसंबंध विश्लेषण दो चरों के बीच संबंध का अध्ययन करता है।
  • बिखरे हुए आरेख दो चरों के बीच संबंध की प्रकृति की दृश्य प्रस्तुति देते हैं।
  • कार्ल पियर्सन का सहसंबंध गुणांक $r$ केवल दो चरों के बीच रैखिक संबंध को संख्यात्मक रूप से मापता है। r का मान -1 और 1 के बीच होता है।
  • जब चरों को सटीक रूप से मापा नहीं जा सकता है तब स्पीयरमैन की रैंक सहसंबंध का उपयोग करके रैखिक संबंध को संख्यात्मक रूप से मापा जा सकता है।
  • दोहरी रैंकों के लिए सुधार गुणांक की आवश्यकता होती है।
  • सहसंबंध का अर्थ कारण-प्रभाव नहीं होता है। इसका अर्थ केवल सह-परिवर्तन होता है।

अभ्यास

1. ऊंचाई (फीट में) और वजन (किलोग्राम में) के बीच सहसंबंध गुणांक की इकाई है

(i) $\mathrm{kg} /$ feet

(ii) प्रतिशत

(iii) अस्तित्वहीन

2. सरल सहसंबंध गुणांक की सीमा है

(i) 0 से अनंत

(ii) माइनस वन से प्लस वन

(iii) माइनस अनंत से अनंत

3. यदि $r _{x y}$ धनात्मक है तो $X$ और $Y$ के बीच संबंध इस प्रकार का होता है

(i) जब $\mathrm{Y}$ बढ़ता है तो $\mathrm{X}$ बढ़ता है

(ii) जब $Y$ घटता है तो $X$ बढ़ता है

(iii) जब $\mathrm{Y}$ बढ़ता है तो $\mathrm{X}$ नहीं बदलता

4. यदि $r _{x y}=0$ है तो चर $X$ और $Y$ हैं

(i) रेखीय रूप से संबंधित

(ii) रेखीय रूप से संबंधित नहीं

(iii) स्वतंत्र

5. निम्नलिखित तीन मापों में से कौन-सा किसी भी प्रकार के संबंध को माप सकता है

(i) कार्ल पियर्सन का सहसंबंध गुणांक

(ii) स्पीयरमैन की क्रम सहसंबंध

(iii) बिखरा हुआ आरेख

6. यदि सटीक मापे गए आंकड़े उपलब्ध हों तो सरल सहसंबंध गुणांक होता है

(i) क्रम सहसंबंध गुणांक से अधिक सटीक

(ii) क्रम सहसंबंध गुणांक से कम सटीक

(iii) क्रम सहसंबंध गुणांक जितना ही सटीक

7. $\mathrm{r}$ को सहयोग के माप के रूप में सहप्रसरण से क्यों प्राथमिकता दी जाती है?

8. क्या $r$ आंकड़ों के प्रकार के आधार पर -1 और 1 की सीमा के बाहर हो सकता है?

9. क्या सहसंबंध कारण-प्रभाव को दर्शाता है?

10. कब क्रम सहसंबंध सरल सहसंबंध गुणांक से अधिक सटीक होता है?

11. क्या शून्य सहसंबंध का अर्थ स्वतंत्रता होता है?

12. क्या सरल सहसंबंध गुणांक किसी भी प्रकार के संबंध को माप सकता है?

13. एक सप्ताह तक हर दिन अपने स्थानीय बाज़ार से पाँच सब्जियों के दाम इकट्ठा करें। उनके सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।

14. अपने सहपाठियों की ऊँचाई मापें। उनसे उनके बेंचमेट की ऊँचाई पूछें। इन दो चरों के बीच सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।

15. कुछ ऐसे चरों की सूची बनाएँ जिनका सटीक माप करना कठिन होता है।

16. $r$ के मानों 1, -1 और 0 की व्याख्या करें।

17. रैंक सहसंबंध गुणांक पीरसोनियन सहसंबंध गुणांक से क्यों भिन्न होता है?

18. पिताओं की ऊँचाई इंच में $(\mathrm{X})$ और उनके पुत्रों की ऊँचाई $(\mathrm{Y})$ के बीच सहसंबंध गुणांक की गणना करें

$\begin{array}{lllllllll}\mathrm{X} & 65 & 66 & 57 & 67 & 68 & 69 & 70 & 72 \end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 67 & 56 & 65 & 68 & 72 & 72 & 69 & 71 &\end{array}$

(उत्तर $\mathrm{r}=0.603$ )

19. $X$ और $Y$ के बीच सहसंबंध गुणांक की गणना करें और उनके संबंध पर टिप्पणी करें:

$\begin{array}{lllllllll}\mathrm{X} & -3 & -2 & -1 & 1 & 2 & 3 \end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 9 & 4 & 1 & 1 & 4 & 9 \end{array}$

(उत्तर $\mathrm{r}=0$ )

20. $\mathrm{X}$ और $\mathrm{Y}$ के बीच सहसंबंध गुणांक की गणना करें और उनके संबंध पर टिप्पणी करें

$\begin{array}{lllllllll}\mathrm{X} & 1 & 3 & 4 & 5 & 7 & 8 \end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 2 & 6 & 8 & 10 & 14 & 16 \end{array}$

(उत्तर $\mathrm{r}=1$ )

गतिविधि

  • यहाँ चर्चा किए गए सभी सूत्रों का प्रयोग करके भारत की राष्ट्रीय आय और निर्यात के बीच $\mathrm{r}$ की गणना करें, कम से कम दस प्रेक्षण लेकर।