प्रसार के माप
सांख्यिकी में, "प्रसार के माप" की अवधारणा बहुत महत्वपूर्ण है। यह हमें बताती है कि एक डाटा सेट कितना फैल या परिवर्तित होता है। सरल शब्दों में कहें, जब आप संख्या के एक समूह के औसत को जानते हैं, तो प्रसार के माप आपको यह समझने में मदद करते हैं कि अन्य संख्याएं आमतौर पर इस औसत से कितनी दूर होती हैं। आइए इसे और विस्तार से देखें।
उदाहरण के साथ प्रसार की समझ
कल्पना कीजिए हमारे पास दो छोटे संख्या सेट हैं जो पांच विभिन्न विषयों में दो छात्रों द्वारा प्राप्त अंक प्रस्तुत करते हैं:
- छात्र A: 80, 85, 78, 90, 82
- छात्र B: 60, 95, 70, 100, 55
छात्र A और छात्र B दोनों का औसत स्कोर (मीन) 83 है। हालांकि, उनके प्रदर्शन में कुछ अंतर है, जिसे हम प्रसार के माप का उपयोग करके समझ सकते हैं। जबकि छात्र A के अंक एक दूसरे के करीब होते हैं, छात्र B के अंक व्यापक रूप से भिन्न होते हैं। इस प्रसार में अंतर वही है जो प्रसार के माप मापते हैं।
प्रसार के माप के प्रकार
डाटा के प्रसार को मापने के कई तरीके हैं। प्रसार का सबसे सामान्य माप है:
- श्रेणी
- चतुर्थक और अंतर चतुर्थक रेंज
- विविधता
- मानक विचलन
- औसत निरपेक्ष विचलन
श्रेणी
प्रसार का सबसे सरल माप श्रेणी होता है। श्रेणी डाटा सेट में अधिकतम और न्यूनतम मानों के बीच के अंतर को मापता है। श्रेणी की गणना करने का सूत्र है:
श्रेणी = अधिकतम मान - न्यूनतम मान
हमारे उदाहरण का उपयोग करें:
- छात्र A: श्रेणी = 90 – 78 = 12
- छात्र B: श्रेणी = 100 – 55 = 45
जैसा कि आप देख सकते हैं, छात्र B के अंक अधिक फैलते हैं, जो दर्शाता है कि अंक छात्र A के मुकाबले अधिक फैले हुए हैं।
चतुर्थक और अंतर चतुर्थक रेंज
चतुर्थक हमारे डाटा सेट को चार समान भागों में विभाजित करते हैं। यह हमें फोकस करने में मदद करता है कि डाटा के फैलाव को अधिक विस्तार से समझा जा सके, सिर्फ चरम भिन्नांकल्म पर ही नहीं बल्कि मध्यम मानों पर भी। अंतर चतुर्थक रेंज (IQR) तीसरे चतुर्थक (Q3) और पहले चतुर्थक (Q1) के बीच का अंतर होता है। यह माप डाटा के मध्यम 50% के फैलाव का होता है:
IQR = Q3 - Q1
प्रत्येक छात्र के लिए, चर्तुर्थक को खोजने के लिए अंक को आरोही क्रम में रखें:
- छात्र A: 78, 80, 82, 85, 90
- छात्र B: 55, 60, 70, 95, 100
छात्र A के लिए:
- Q1 = 80, Q2 (मध्य) = 82, Q3 = 85
छात्र B के लिए:
- Q1 = 60, Q2 (मध्य) = 70, Q3 = 95
अतः, छात्र A के लिए IQR: 85 - 80 = 5 और छात्र B के लिए: 95 - 60 = 35।
विविधता
विविधता एक माप है कि डाटा सेट में प्रत्येक संख्या औसत वर्ग से कितनी भिन्न होती है। यह अधिक जटिल है, लेकिन बहुत उपयोगी है। विविधता की गणना करने का सूत्र है:
विविधता (σ²) = Σ (xᵢ - x̄)² / N
जहां:
Σ
का मतलब है योग...xᵢ
सेट में प्रत्येक व्यक्तिगत संख्या हैx̄
अंकों का औसत हैN
सेट में टिप्पणियों की संख्या है
व्यावहारिक प्रदर्शन के लिए, छात्र A के अंकों की विविधता की गणना करें:
- औसत = 83
- (80-83)² + (85-83)² + (78-83)² + (90-83)² + (82-83)² = 9 + 4 + 25 + 49 + 1 = 88
- विविधता = 88 / 5 = 17.6
मानक विचलन
मानक विचलन बस विविधता का वर्गमूल होता है और हमें प्रसार का एक स्पष्ट, स्केल-समकक्ष माप देता है। सूत्र है:
मानक विचलन (σ) = √विविधता
छात्र A की विविधता का उपयोग करते हुए, मानक विचलन √17.6 ≈ 4.2 है।
यह संख्या डेटा सेट के फैलाव का एक अच्छा अंदाजा देती है, मूल इकाइयों के संदर्भ में, इस मामले में संख्याओं में।
औसत निरपेक्ष विचलन
प्रसार का एक और सरल माप औसत निरपेक्ष विचलन (MAD) है। यह औसत का अनुमान है जो डाटा पॉइंट और औसत के बीच की निरपेक्ष भिन्नता का होता है:
MAD = Σ |xᵢ - x̄| / N
छात्र A का उपयोग करें:
- औसत = 83
- |80-83| + |85-83| + |78-83| + |90-83| + |82-83| = 3 + 2 + 5 + 7 + 1 = 18
- MAD = 18 / 5 = 3.6
प्रसार के माप क्यों महत्वपूर्ण हैं
प्रसार के माप को समझने से एक डेटा सेट के बारे में अनिवार्य जानकारी मिलती है:
- जोखिम मूल्यांकन: वित्त में, निवेश के जोखिम (विविधता) को समझना।
- गुणवत्ता आश्वासन: विनिर्माण में, यह सुनिश्चित करना कि उत्पाद एक निश्चित मानक को पूरा करते हैं, और भिन्नकाल्म को न्यूनतम रखा जाता है।
- तुलनात्मक विश्लेषण: शिक्षा में, विभिन्न जांचों के माध्यम से प्रदर्शन की तुलना करना।
निष्कर्ष
प्रसार के माप हमें एक औसत जानकारी से अधिक डाटा को बेहतर समझने में मदद करते हैं। वे दिखाते हैं कि डेटा कितना फैलता है, जोखिम शामिल हैं या अस्थिरता। सरल गणनाओं जैसे श्रेणी से लेकर जटिल गणनाओं जैसे कि विविधता और मानक विचलन तक, प्रत्येक माप अनोखी अंतर्दृष्टि प्रदान करती हैं, जो डाटा का एक समृद्ध विश्लेषण प्रदान करती हैं।