केंद्रीय प्रवृत्तियों के माप
केंद्रीय प्रवृत्तियों के माप सांख्यिकी में महत्वपूर्ण अवधारणाएँ हैं जो हमें डेटा के एक सेट में केंद्रीय या सामान्य मान खोजने में मदद करती हैं। ये माप हमें यह समझने में मदद करते हैं कि डेटा सेट में अधिकांश मान कहाँ आते हैं। वे डेटा को सारांशित करने के लिए व्यापक रूप से उपयोग किए जाते हैं और अर्थशास्त्र, शिक्षा और स्वास्थ्य सेवा सहित विभिन्न क्षेत्रों में सहायक होते हैं।
केंद्रीय प्रवृत्तियों के तीन मुख्य माप औसत, माध्यिका, और मोड हैं। प्रत्येक माप विभिन्न उद्देश्यों की पूर्ति करता है और कुछ प्रकार के डेटा के लिए अधिक उपयुक्त हो सकता है।
मतलब
औसत केंद्रीय प्रवृत्तियों का सबसे सामान्य रूप से उपयोग किया जाने वाला माप है। इसे अक्सर सरलता से "औसत" कहा जाता है। औसत की गणना किसी डेटा सेट में सभी नंबरों को जोड़कर और फिर डेटा सेट में मानों की संख्या से विभाजित करके की जाती है। यह विशेष रूप से तब उपयोगी होता है जब हम बिना चरम मानों (अतिरेक) के डेटा से निपट रहे हों।
Mean = (डेटा सेट में सभी मानों का योग) / (डेटा सेट में मानों की संख्या)
आइए एक उदाहरण पर विचार करें:
कल्पना कीजिए कि हमारे पास निम्नलिखित डेटा सेट हैं जो गणित की परीक्षा में छात्रों के अंक दिखा रहे हैं:
स्कोर: 78, 85, 90, 95, 100
औसत स्कोर की गणना करने के लिए, हम सबसे पहले सभी स्कोर को एक साथ जोड़ते हैं:
कुल = 78 + 85 + 90 + 95 + 100 = 448
इसके बाद, हम कुल को उपस्थित अंकों की संख्या से विभाजित करते हैं। इस मामले में, 5 अंक हैं:
Mean = 448 / 5 = 89.6
इस छात्र समूह के लिए औसत स्कोर 89.6 है।
दृश्य उदाहरण
इस दृश्य उदाहरण में, प्रत्येक रंगीन वृत्त में से एक स्कोर को दर्शाता है। डैश वाली रेखा औसत का प्रतिनिधित्व करती है, जो सभी डेटा बिंदुओं की औसत स्थिति होती है।
माध्यिका
माध्यिका किसी क्रमित, आरोही या अवरोही संख्या सूची में मध्य संख्या है। यदि कुल संख्या विषम है, तो माध्यिका मध्य संख्या होती है। यदि सम है, तो यह दो मध्य संख्याओं का औसत होता है। जब अतिरेक या एकतरफा डेटा से निपट रहा हो, तब किसी डेटा सेट के केंद्र का निर्धारण करने के लिए माध्यिका उपयोगी है।
उसी बिंदुओं के सेट पर विचार करें:
स्कोर: 78, 85, 90, 95, 100
माध्यिका खोजने के लिए, संख्याओं को क्रम में व्यवस्थित करें और मध्य स्कोर खोजें:
क्रम में: 78, 85, 90, 95, 100 माध्यिका = 90 (पांच के सेट में तीसरी संख्या)
यदि हम एक और अंक जोड़ते हैं, मान लें 82, तो नया डेटा सेट होगा:
स्कोर: 78, 82, 85, 90, 95, 100
चूंकि हमारे पास छह नंबर हैं, हम दो मध्य नंबर, 85 और 90 का औसत लेते हैं:
माध्यिका = (85 + 90) / 2 = 87.5
दृश्य उदाहरण
यहां, डैश वाली रेखा माध्यिका की स्थिति का प्रतिनिधित्व करती है, और इसे सभी डेटा का केंद्रीय विभाजन रेखा के रूप में प्रदर्शित करती है।
प्रणाली
मोड वह मान है जो किसी डेटा सेट में सबसे अधिक बार प्रकट होता है। डेटा का एक सेट एक मोड, एक से अधिक मोड, या कोई मोड नहीं हो सकता है। मोड विशेष रूप से गुणात्मक डेटा में उपयोगी होता है, जहां हम श्रेणियों की आवृत्तियों को देखते हैं।
आइए एक उदाहरण के माध्यम से काम करें:
डेटा: 5, 8, 9, 8, 10, 15, 8, 22
यहां, संख्या 8 सबसे अधिक बार प्रकट होती है। तो, इस डेटा सेट का मोड 8 है।
आइए इसे कठिन बनाने के लिए कुछ और नंबर जोड़ते हैं:
डेटा: 5, 8, 9, 8, 10, 9, 15, 8, 9, 22
इस नए डेटा सेट में, संख्या 8 और 9 दोनों ही सबसे अधिक बार प्रकट होते हैं। इसका मतलब है कि डेटा सेट द्विमोडल है, जिसमें दो मोड हैं: 8 और 9।
दृश्य उदाहरण
दृश्य में, सबसे बड़े वृत्त डेटा सेट के मोड का प्रतिनिधित्व करते हैं। ये सेट के भीतर सबसे अधिक बार दोहराने वाले मान हैं।
सांख्यिकीय विश्लेषण में, यह समझना महत्वपूर्ण है कि केंद्रीय प्रवृत्ति के प्रत्येक माप का उपयोग कब करना है। प्रत्येक उपाय डेटा के विभिन्न पहलुओं का खुलासा करता है। सही उपाय चुनना डेटा की प्रकृति और विशिष्ट अंतर्दृष्टि की आवश्यकता पर निर्भर कर सकता है।
औसत, माध्यिका और मोड की तुलना
केंद्रीय प्रवृत्ति के प्रत्येक माप की अपनी ताकत और कमजोरियां होती हैं:
- औसत: चरम मानों के बिना डेटा के लिए सबसे अच्छा है और एक सच्चा औसत देता है। हालांकि, इसे चरम मानों द्वारा अत्यधिक प्रभावित किया जा सकता है।
- माध्यिका: अतिकेंद्रित वितरण या क्रमिक डेटा के लिए आदर्श है, क्योंकि यह चरम मानों से प्रभावित नहीं होता है।
- मोड: श्रेणीबद्ध डेटा में सबसे अधिक बार आने वाली वस्तुओं की पहचान करने में सहायक होता है और डेटा वितरण के आकार को समझने में मदद कर सकता है।
आइए एक अतिरेक के उदाहरण पर विचार करें:
निम्नलिखित डेटा सेट पर विचार करें:
डेटा: 2, 4, 4, 4, 5, 7, 9, 70
संख्या में अधिकांश 2 से 9 तक होती हैं, लेकिन एक अपवाद (70) है जो अन्य नंबरों से कहीं ज्यादा है।
औसत की गणना:
Mean = (2 + 4 + 4 + 4 + 5 + 7 + 9 + 70) / 8 = 13.1
औसत 13.1 है, जो अतिरेक 70 के कारण डेटा सेट में विशिष्ट मूल्य को प्रतिबिंबित नहीं करता है।
माध्यिका की गणना के लिए, पहले डेटा को व्यवस्थित करें:
2, 4, 4, 4, 5, 7, 9, 70 चूंकि 8 मान हैं, माध्यिका (4 + 5) / 2 = 4.5 है।
4.5 का अर्थ इस डेटा के केंद्रीय मूल्य का बेहतर प्रतिनिधित्व करता है, जो अतिरेकों से प्रभावित नहीं होता है।
प्रणाली:
सबसे अधिक बार दोहराने वाला मान 4 है।
इस स्थिति में, मोड सामान्य घटना को इंगित करने के लिए उपयोगी है।
सबसे अच्छा विकल्प चुनना
केंद्रीय प्रवृत्ति का सही माप चुनना डेटा की प्रकृति और आप जिन विशिष्ट प्रश्नों का उत्तर देना चाहते हैं, उन पर निर्भर करता है:
- अगर कोई अतिरेक नहीं है: औसत एक अच्छा विकल्प हो सकता है।
- अगर डेटा अतिकेंद्रित है: माध्यिका अक्सर अधिक सटीक होती है।
- यदि डेटा श्रेणीबद्ध या असतत है और पुनरावृत्ति बिंदु शामिल हैं: मोड महत्वपूर्ण जानकारी प्रदान कर सकता है।
संक्षेप में, औसत, माध्यिका, और मोड डेटा को सारांशित करने के लिए शक्तिशाली उपकरण हैं। प्रत्येक की अपनी अनूठी ताकत होती है जो इसे विभिन्न स्थितियों के लिए उपयुक्त बनाता है। इन अंतरों को समझकर और डेटा के साथ अभ्यास करके, आप मजबूत डेटा विश्लेषण के लिए किस माप का उपयोग करना है, यह तय कर सकते हैं।