स्नातक → प्रायिकता और सांख्यिकी → चित्र ↓
वर्णात्मक सांख्यिकी
वर्णात्मक सांख्यिकी सांख्यिकी की एक शाखा है जो डेटा के एक सेट के सारांश को प्रस्तुत करने का लक्ष्य रखती है। यह नमूनों और मापों के बारे में सरल सारांश प्रदान करती है। ऐसे सारांश संख्यात्मक गणनाओं के माध्यम से मात्रात्मक या विभिन्न चार्ट और ग्राफ़ों के माध्यम से दृश्यात्मक हो सकते हैं। वर्णात्मक सांख्यिकी बड़ी मात्रा में डेटा को एक समझने योग्य तरीके से सरल बनाने में मदद करती है। प्रत्येक वर्णात्मक सांख्यिकी एक सरल सारांश के लिए बहुत सारी डेटा को संक्षेपित कर देती है।
वर्णात्मक सांख्यिकी के प्रकार
वर्णात्मक सांख्यिकी को केंद्रीय प्रवृत्ति के माप और परिवर्तनशीलता या प्रसार के माप में विभाजित किया जाता है।
केंद्रीय प्रवृत्ति के माप
केंद्रीय प्रवृत्ति के माप डेटा सेट के केंद्र बिंदु का वर्णन करते हैं। इसके तीन मुख्य माप हैं:
- औसत
- मध्य
- मोड
औसत
मीन डेटा सेट का औसत होता है। इसे सभी संख्याओं को जोड़कर और संख्याओं की संख्या से विभाजित करके गणना की जाती है।
मीन = (सभी डेटा बिंदुओं का योग) / (डेटा बिंदुओं की संख्या)
उदाहरण:
डेटा: 2, 3, 5, 7, 11
मीन = (2 + 3 + 5 + 7 + 11) / 5 = 5.6
मध्य
मध्य एक क्रमागत डेटा सेट का मध्य मान है। अगर डेटा बिंदुओं की संख्या विषम है, तो मध्य संख्या मध्य होती है। अगर सम है, तो यह दो मध्य संख्याओं का औसत होता है।
विषम संख्या के डेटा बिंदुओं का उदाहरण:
डेटा: 3, 5, 7, 9, 11
मध्य = 7
सम संख्या के डेटा बिंदुओं का उदाहरण:
डेटा: 3, 5, 7, 9
मध्य = (5 + 7)/2 = 6
मोड
मोड वह संख्या होती है जो डेटा सेट में सबसे अधिक बार आती है। डेटा सेट में एक मोड, एक से अधिक मोड, या कोई मोड नहीं हो सकता है।
उदाहरण:
डेटा: 4, 4, 6, 8, 2, 4, 10
मोड = 4
परिवर्तनशीलता के माप
परिवर्तनशीलता के माप एक डेटा सेट के भीतर डेटा का प्रसार वर्णन करते हैं। प्रमुख मापों में शामिल हैं:
- खंड
- वैरिएंस
- मानक विचलन
खंड
रेंज डेटा सेट में सबसे बड़ी और सबसे छोटी मान के बीच का अंतर होता है।
रेंज = (अधिकतम मान) - (न्यूनतम मान)
उदाहरण:
डेटा: 3, 7, 8, 15, 20
रेंज = 20 – 3 = 17
वैरिएंस
वैरिएंस मापता है कि सेट में प्रत्येक संख्या मीन से कितनी दूर है और इसलिए यह सेट में हर अन्य संख्या से कितनी दूर है। इसे मीन से वर्ग विचलनों के औसत को लेकर गणना किया जाता है।
वैरिएंस = (Σ (xi - मीन)^2) / N
उदाहरण:
डेटा: 3, 7, 7, 19
मीन = (3 + 7 + 7 + 19) / 4 = 9
वैरिएंस = [(3-9)^2 + (7-9)^2 + (7-9)^2 + (19-9)^2] / 4 = 30
मानक विचलन
मानक विचलन वैरिएंस का वर्गमूल होता है और मीन से औसत दूरी को माप प्रदान करता है।
मानक विचलन = √वैरिएंस
उदाहरण:
डेटा: 3, 7, 7, 19
वैरिएंस = 30
मानक विचलन = √30 ≈ 5.48
वर्णात्मक सांख्यिकी का दृश्यांकन
वर्णात्मक सांख्यिकी को विभिन्न ग्राफ़िकल तकनीकों का उपयोग करके प्रदर्शित किया जा सकता है। इनमें बार चार्ट, पाई चार्ट, बॉक्स प्लॉट्स, और स्कैटर प्लॉट्स शामिल हैं।
बार चार्ट
बार चार्ट का उपयोग श्रेणीबद्ध डेटा को प्रदर्शित करने के लिए किया जाता है, जिसमें आयताकार बार प्रत्येक श्रेणी की आवृत्ति को दर्शाते हैं। बार की लंबाई प्रत्येक श्रेणी में मामलों की संख्या के अनुपात में होती है।
हिस्टोग्राम
हिस्टोग्राम का उपयोग निरंतर डेटा को प्रदर्शित करने के लिए किया जाता है और यह निरंतर डेटा बिंदुओं के सेट की आवृत्ति वितरण को दर्शाता है।
बॉक्स प्लॉट
बॉक्स प्लॉट्स का उपयोग आंकड़ों के वितरण को पांच-बिंदु सारांश के आधार पर प्रदर्शित करने के लिए किया जाता है: न्यूनतम, पहला क्वारटाइल, मध्य, तीसरा क्वारटाइल, और अधिकतम।
पाई चार्ट
पाई चार्ट आनुपातिक डेटा को प्रदर्शित करता है और प्रत्येक हिस्सा पूरे का एक भाग दर्शाता है। यह विशेष रूप से भाग-से-पूरे संबंधों को दिखाने में प्रभावी होता है।
स्कैटर प्लॉट
स्कैटर प्लॉट्स का उपयोग दो चरों के बीच के संबंध को निर्धारित करने लिए किया जाता है। डेटा बिंदुओं का एक संग्रह के रूप में दैखाई जाती है, जिनमें से प्रत्येक बिंदु का एक चर का मान क्षैतिज अक्ष पर और दूसरे चर का मान लंबवत अक्ष पर होता है।
वर्णात्मक सांख्यिकी का महत्व
वर्णात्मक सांख्यिकी अत्यधिक उपयोगी होती है क्योंकि यह नमूनों और मापों का एक सरल सारांश प्रदान करती है, जो एक डेटा सेट का त्वरित अवलोकन देती है। वे आगे की सांख्यिकीय विश्लेषण के लिए भी आधार प्रदान करती हैं, जिसमें अनुमायक सांख्यिकी शामिल है, जो सटीक और विश्वसनीय अनुसंधान निष्कर्षों को सुनिश्चित करने में मदद करती है।
चार्ट और प्लॉट जैसे दृश्यात्मक उदाहरण न केवल डेटा को एक नजर में समझने योग्य बनाते हैं बल्कि ऐसी प्रमुख विशेषताओं को उजागर करने के लिए अंतर्दृष्टिपूर्ण उपकरण भी प्रदान करते हैं जो डेटा सेट की महत्वपूर्ण विशेषताओं जैसे रुझान, उतार-चढ़ाव, और चरों के बीच संबंधों को दर्शाते हैं।
व्यवहार में, ये उपकरण विभिन्न क्षेत्रों जैसे विज्ञान, वित्त, व्यावसायिक विश्लेषण, और अर्थशास्त्र में अत्यधिक महत्वपूर्ण होते हैं, जहां डेटा सेटों का सारांश और अच्छी समझ महत्वपूर्ण निर्णय लेने की प्रक्रियाओं का मार्गदर्शन कर सकती है।
वर्णात्मक सांख्यिकी के इस व्यापक अध्ययन का मुख्य उद्देश्य इस तथ्य पर जोर देना है कि यह डेटा को सरल बनाने और उसे स्पष्ट और कार्यात्मक रूप में प्रस्तुत करने में महत्वपूर्ण भूमिका निभाती है। बड़ी मात्रा में संख्याओं को समझने योग्य जानकारी में बदलकर वर्णात्मक सांख्यिकी डेटा के माध्यम से दुनिया को देखने, समझने, और विश्लेषण करने के लिए दृष्टिकोण प्रदान करती है।