स्नातक → प्रायिकता और सांख्यिकी ↓
चित्र
सांख्यिकी गणित की एक शाखा है जो डेटा को एकत्रित करने, विश्लेषण करने, व्याख्या करने, प्रस्तुत करने और व्यवस्थित करने से संबंधित है। प्रायिकता और सांख्यिकी के संदर्भ में, यह मुख्य रूप से एक नमूने के आधार पर संपूर्ण जनसंख्या के बारे में भविष्यवाणियाँ या निष्कर्ष निकालने में रुचि रखती है। व्यापार से लेकर विज्ञान तक हर क्षेत्र में सूचित निर्णय लेने के लिए सांख्यिकी का उपयोग किया जाता है।
डेटा क्या है?
डेटा संदर्भ या विश्लेषण के लिए एकत्र की गई जानकारी को संदर्भित करता है। सांख्यिकी में, डेटा आवश्यक है क्योंकि यह उन अवलोकनों या मापों का प्रतिनिधित्व करता है जिनमें कोई रुचि रखता है। डेटा को निम्नलिखित में वर्गीकृत किया जा सकता है:
- गुणात्मक डेटा: ये वर्णनात्मक आइटम होते हैं जैसे नाम, लेबल, या श्रेणियाँ। सामान्य उदाहरण हैं रंग, शहर के नाम, और संगीत प्रकार।
- परिमाणात्मक डेटा: इस प्रकार के डेटा को मापने योग्य या गिने जाने वाली संख्यात्मक जानकारी के रूप में देखा जाता है। उदाहरणों में ऊँचाई, वजन, और तापमान शामिल हैं।
सांख्यिकी के प्रकार
सांख्यिकी में, दो मुख्य प्रकार होते हैं:
- वर्णनात्मक सांख्यिकी: इसमें डेटा का संक्षिप्तीकरण और प्रस्तुति शामिल है। साधन, माध्य, मोड, और मानक विचलन जैसे माप डेटा सेट की मुख्य विशेषताओं का अवलोकन प्रदान करने के लिए उपयोग किए जाते हैं।
- अनुमानिक सांख्यिकी: यह नमूने के डेटा के आधार पर जनसंख्या के बारे में सामान्य धारणाएँ या भविष्यवाणियाँ करने के बारे में होती है। इसमें परिकल्पना परीक्षण, आत्मविश्वास अंतराल और प्रतिगमन विश्लेषण जैसी तकनीकों का उपयोग शामिल है।
वर्णनात्मक सांख्यिकी
अर्थ
गणना का साधन एक मान सेट का औसत होता है। इसे सभी संख्याओं को जोड़कर और फिर उन संख्याओं की संख्या से विभाजित करके गणना किया जाता है।
Mean = (सभी डेटा बिंदुओं का योग) / (डेटा बिंदुओं की संख्या)
उदाहरण के लिए, यदि आपके पास संख्याओं का डेटा सेट है: 2, 4, 6, 8, और 10, तो साधन होगा:
Mean = (2+4+6+8+10) / 5 = 6
माध्य
माध्य तब होता है जब डेटा बिंदुओं को आरोही क्रम में व्यवस्थित किया जाता है। यदि अवलोकनों की संख्या सम हो, तो माध्य दो आंतरिक संख्याओं का औसत होगा।
उदाहरण के लिए, डेटा सेट में: 3, 5, 7, 9, माध्य होगा:
Median = (5+7) / 2 = 6
विधि
मोड वह संख्या है जो डेटा सेट में सबसे अधिक बार दिखाई देती है। एक डेटा सेट में एक मोड, एक से अधिक मोड, या कोई मोड नहीं हो सकता है।
उदाहरण के लिए, डेटा सेट: 3, 3, 5, 7, 9 में मोड होगा:
Mode = 3
मानक विचलन
मानक विचलन एक डेटा सेट में भिन्नता या प्रसार की सीमा का एक माप है। कम मानक विचलन का मतलब है कि डेटा बिंदु औसत के करीब हैं, जबकि उच्च विचलन का मतलब है कि डेटा बिंदु एक बड़े रेंज में फैले हुए हैं।
Standard Deviation (σ) = √[(Σ(Xi - μ)²) / N]
यहाँ, Σ
योग के लिए होता है, Xi
व्यक्तिगत डेटा बिंदु होते हैं, μ
डेटा का औसत है, और N
डेटा बिंदुओं की संख्या है।
अनुमानिक सांख्यिकी
अनुमानिक सांख्यिकी नमूने के डेटा का उपयोग करके जनसंख्या के बारे में निष्कर्ष, निर्णय, भविष्यवाणियाँ, या अन्य सामान्य धारणाएँ बनाने के लिए उपयोग की जाती है। कुछ मुख्य विधियों में शामिल हैं:
परिकल्पना परीक्षण
यह परिकल्पना के बारे में निर्णय लेने के लिए एक सांख्यिकीय तरीका है। शून्य परिकल्पना वर्तमान स्थिति का प्रतिनिधित्व करती है, और वैकल्पिक परिकल्पना वह है जिसे हम साबित करना चाहते हैं। मुख्य घटक हैं:
- शून्य परिकल्पना (
H0
): यह मान लिया जाता है कि कोई महत्वपूर्ण अंतर या प्रभाव नहीं है। - वैकल्पिक परिकल्पना (
H1
): यह मान लिया जाता है कि एक महत्वपूर्ण अंतर या प्रभाव है। - p-मूल्य: यह निर्धारित करता है कि शून्य परिकल्पना सही होने पर नमूने के परिणामों को देखने की संभावना। एक छोटा p-मूल्य (< 0.05) शून्य परिकल्पना के खिलाफ मजबूत साक्ष्य का संकेत देता है।
आत्मविश्वास अंतराल
आत्मविश्वास अंतराल एक मूल्यों की सीमा होती है जिसका उपयोग एक जनसंख्या पैरामीटर के सच्चे मूल्य का अनुमान लगाने के लिए किया जाता है। यह एक अंतराल अनुमान है जो हमें बताता है कि हम सच्चे पैरामीटर के होने की उम्मीद करते हैं।
Confidence Interval = Statistic ± Margin of Error
95% आत्मविश्वास स्तर के लिए, इसमें 95% संभावना होती है कि नमूने से गणना किया गया अंतराल असली जनसंख्या पैरामीटर को शामिल करता है।
प्रतिगमन विश्लेषण
प्रतिगमन विश्लेषण दो या अधिक चर के बीच संबंध की जांच करने के लिए एक सांख्यिकीय विधि है। यह हमें समझने की अनुमति देता है कि निर्भर चर का एक विशेष मान किसी भी स्वतंत्र चर के बदलने पर कैसे बदलता है।
y = mx + c
यहाँ, y
निर्भर चर को दर्शाता है, m
ढलान है, x
स्वतंत्र चर है, और c
y-अवरोध है।
सांख्यिकी के अनुप्रयोग
सांख्यिकी का उपयोग व्यापक रूप से होता है। कुछ प्रमुख क्षेत्र जहाँ यह एक महत्वपूर्ण भूमिका निभाते हैं, वे शामिल हैं:
- व्यापार: निर्णय लेने, बाजार विश्लेषण, और वित्तीय प्रदर्शन मापन में रुझानों और प्रतिगमन विश्लेषण जैसे सांख्यिकीय तरीकों पर व्यापक रूप से निर्भर करता है।
- स्वास्थ्य देखभाल: रोग के प्रकोप की भविष्यवाणी, उपचार की प्रभावशीलता, और रोगी जनसांख्यिकी।
- विज्ञान और अनुसंधान: प्रयोगात्मक डेटा का विश्लेषण, सर्वेक्षण नमूना विश्लेषण, और अनुसंधान अध्ययन डिजाइन।
- खेल: प्रदर्शन विश्लेषण, खेल रणनीतियों और प्रशिक्षण तकनीकों में सुधार।
निष्कर्ष
सांख्यिकी एक शक्तिशाली उपकरण है जिसका उपयोग डेटा से जानकारी निकालने के लिए किया जाता है। इसके विभिन्न तकनीकों और विधियों की व्यापक रेंज विभिन्न क्षेत्रों में उपयोगी होती है क्योंकि यह जानकारी का सारांश, विश्लेषण, और निष्कर्ष निकालने में मदद करता है। सांख्यिकी की बुनियादी बातें जैसे केंद्रीय प्रवृत्ति के माप, प्रसार, और अनुमानिक तकनीकें व्यक्तियों को डेटा की कहानी समझने और सूचित निर्णय लेने के लिए तैयार करती हैं।