स्नातक

स्नातकप्रायिकता और सांख्यिकी


चित्र


सांख्यिकी गणित की एक शाखा है जो डेटा को एकत्रित करने, विश्लेषण करने, व्याख्या करने, प्रस्तुत करने और व्यवस्थित करने से संबंधित है। प्रायिकता और सांख्यिकी के संदर्भ में, यह मुख्य रूप से एक नमूने के आधार पर संपूर्ण जनसंख्या के बारे में भविष्यवाणियाँ या निष्कर्ष निकालने में रुचि रखती है। व्यापार से लेकर विज्ञान तक हर क्षेत्र में सूचित निर्णय लेने के लिए सांख्यिकी का उपयोग किया जाता है।

डेटा क्या है?

डेटा संदर्भ या विश्लेषण के लिए एकत्र की गई जानकारी को संदर्भित करता है। सांख्यिकी में, डेटा आवश्यक है क्योंकि यह उन अवलोकनों या मापों का प्रतिनिधित्व करता है जिनमें कोई रुचि रखता है। डेटा को निम्नलिखित में वर्गीकृत किया जा सकता है:

  • गुणात्मक डेटा: ये वर्णनात्मक आइटम होते हैं जैसे नाम, लेबल, या श्रेणियाँ। सामान्य उदाहरण हैं रंग, शहर के नाम, और संगीत प्रकार।
  • परिमाणात्मक डेटा: इस प्रकार के डेटा को मापने योग्य या गिने जाने वाली संख्यात्मक जानकारी के रूप में देखा जाता है। उदाहरणों में ऊँचाई, वजन, और तापमान शामिल हैं।

सांख्यिकी के प्रकार

सांख्यिकी में, दो मुख्य प्रकार होते हैं:

  • वर्णनात्मक सांख्यिकी: इसमें डेटा का संक्षिप्तीकरण और प्रस्तुति शामिल है। साधन, माध्य, मोड, और मानक विचलन जैसे माप डेटा सेट की मुख्य विशेषताओं का अवलोकन प्रदान करने के लिए उपयोग किए जाते हैं।
  • अनुमानिक सांख्यिकी: यह नमूने के डेटा के आधार पर जनसंख्या के बारे में सामान्य धारणाएँ या भविष्यवाणियाँ करने के बारे में होती है। इसमें परिकल्पना परीक्षण, आत्मविश्वास अंतराल और प्रतिगमन विश्लेषण जैसी तकनीकों का उपयोग शामिल है।

वर्णनात्मक सांख्यिकी

अर्थ

गणना का साधन एक मान सेट का औसत होता है। इसे सभी संख्याओं को जोड़कर और फिर उन संख्याओं की संख्या से विभाजित करके गणना किया जाता है।

Mean = (सभी डेटा बिंदुओं का योग) / (डेटा बिंदुओं की संख्या)

उदाहरण के लिए, यदि आपके पास संख्याओं का डेटा सेट है: 2, 4, 6, 8, और 10, तो साधन होगा:

Mean = (2+4+6+8+10) / 5 = 6

माध्य

माध्य तब होता है जब डेटा बिंदुओं को आरोही क्रम में व्यवस्थित किया जाता है। यदि अवलोकनों की संख्या सम हो, तो माध्य दो आंतरिक संख्याओं का औसत होगा।

उदाहरण के लिए, डेटा सेट में: 3, 5, 7, 9, माध्य होगा:

Median = (5+7) / 2 = 6

विधि

मोड वह संख्या है जो डेटा सेट में सबसे अधिक बार दिखाई देती है। एक डेटा सेट में एक मोड, एक से अधिक मोड, या कोई मोड नहीं हो सकता है।

उदाहरण के लिए, डेटा सेट: 3, 3, 5, 7, 9 में मोड होगा:

Mode = 3

मानक विचलन

मानक विचलन एक डेटा सेट में भिन्नता या प्रसार की सीमा का एक माप है। कम मानक विचलन का मतलब है कि डेटा बिंदु औसत के करीब हैं, जबकि उच्च विचलन का मतलब है कि डेटा बिंदु एक बड़े रेंज में फैले हुए हैं।

Standard Deviation (σ) = √[(Σ(Xi - μ)²) / N]

यहाँ, Σ योग के लिए होता है, Xi व्यक्तिगत डेटा बिंदु होते हैं, μ डेटा का औसत है, और N डेटा बिंदुओं की संख्या है।

मानक विचलन का दृश्य प्रदर्शन

अनुमानिक सांख्यिकी

अनुमानिक सांख्यिकी नमूने के डेटा का उपयोग करके जनसंख्या के बारे में निष्कर्ष, निर्णय, भविष्यवाणियाँ, या अन्य सामान्य धारणाएँ बनाने के लिए उपयोग की जाती है। कुछ मुख्य विधियों में शामिल हैं:

परिकल्पना परीक्षण

यह परिकल्पना के बारे में निर्णय लेने के लिए एक सांख्यिकीय तरीका है। शून्य परिकल्पना वर्तमान स्थिति का प्रतिनिधित्व करती है, और वैकल्पिक परिकल्पना वह है जिसे हम साबित करना चाहते हैं। मुख्य घटक हैं:

  • शून्य परिकल्पना ( H0 ): यह मान लिया जाता है कि कोई महत्वपूर्ण अंतर या प्रभाव नहीं है।
  • वैकल्पिक परिकल्पना ( H1 ): यह मान लिया जाता है कि एक महत्वपूर्ण अंतर या प्रभाव है।
  • p-मूल्य: यह निर्धारित करता है कि शून्य परिकल्पना सही होने पर नमूने के परिणामों को देखने की संभावना। एक छोटा p-मूल्य (< 0.05) शून्य परिकल्पना के खिलाफ मजबूत साक्ष्य का संकेत देता है।

आत्मविश्वास अंतराल

आत्मविश्वास अंतराल एक मूल्यों की सीमा होती है जिसका उपयोग एक जनसंख्या पैरामीटर के सच्चे मूल्य का अनुमान लगाने के लिए किया जाता है। यह एक अंतराल अनुमान है जो हमें बताता है कि हम सच्चे पैरामीटर के होने की उम्मीद करते हैं।

Confidence Interval = Statistic ± Margin of Error

95% आत्मविश्वास स्तर के लिए, इसमें 95% संभावना होती है कि नमूने से गणना किया गया अंतराल असली जनसंख्या पैरामीटर को शामिल करता है।

प्रतिगमन विश्लेषण

प्रतिगमन विश्लेषण दो या अधिक चर के बीच संबंध की जांच करने के लिए एक सांख्यिकीय विधि है। यह हमें समझने की अनुमति देता है कि निर्भर चर का एक विशेष मान किसी भी स्वतंत्र चर के बदलने पर कैसे बदलता है।

y = mx + c

यहाँ, y निर्भर चर को दर्शाता है, m ढलान है, x स्वतंत्र चर है, और c y-अवरोध है।

प्रतिगमन रेखा

सांख्यिकी के अनुप्रयोग

सांख्यिकी का उपयोग व्यापक रूप से होता है। कुछ प्रमुख क्षेत्र जहाँ यह एक महत्वपूर्ण भूमिका निभाते हैं, वे शामिल हैं:

  • व्यापार: निर्णय लेने, बाजार विश्लेषण, और वित्तीय प्रदर्शन मापन में रुझानों और प्रतिगमन विश्लेषण जैसे सांख्यिकीय तरीकों पर व्यापक रूप से निर्भर करता है।
  • स्वास्थ्य देखभाल: रोग के प्रकोप की भविष्यवाणी, उपचार की प्रभावशीलता, और रोगी जनसांख्यिकी।
  • विज्ञान और अनुसंधान: प्रयोगात्मक डेटा का विश्लेषण, सर्वेक्षण नमूना विश्लेषण, और अनुसंधान अध्ययन डिजाइन।
  • खेल: प्रदर्शन विश्लेषण, खेल रणनीतियों और प्रशिक्षण तकनीकों में सुधार।

निष्कर्ष

सांख्यिकी एक शक्तिशाली उपकरण है जिसका उपयोग डेटा से जानकारी निकालने के लिए किया जाता है। इसके विभिन्न तकनीकों और विधियों की व्यापक रेंज विभिन्न क्षेत्रों में उपयोगी होती है क्योंकि यह जानकारी का सारांश, विश्लेषण, और निष्कर्ष निकालने में मदद करता है। सांख्यिकी की बुनियादी बातें जैसे केंद्रीय प्रवृत्ति के माप, प्रसार, और अनुमानिक तकनीकें व्यक्तियों को डेटा की कहानी समझने और सूचित निर्णय लेने के लिए तैयार करती हैं।


स्नातक → 6.2


U
username
0%
में पूर्ण हुआ स्नातक


टिप्पणियाँ