स्नातक → प्रायिकता और सांख्यिकी → चित्र ↓
प्रतिगमन विश्लेषण
प्रतिगमन विश्लेषण एक शक्तिशाली सांख्यिकी विधि है जो आपको रुचिकर दो या अधिक चर के बीच संबंध का परीक्षण करने की अनुमति देती है। जबकि प्रतिगमन विश्लेषण के कई प्रकार हैं, इसके मूल में यह मदद करता है यह समझने में कि जब किसी स्वतंत्र चर को बदला जाता है तो आश्रित चर (या "मापदंड चर") का विशिष्ट मूल्य कैसे बदलता है, जबकि अन्य स्वतंत्र चर स्थिर होते हैं।
मूल बातें समझना
प्रतिगमन विश्लेषण शुरू करने के लिए, शामिल चर के प्रकारों को समझना महत्वपूर्ण है:
- आश्रित चर: यह मुख्य कारक है जिसे आप समझने या पूर्वानुमान लगाने का प्रयास कर रहे हैं। यह एक या अधिक स्वतंत्र चर पर निर्भर होता है।
- स्वतंत्र चर: ये वे चर हैं जिनके बारे में आपको संदेह है कि इनका आपके आश्रित चर पर प्रभाव पड़ता है।
सरल रैखिक प्रतिगमन
सरल रैखिक प्रतिगमन एक विधि है जो आपको दो लगातार चरों के बीच संबंध समझने में मदद करती है: एक स्वतंत्र (X) और एक आश्रित (Y)। हम इसे प्रेक्षित डेटा पर एक रेखीय समीकरण फिट करके प्राप्त करते हैं। समीकरण इस प्रकार है:
Y = a + bX + ε
Y
आश्रित चर है जिसे हम पूर्वानुमान करने का प्रयास कर रहे हैं।X
स्वतंत्र चर है जिसे हम पूर्वानुमान में उपयोग कर रहे हैं।a
रेखा का अभिलेख है (Y का प्रत्याशित औसत मूल्य जब X = 0 होता है)।b
रेखा की ढलान है (X में एक इकाई के परिवर्तन के लिए Y में परिवर्तन)।ε
त्रुटि पद है (वास्तविक और प्रत्याशित Y मूल्यों के बीच अंतर)।
गुणांकों की व्याख्या
समीकरण Y = a + bX + ε
में, गुणांक a
और b
X और Y के बीच संबंध के बारे में महत्वपूर्ण जानकारी प्रदान करते हैं:
- अभिधारणा (a): यह Y का प्रत्याशित मूल्य है जब X का मूल्य शून्य होता है। यह वह बिंदु है जहां प्रतिगमन रेखा Y-अक्ष को पार करती है।
- ढलान (b): यह हमें आश्रित चर (Y) में प्रतीकात्मक परिवर्तन बताता है प्रत्येक एक इकाई परिवर्तन के लिए X में। एक सकारात्मक ढलान एक प्रत्यक्ष संबंध इंगित करता है, जबकि एक नकारात्मक ढलान एक विपरीत संबंध इंगित करता है।
बहु प्रतिगमन विश्लेषण
बहु प्रतिगमन एक से अधिक स्वतंत्र चर शामिल करता है और यह समझने में मदद करता है कि कई कारक आश्रित चर को कैसे प्रभावित करते हैं। बहु प्रतिगमन के लिए समीकरण इस प्रकार है:
Y = a + b1X1 + b2X2 + ... + bnXn + ε
Y
आश्रित चर है।X1, X2, ..., Xn
स्वतंत्र चर हैं।a
अभिधारणा है।b1, b2, ..., bn
प्रत्येक स्वतंत्र चर के अनुरूप गुणांक हैं।ε
त्रुटि पद है।
उदाहरण
मान लीजिए कि हम विद्यार्थियों के अंकों का पूर्वानुमान लगाना चाहते हैं उनके अध्ययन घंटों (X1) और नींद घंटों (X2) के आधार पर। एक संभावित प्रतिगमन समीकरण इस प्रकार हो सकता है:
Score = 10 + 5*(StudyHours) + 3*(SleepHours) + ε
यहां, 5
गुणांक हमें बताता है कि अध्ययन के हर अतिरिक्त घंटे के लिए, अंक 5 अंक बढ़ सकते हैं, सहायता मानें कि नींद घंटे स्थिर रहते हैं। इसी प्रकार, नींद के हर अतिरिक्त घंटे के लिए, अंक 3 अंक बढ़ सकते हैं, अध्ययन घंटे स्थिर रखते हुए।
प्रतिगमन विश्लेषण की धारणाएं
प्रतिगमन विश्लेषण को मान्य बनाने के लिए, कई धारणाओं का पालन करना चाहिए:
- रेखीयता: स्वतंत्र और आश्रित चर के बीच संबंध रेखीय होना चाहिए।
- स्वतंत्रता: प्रेक्षणों को एक-दूसरे से स्वतंत्र होना चाहिए।
- समरूपता: त्रुटियों की विचलन सभी स्तरों पर समान होनी चाहिए स्वतंत्र चर के।
- त्रुटियों का सामान्य वितरण: अवशिष्टों को सामान्य वितरण के करीब होना चाहिए।
व्यवहार में प्रतिगमन
व्यवहार में, प्रतिगमन विश्लेषण का उपयोग विभिन्न क्षेत्रों में पूर्वानुमान और भविष्यवाणी के लिए किया जाता है। यहां कुछ उदाहरण दिए गए हैं:
- अर्थशास्त्र: आय, ब्याज दर, और मुद्रास्फीति जैसे कारकों के आधार पर उपभोक्ता खर्च की भविष्यवाणी करना।
- चिकित्सा: स्वास्थ्य परिणामों, जैसे कि हृदय रोग, पर कुछ व्यवहारों या एक्सपोजर के प्रभाव का अध्ययन करना।
- विपणन: विज्ञापन खर्च, मौसमी कारकों आदि के आधार पर बिक्री का पूर्वानुमान लगाना।
- रियल एस्टेट: विशेषताओं जैसे कि क्षेत्रफल, कमरों की संख्या और स्थान के आधार पर संपत्ति के मूल्य का निर्धारण करना।
केस स्टडी: घर की कीमतें
चलो विभिन्न कारकों के आधार पर घर की कीमतों के पूर्वानुमान का एक केस स्टडी विचार करें, जैसे:
- घर का आकार (वर्ग फुट में)
- शयनकक्षों की संख्या
- स्थान
- घर की उम्र
संभावित प्रतिगमन समीकरण निम्नलिखित के रूप में संरचित किया जा सकता है:
Price = a + b1*(Size) + b2*(Bedrooms) + b3*(Location) + b4*(Age) + ε
इन पूर्वकथितनीयों में से प्रत्येक का एक संबंधित गुणांक होता है जो घर की कीमत पर उसके विशिष्ट प्रभाव का अनुमान लगाता है।
निष्कर्ष
प्रतिगमन विश्लेषण एक बहुमुखी उपकरण है, जो सही ढंग से लागू किए जाने पर चर के बीच अर्थपूर्ण संबंधों को उजागर कर सकता है। इन संबंधों को समझकर, आप डेटा के आधार पर सूचित निर्णय ले सकते हैं न कि अनुमान के। भविष्य के रुझानों का पूर्वानुमान करें या मौजूदा पैटर्न का विश्लेषण करें, प्रतिगमन जटिल डेटा को समझने के लिए एक ढांचा प्रदान करता है।