कॉन्फिडेंस इंटरवल डेफिनिशन

कॉन्फिडेंस इंटरवल क्या है?

एक विश्वास अंतराल, आंकड़ों में, इस संभावना को संदर्भित करता है कि जनसंख्या पैरामीटर समय के एक निश्चित अनुपात के लिए मूल्यों के एक समूह के बीच गिर जाएगा।

सारांश

  • एक विश्वास अंतराल इस संभावना को प्रदर्शित करता है कि एक पैरामीटर माध्य के चारों ओर मानों की एक जोड़ी के बीच गिर जाएगा।
  • कॉन्फिडेंस इंटरवल एक सैंपलिंग विधि में अनिश्चितता या निश्चितता की डिग्री को मापता है।
  • वे अक्सर 95% या 99% के आत्मविश्वास स्तरों का उपयोग करके बनाए जाते हैं।

कॉन्फिडेंस इंटरवल को समझना

कॉन्फिडेंस इंटरवल एक सैंपलिंग विधि में अनिश्चितता या निश्चितता की डिग्री को मापता है। वे किसी भी संख्या में प्रायिकता सीमाएँ ले सकते हैं, जिनमें से सबसे सामान्य 95% या 99% आत्मविश्वास का स्तर है। कॉन्फिडेंस इंटरवल सांख्यिकीय विधियों का उपयोग करके आयोजित किया जाता है, जैसे कि टी-टेस्ट।

नमूना चर में अनिश्चितता को मापने के लिए सांख्यिकीविद् विश्वास अंतराल का उपयोग करते हैं। उदाहरण के लिए, एक शोधकर्ता एक ही जनसंख्या से यादृच्छिक रूप से विभिन्न नमूनों का चयन करता है और यह देखने के लिए प्रत्येक नमूने के लिए एक विश्वास अंतराल की गणना करता है कि यह जनसंख्या चर के सही मूल्य का प्रतिनिधित्व कैसे कर सकता है। परिणामी डेटासेट सभी अलग हैं; कुछ अंतरालों में सही जनसंख्या पैरामीटर शामिल होता है और अन्य में नहीं।

एक आत्मविश्वास अंतराल मूल्यों की एक श्रेणी है, जो आंकड़ों के माध्य से ऊपर और नीचे होती है, जिसमें संभावित रूप से एक अज्ञात जनसंख्या पैरामीटर होगा। कॉन्फिडेंस लेवल प्रायिकता, या निश्चितता के प्रतिशत को संदर्भित करता है, जब आप कई बार रैंडम सैंपल ड्रा करते हैं, तो कॉन्फिडेंस इंटरवल में सही जनसंख्या पैरामीटर होगा। या, स्थानीय भाषा में, “हम 99% निश्चित (विश्वास स्तर) हैं कि इनमें से अधिकतर नमूने (आत्मविश्वास अंतराल) में वास्तविक जनसंख्या पैरामीटर शामिल है।”

कॉन्फिडेंस इंटरवल के बारे में सबसे बड़ी गलत धारणा यह है कि वे किसी दिए गए नमूने से डेटा के प्रतिशत का प्रतिनिधित्व करते हैं जो ऊपरी और निचली सीमा के बीच आता है। उदाहरण के लिए, कोई गलती से उपरोक्त 99% विश्वास अंतराल 70-से-78 इंच की व्याख्या कर सकता है, यह दर्शाता है कि यादृच्छिक नमूने में डेटा का 99% इन संख्याओं के बीच आता है। यह गलत है, हालांकि ऐसा निर्धारण करने के लिए सांख्यिकीय विश्लेषण की एक अलग विधि मौजूद है। ऐसा करने में नमूने के माध्य और मानक विचलन की पहचान करना और इन आंकड़ों को घंटी वक्र पर प्लॉट करना शामिल है।

कॉन्फिडेंस इंटरवल और कॉन्फिडेंस लेवल आपस में जुड़े हुए हैं लेकिन बिल्कुल समान नहीं हैं।

विश्वास अंतराल की गणना

मान लीजिए शोधकर्ताओं का एक समूह हाई स्कूल बास्केटबॉल खिलाड़ियों की ऊंचाइयों का अध्ययन कर रहा है। शोधकर्ता आबादी से एक यादृच्छिक नमूना लेते हैं और 74 इंच की औसत ऊंचाई स्थापित करते हैं।

74 इंच का माध्य जनसंख्या माध्य का एक बिंदु अनुमान है। एक बिंदु अनुमान अपने आप में सीमित उपयोगिता का है क्योंकि यह अनुमान से जुड़ी अनिश्चितता को प्रकट नहीं करता है; आपको इस बात का अच्छा अंदाजा नहीं है कि 74 इंच का यह नमूना माध्य जनसंख्या माध्य से कितनी दूर हो सकता है। इस एकल नमूने में अनिश्चितता की डिग्री गायब है।

विश्वास अंतराल बिंदु अनुमानों की तुलना में अधिक जानकारी प्रदान करते हैं। नमूने के माध्य और मानक विचलन का उपयोग करके 95% विश्वास अंतराल स्थापित करके, और घंटी वक्र द्वारा दर्शाए गए सामान्य वितरण को मानकर, शोधकर्ता एक ऊपरी और निचली सीमा पर पहुंचते हैं जिसमें 95% समय का सही मतलब होता है।

मान लें कि अंतराल 72 इंच और 76 इंच के बीच है। यदि शोधकर्ता पूरे हाई स्कूल बास्केटबॉल खिलाड़ियों की आबादी से 100 यादृच्छिक नमूने लेते हैं, तो उन नमूनों में से 95 में माध्य 72 से 76 इंच के बीच गिरना चाहिए।

यदि शोधकर्ता और भी अधिक आत्मविश्वास चाहते हैं, तो वे अंतराल को 99% विश्वास तक बढ़ा सकते हैं। ऐसा करने से निरपवाद रूप से एक व्यापक दायरा बनता है, क्योंकि यह अधिक संख्या में नमूना साधनों के लिए जगह बनाता है। यदि वे 99% विश्वास अंतराल को 70 इंच और 78 इंच के बीच होने के रूप में स्थापित करते हैं, तो वे उम्मीद कर सकते हैं कि 100 में से 99 नमूनों का मूल्यांकन इन संख्याओं के बीच एक औसत मान रखने के लिए किया जाएगा।

दूसरी ओर, 90% विश्वास स्तर का तात्पर्य है कि हम 90% अंतराल अनुमानों में जनसंख्या पैरामीटर, आदि को शामिल करने की अपेक्षा करेंगे।

एक विश्वास अंतराल क्या प्रकट करता है?

एक कॉन्फिडेंस इंटरवल मूल्यों की एक श्रेणी है, जो आंकड़ों के माध्य से ऊपर और नीचे होता है, जिसमें एक अज्ञात जनसंख्या पैरामीटर होने की संभावना होती है। कॉन्फिडेंस लेवल प्रायिकता, या निश्चितता के प्रतिशत को संदर्भित करता है, जब आप कई बार रैंडम सैंपल ड्रा करते हैं, तो कॉन्फिडेंस इंटरवल में सही जनसंख्या पैरामीटर होगा।

कॉन्फिडेंस इंटरवल का उपयोग कैसे किया जाता है?

नमूना चर में अनिश्चितता को मापने के लिए सांख्यिकीविद् विश्वास अंतराल का उपयोग करते हैं। उदाहरण के लिए, एक शोधकर्ता एक ही जनसंख्या से यादृच्छिक रूप से विभिन्न नमूनों का चयन करता है और यह देखने के लिए प्रत्येक नमूने के लिए एक विश्वास अंतराल की गणना करता है कि यह जनसंख्या चर के सही मूल्य का प्रतिनिधित्व कैसे कर सकता है। परिणामी डेटासेट सभी भिन्न होते हैं जहां कुछ अंतरालों में वास्तविक जनसंख्या पैरामीटर शामिल होता है और अन्य में नहीं।

कॉन्फिडेंस इंटरवल के बारे में एक आम गलतफहमी क्या है?

कॉन्फिडेंस इंटरवल के बारे में सबसे बड़ी गलत धारणा यह है कि वे किसी दिए गए नमूने से डेटा के प्रतिशत का प्रतिनिधित्व करते हैं जो ऊपरी और निचली सीमा के बीच आता है। दूसरे शब्दों में, यह मान लेना गलत होगा कि 99% विश्वास अंतराल का अर्थ है कि यादृच्छिक नमूने में 99% डेटा इन सीमाओं के बीच आता है। इसका वास्तव में मतलब यह है कि कोई 99% निश्चित हो सकता है कि इस श्रेणी में जनसंख्या माध्य शामिल होगा।

टी-टेस्ट क्या है?

कॉन्फिडेंस इंटरवल सांख्यिकीय विधियों का उपयोग करके आयोजित किया जाता है, जैसे कि टी-टेस्ट। टी-टेस्ट एक प्रकार का अनुमानात्मक आँकड़ा है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो समूहों के साधनों के बीच एक महत्वपूर्ण अंतर है, जो कुछ विशेषताओं से संबंधित हो सकता है। टी-टेस्ट की गणना के लिए तीन प्रमुख डेटा मानों की आवश्यकता होती है। इनमें प्रत्येक डेटा सेट (जिसे माध्य अंतर कहा जाता है) से माध्य मानों के बीच का अंतर, प्रत्येक समूह का मानक विचलन और प्रत्येक समूह के डेटा मानों की संख्या शामिल है।