नमूना माध्य के लिए त्रुटि के मार्जिन की गणना कैसे करें

दबोरा जे. रुमसे द्वारा

जब कोई शोध प्रश्न आपसे एक सांख्यिकीय खोजने के लिए कहता है नमूना माध्य (या औसत), आपको नमूना माध्य के लिए त्रुटि के मार्जिन, या एमओई की रिपोर्ट करने की आवश्यकता है। आप नमूना अनुपात की त्रुटि के मार्जिन की गणना भी कर सकते हैं, जो कि पूरे की तुलना में एक नमूने में सफलताओं की मात्रा है। नमूना माध्य के लिए त्रुटि के मार्जिन का सामान्य सूत्र formula (यह मानते हुए कि एक निश्चित शर्त पूरी हुई है - नीचे देखें) is



छवि0.png



जनसंख्या मानक विचलन है, नहीं नमूना आकार है, और साथ से* उपयुक्त है साथ से* -आपके आत्मविश्वास के वांछित स्तर के लिए मूल्य (जो आप निम्न तालिका में पा सकते हैं)।

साथ से* -चयनित (प्रतिशत) विश्वास के लिए मूल्य
स्तरों
प्रतिशत विश्वास साथ से *-मूल्य
80 1.28
90 1,645
95 1.96
98 2.33
99 २.५८

ध्यान दें कि ये मान मानक सामान्य (Z-) वितरण से लिए गए हैं। प्रत्येक z* मान और उस z* मान के ऋणात्मक के बीच का क्षेत्र विश्वास प्रतिशत (लगभग) है। उदाहरण के लिए, z*=1.28 और z=-1.28 के बीच का क्षेत्र लगभग 0.80 है। इस चार्ट को अन्य विश्वास प्रतिशतों तक भी विस्तारित किया जा सकता है। चार्ट केवल सबसे अधिक उपयोग किए जाने वाले विश्वास प्रतिशत को दर्शाता है।



नमूना माध्य के लिए त्रुटि के मार्जिन की गणना के चरण यहां दिए गए हैं:

२४१० वी सोमा स्ट्रीट वैल्यू
  1. जनसंख्या मानक विचलन और नमूना आकार का पता लगाएं, नहीं .

    जनसंख्या मानक विचलन,



    image1.png

    समस्या में दिया जाएगा।

  2. जनसंख्या मानक विचलन को नमूना आकार के वर्गमूल से विभाजित करें।

    image2.png

    आपको मानक त्रुटि देता है।

  3. उपयुक्त से गुणा करें साथ से* -मान (उपरोक्त तालिका देखें)।

    उदाहरण के लिए, साथ से* -मान 1.96 है यदि आप लगभग 95% आश्वस्त होना चाहते हैं।

a . का उपयोग करने के लिए आपको जिस शर्त को पूरा करना होगा साथ से* नमूना माध्य के लिए त्रुटि सूत्र के मार्जिन में मान या तो है: 1) मूल जनसंख्या के साथ शुरू करने के लिए एक सामान्य वितरण है, या 2) नमूना आकार काफी बड़ा है इसलिए सामान्य वितरण का उपयोग किया जा सकता है (अर्थात, केंद्रीय सीमा प्रमेय लागू होता है)। सामान्य तौर पर, नमूना आकार, एन, केंद्रीय सीमा प्रमेय लागू होने के लिए लगभग 30 से ऊपर होना चाहिए। अब, यदि यह 29 है, तो घबराएं नहीं - 30 कोई जादुई संख्या नहीं है, यह केवल अंगूठे का एक सामान्य नियम है। (जनसंख्या मानक विचलन किसी भी तरह से जाना जाना चाहिए।)

यहां एक उदाहरण दिया गया है: मान लीजिए कि आप एक आइसक्रीम की दुकान के प्रबंधक हैं, और आप नए कर्मचारियों को आइसक्रीम की उचित मात्रा (10 औंस प्रत्येक) के साथ बड़े आकार के शंकु भरने में सक्षम होने के लिए प्रशिक्षण दे रहे हैं। आप एक दिन की अवधि में उनके द्वारा बनाए गए शंकुओं के औसत वजन का अनुमान लगाना चाहते हैं, जिसमें त्रुटि का अंतर भी शामिल है। बनाए गए प्रत्येक शंकु को तौलने के बजाय, आप अपने प्रत्येक नए कर्मचारी को अपने द्वारा बनाए गए बड़े शंकु के एक यादृच्छिक नमूने के वजन को बेतरतीब ढंग से जांचने के लिए कहते हैं और उन वजनों को नोटपैड पर रिकॉर्ड करते हैं। के लिये नहीं = 50 शंकु का नमूना लिया गया, नमूना माध्य 10.3 औंस पाया गया। मान लीजिए जनसंख्या मानक विचलन 0.6 औंस है।

त्रुटि का मार्जिन क्या है? (मान लें कि आप ९५% का आत्मविश्वास चाहते हैं।) इसकी गणना इस प्रकार की जाती है:

image3.png

सफेद गोल गोली 54 262

तो इन परिणामों की रिपोर्ट करने के लिए, आप कहते हैं कि 50 शंकुओं के नमूने के आधार पर, आप अनुमान लगाते हैं कि एक दिन की अवधि में नए कर्मचारियों द्वारा बनाए गए सभी बड़े शंकुओं का औसत वजन 10.3 औंस है, जिसमें प्लस या त्रुटि का मार्जिन है। शून्य से 0.17 औंस। दूसरे शब्दों में, दिन के लिए बनाए गए सभी बड़े शंकुओं के औसत वजन के संभावित मानों की सीमा (95% विश्वास के साथ) 10.30 - 0.17 = 10.13 औंस और 10.30 + 0.17 = 10.47 औंस के बीच होने का अनुमान है। ऐसा लगता है कि नए कर्मचारी बहुत अधिक आइसक्रीम दे रहे हैं (हालांकि ग्राहक शायद बहुत नाराज नहीं हैं)।

इस उदाहरण में ध्यान दें, इकाइयाँ औंस हैं, प्रतिशत नहीं! डेटा के साथ काम करते और रिपोर्ट करते समय, हमेशा याद रखें कि इकाइयाँ क्या हैं। साथ ही, सुनिश्चित करें कि आँकड़ों को माप की उनकी सही इकाइयों के साथ रिपोर्ट किया जाता है, और यदि वे नहीं हैं, तो पूछें कि इकाइयाँ क्या हैं।

ऐसे मामलों में जहां नहीं केंद्रीय सीमा प्रमेय का उपयोग करने के लिए बहुत छोटा है (सामान्य रूप से, 30 से कम), लेकिन आपको अभी भी लगता है कि डेटा सामान्य वितरण से आया है, आप इसका उपयोग कर सकते हैं टी* -value के बजाय a साथ से *-आपके सूत्रों में मूल्य। ए टी* -value वह है जो a . से आता है तो -वितरण के साथ नहीं - स्वतंत्रता की 1 डिग्री। वास्तव में, कई सांख्यिकीविद आगे बढ़ते हैं और उपयोग करते हैं टी* -मानों के बजाय साथ से* -मान लगातार, क्योंकि यदि नमूना आकार बड़ा है, टी* -मूल्य और साथ से* -वैल्यू वैसे भी लगभग बराबर हैं। इसके अलावा, उन मामलों के लिए जहां आप जनसंख्या मानक विचलन नहीं जानते हैं,

image4.png

आप इसे इसके साथ प्रतिस्थापित कर सकते हैं रों , नमूना मानक विचलन; वहां से आप एक का उपयोग करते हैं टी* -value के बजाय a साथ से* -आपके सूत्रों में भी।

दिलचस्प लेख