एक नमूना क्या है और यह कैसे बनता है? नमूनाकरण की अवधारणा

सिखाने के तरीके

  1. जनगणना (योग्यता) और नमूनाकरण की अवधारणाओं के बीच अंतर करना स्पष्ट है।
  2. एक नमूना आबादी प्राप्त करने के लिए शोधकर्ताओं द्वारा कार्यान्वित छह चरणों का सार और क्रम जानें।
  3. "नमूनाकरण फ्रेम" की अवधारणा को परिभाषित करें।
  4. संभाव्य और नियतात्मक नमूने के बीच अंतर स्पष्ट करें।
  5. निश्चित आकार के नमूने और मल्टीस्टेज (लगातार) नमूने के बीच अंतर।
  6. समझाएं कि जानबूझकर नमूनाकरण क्या है और इसकी ताकत और कमजोरियों दोनों का वर्णन करें।
  7. कोटा नमूनाकरण की अवधारणा को परिभाषित करें।
  8. व्याख्या करें कि चयन प्रक्रिया में पैरामीटर क्या है।
  9. व्याख्या करें कि एक व्युत्पन्न सेट क्या है।
  10. समझाइए कि प्रतिचयन वितरण की अवधारणा सांख्यिकी की सबसे महत्वपूर्ण अवधारणा क्यों है।

इसलिए, शोधकर्ता ने समस्या को सटीक रूप से परिभाषित किया है और इसे हल करने के लिए उपयुक्त शोध डिजाइन और डेटा संग्रह उपकरण प्राप्त किए हैं। अनुसंधान प्रक्रिया का अगला चरण उन तत्वों का चयन होना चाहिए जिनकी जांच की जानी है। इस आबादी की पूरी जनगणना करके किसी आबादी के प्रत्येक तत्व की जांच करना संभव है। जनसंख्या के पूर्ण सर्वेक्षण को जनगणना (योग्यता) कहा जाता है। एक और संभावना है। जनसंख्या का एक निश्चित भाग, एक बड़े समूह के तत्वों का एक नमूना, सांख्यिकीय परीक्षा के अधीन होता है, और इस उपसमुच्चय पर प्राप्त आंकड़ों के अनुसार, पूरे समूह के संबंध में कुछ निष्कर्ष निकाले जाते हैं। नमूना डेटा से प्राप्त परिणामों को एक बड़े समूह में सामान्यीकृत करने की क्षमता उस विधि पर निर्भर करती है जिसके द्वारा नमूना लिया गया था। इस अध्याय का अधिकांश भाग इस बात पर केंद्रित होगा कि प्रतिदर्श कैसे और क्यों लिया जाना चाहिए।

जनगणना (योग्यता)
जनसंख्या (जनसंख्या) की पूरी जनगणना।
नमूना
वस्तुओं के एक बड़े समूह के सबसेट के तत्वों का संग्रह।

"जनसंख्या" या "संग्रह" की अवधारणा न केवल लोगों को, बल्कि विनिर्माण उद्योग में काम करने वाली फर्मों को, खुदरा विक्रेताओं या थोक विक्रेताओं को, या यहां तक ​​कि पूरी तरह से निर्जीव वस्तुओं को भी संदर्भित कर सकती है, जैसे उद्यम द्वारा उत्पादित भागों; इस अवधारणा को तत्वों के पूरे सेट के रूप में परिभाषित किया गया है जो कुछ शर्तों को पूरा करते हैं। ये शर्तें विशिष्ट रूप से उन तत्वों को परिभाषित करती हैं जो लक्ष्य समूह से संबंधित हैं और वे तत्व जिन्हें विचार से बाहर रखा जाना चाहिए।

एक अध्ययन जिसका उद्देश्य जमे हुए पिज्जा उपभोक्ताओं की जनसांख्यिकीय प्रोफ़ाइल का निर्धारण करना है, को यह पहचान कर शुरू करना चाहिए कि किसे इस तरह वर्गीकृत किया जाना चाहिए और क्या नहीं। क्या ऐसे पिज्जा को कम से कम एक बार चखने वाले लोग इस श्रेणी में आते हैं? वे व्यक्ति जो प्रति माह कम से कम एक पिज्जा खरीदते हैं? हफ्ते में? एक महीने में एक निश्चित न्यूनतम मात्रा से अधिक पिज़्ज़ा खाने वाले व्यक्ति? लक्ष्य समूह निर्धारित करने में शोधकर्ता को बहुत सटीक होना चाहिए। यह सुनिश्चित करने के लिए भी ध्यान रखा जाना चाहिए कि नमूना लक्ष्य आबादी से लिया गया है न कि "कुछ" आबादी से, जो नमूना फ्रेम अपर्याप्त या अपूर्ण होने पर मामला है। उत्तरार्द्ध उन तत्वों की एक सूची है जिनसे एक वास्तविक नमूना बनेगा।

एक शोधकर्ता कई कारणों से संपूर्ण जनसंख्या के सर्वेक्षण के लिए एक नमूना दृष्टिकोण को प्राथमिकता दे सकता है। सबसे पहले, जनसंख्या की पूरी परीक्षा, यहां तक ​​कि अपेक्षाकृत छोटे आकार की, बहुत बड़ी सामग्री और समय की लागत की आवश्यकता होती है। अक्सर, जब तक जनगणना पूरी हो जाती है और डेटा को संसाधित किया जाता है, तब तक सूचना पहले से ही पुरानी हो चुकी होती है। कुछ मामलों में, योग्यता केवल असंभव है। मान लीजिए कि शोधकर्ताओं ने गणना की गई एक के साथ इलेक्ट्रिक गरमागरम लैंप के वास्तविक सेवा जीवन के अनुपालन की जांच करने के लिए निर्धारित किया है, जिसके लिए उन्हें विफल होने तक उन्हें चालू रखने की आवश्यकता है। यदि आप इस तरह से लैंप की पूरी आपूर्ति की जांच करते हैं, तो विश्वसनीय डेटा प्राप्त होगा, लेकिन व्यापार करने के लिए कुछ भी नहीं होगा।

अंत में, शुरुआती लोगों के महान विस्मय के लिए, शोधकर्ता परिणामों की सटीकता के लिए प्रयास करते हुए, जनगणना के लिए नमूना लेना पसंद कर सकते हैं। जनगणना के लिए बड़े कर्मचारियों की आवश्यकता होती है, जिससे पूर्वाग्रह (नॉन-सैंपलिंग) त्रुटियों की संभावना बढ़ जाती है। यह परिस्थिति उन कारणों में से एक है जिसके कारण अमेरिकी जनगणना ब्यूरो विभिन्न प्रकार की जनगणनाओं की सटीकता का परीक्षण करने के लिए नमूना सर्वेक्षणों का उपयोग करता है। आपने सही पढ़ा: योग्यता डेटा की सटीकता का परीक्षण करने के लिए नमूना सर्वेक्षण किया जा सकता है।

नमूना डिजाइन कदम

अंजीर पर। चित्र 15.1 एक छह-चरण अनुक्रम दिखाता है जिसका अनुसरण एक शोधकर्ता नमूना तैयार करते समय कर सकता है। सबसे पहले, लक्ष्य आबादी या तत्वों के समूह को निर्धारित करना आवश्यक है जिसके बारे में शोधकर्ता कुछ जानना चाहता है।

उदाहरण के लिए, बच्चों की प्राथमिकताओं का अध्ययन करते समय, शोधकर्ताओं को यह तय करने की आवश्यकता होती है कि क्या लक्षित आबादी में केवल बच्चे, केवल माता-पिता या दोनों शामिल होंगे।

सकल (जनसंख्या)
तत्वों का एक समूह जो कुछ निश्चित शर्तों को पूरा करता है।
नमूना फ्रेम (आधार)
उन तत्वों की सूची जिनसे चयन किया जाएगा; क्षेत्रीय इकाइयां, संगठन, व्यक्ति और अन्य तत्व शामिल हो सकते हैं।

एक निश्चित कंपनी ने अपनी इलेक्ट्रिक "दौड़" का परीक्षण केवल बच्चों पर किया। बच्चे पूरी तरह से अभिभूत थे। माता-पिता ने नवीनता पर अलग-अलग प्रतिक्रिया व्यक्त की। माताओं को यह तथ्य पसंद नहीं आया कि सवारी ने बच्चों को कार के अनुकूल होना नहीं सिखाया, और डैड्स को यह तथ्य पसंद नहीं आया कि उत्पाद को खिलौने की तरह बनाया गया था।
विपरीत स्थिति भी संभव है। एक फर्म ने एक नया खाद्य उत्पाद लॉन्च किया और एक राष्ट्रव्यापी विज्ञापन अभियान शुरू किया जो अकुशल बच्चे पर केंद्रित था। फर्म ने विज्ञापनों की प्रभावशीलता का परीक्षण केवल उन माताओं पर किया जो रोमांचित थीं। दूसरी ओर, बच्चों को यह "त्वरण" मिला, और इसके साथ विज्ञापित उत्पाद ही घृणित था। उत्पाद समाप्त 1।

शोधकर्ता को यह तय करना होगा कि प्रासंगिक जनसंख्या में कौन या क्या शामिल होगा: व्यक्ति, परिवार, फर्म, अन्य संगठन, क्रेडिट कार्ड लेनदेन, आदि। ऐसे निर्णय लेने में, उन तत्वों को निर्धारित करना आवश्यक है जिन्हें आबादी से बाहर रखा जाना चाहिए। तत्वों का लौकिक और भौगोलिक दोनों संदर्भ होना चाहिए, जो कुछ मामलों में अतिरिक्त शर्तों या प्रतिबंधों के अधीन हो सकते हैं। उदाहरण के लिए, यदि हम व्यक्तियों के बारे में बात कर रहे हैं, तो वांछित जनसंख्या में केवल 18 वर्ष से अधिक आयु के व्यक्ति, या केवल महिलाएं, या केवल कम से कम माध्यमिक शिक्षा वाले व्यक्ति शामिल हो सकते हैं।

अंतर्राष्ट्रीय विपणन अनुसंधान में लक्षित आबादी के लिए भौगोलिक सीमाओं को निर्धारित करने का कार्य एक विशेष समस्या हो सकती है, क्योंकि इससे विचाराधीन प्रणाली की विषमता बढ़ जाती है। उदाहरण के लिए, शहरी और ग्रामीण क्षेत्रों का सापेक्ष अनुपात एक देश से दूसरे देश में महत्वपूर्ण रूप से भिन्न हो सकता है। प्रादेशिक पहलू का जनसंख्या की संरचना और उसी देश के भीतर गंभीर प्रभाव पड़ता है। उदाहरण के लिए, चिली के उत्तर में, मुख्य रूप से भारतीय आबादी सघन रूप से रहती है, जबकि देश के दक्षिणी क्षेत्रों में, मुख्य रूप से यूरोपीय लोगों के वंशज रहते हैं।

कवरेज (घटना)
जनसंख्या या समूह के सदस्यों का प्रतिशत जो नमूने में शामिल करने की शर्तों को पूरा करते हैं।

आम तौर पर, लक्षित जनसंख्या को जितना सरल परिभाषित किया जाता है, उसका कवरेज (घटना) उतना ही अधिक होता है और नमूना लेने की प्रक्रिया आसान और सस्ती होती है। कवरेज (घटना)जनसंख्या या समूह के तत्वों के अनुपात से मेल खाती है, प्रतिशत के रूप में व्यक्त किया जाता है, जो नमूने में शामिल करने की शर्तों को पूरा करता है। कवरेज सीधे सर्वेक्षण करने के लिए आवश्यक समय और सामग्री लागत को प्रभावित करता है। यदि कवरेज बड़ा है (यानी, जनसंख्या के अधिकांश तत्व संभावित उत्तरदाताओं की पहचान करने के लिए उपयोग किए जाने वाले एक या अधिक सरल मानदंडों को पूरा करते हैं), तो डेटा एकत्र करने के लिए आवश्यक समय और भौतिक लागत कम से कम हो जाती है। इसके विपरीत, संभावित उत्तरदाताओं को मिलने वाले मानदंडों की संख्या में वृद्धि के साथ, सामग्री और समय लागत दोनों में वृद्धि होती है।

अंजीर पर। चित्र 15.2 कुछ खेलों में शामिल वयस्क आबादी के अनुपात को दर्शाता है। आंकड़े में दिए गए डेटा से संकेत मिलता है कि मोटर साइकिल चलाने वाले लोगों (वयस्कों की कुल संख्या का केवल 3.6%) की जांच करना उन लोगों की तुलना में अधिक कठिन और महंगा है जो नियमित रूप से मनोरंजक सैर करते हैं (कुल संख्या का 27.4%) वयस्क)। मुख्य बात यह है कि शोधकर्ता यह निर्धारित करने में सटीक होता है कि अध्ययन आबादी में कौन से तत्वों को शामिल किया जाना चाहिए और किन तत्वों को इससे बाहर रखा जाना चाहिए। अध्ययन के उद्देश्य का एक स्पष्ट विवरण इस समस्या के समाधान की सुविधा प्रदान करता है। नमूना लेने की प्रक्रिया में दूसरा चरण नमूना फ्रेम निर्धारित करना है, जैसा कि आप पहले से ही जानते हैं, उन तत्वों की सूची है जिनसे नमूना तैयार किया जाएगा। बता दें कि एक निश्चित अध्ययन की लक्षित आबादी डलास क्षेत्र में रहने वाले सभी परिवार हैं। पहली नज़र में, डलास टेलीफोन निर्देशिका एक अच्छा और आसानी से सुलभ नमूनाकरण फ्रेम हो सकता है। फिर भी, करीब से जाँच करने पर, यह स्पष्ट हो जाता है कि निर्देशिका में निहित परिवारों की सूची पूरी तरह से सही नहीं है, क्योंकि इसमें कुछ परिवारों की संख्या छोड़ दी गई है (बेशक, इसमें ऐसे परिवार शामिल नहीं हैं जिनके पास टेलीफोन नहीं है), जबकि कुछ परिवारों के पास कई टेलीफोन नंबर हैं। वे व्यक्ति जिन्होंने हाल ही में अपना निवास स्थान बदला है और तदनुसार, उनका टेलीफोन नंबर भी निर्देशिका में मौजूद नहीं है।

अनुभवी शोधकर्ता इस निष्कर्ष पर पहुंचे हैं कि सैंपलिंग फ्रेम और ब्याज की लक्षित आबादी के बीच एक सटीक मेल बहुत दुर्लभ है। नमूनाकरण डिजाइन में सबसे रचनात्मक कदमों में से एक उन मामलों में उपयुक्त नमूनाकरण फ्रेम का निर्धारण करना है जहां जनसंख्या सदस्यों को सूचीबद्ध करना मुश्किल हो। इसके लिए कार्य ब्लॉकों और उपसर्गों से नमूने लेने की आवश्यकता हो सकती है, उदाहरण के लिए, टेलीफोन निर्देशिकाओं में कमियों के कारण यादृच्छिक डायलिंग का उपयोग किया जाता है। हालांकि, पिछले 10 वर्षों में कार्य इकाइयों में उल्लेखनीय वृद्धि ने इस कार्य को और कठिन बना दिया है। इसी तरह की स्थिति प्रादेशिक क्षेत्रों या संगठनों के चयनात्मक अवलोकन के दौरान बाद के सबसैम्पलिंग के दौरान भी उत्पन्न हो सकती है, जब, कहते हैं, व्यक्ति लक्षित आबादी हैं, लेकिन उनकी कोई सटीक अद्यतन सूची नहीं है।

स्रोत: एसएसआई में निहित डेटा के आधार पर- हल्काटीएम: एलओउ घटना टीलक्षित एसएम्प्लिंग" (फेयरफ़ील्ड, कनेक्टिकट: सर्वे सैम्पलिंग, इंक., 1994)।

नमूना लेने की प्रक्रिया में तीसरा चरण नमूना फ्रेम के निर्धारण से निकटता से संबंधित है। नमूना लेने की विधि या प्रक्रिया का चुनाव काफी हद तक शोधकर्ता द्वारा अपनाए गए नमूने के ढाँचे पर निर्भर करता है। विभिन्न प्रकार के नमूनों के लिए विभिन्न प्रकार के नमूने फ्रेम की आवश्यकता होती है। यह और अगला अध्याय विपणन अनुसंधान में उपयोग किए जाने वाले मुख्य प्रकार के नमूनों का एक सिंहावलोकन देगा। उनका वर्णन करते समय, नमूना फ्रेम और इसके गठन की विधि के बीच संबंध स्पष्ट होना चाहिए।

नमूनाकरण प्रक्रिया का चौथा चरण नमूना आकार निर्धारित करना है। इस समस्या पर चैप में चर्चा की गई है। 17. पांचवें चरण में, शोधकर्ता को वास्तव में उन तत्वों का चयन करने की आवश्यकता होती है जो सर्वेक्षण के अधीन होंगे। इसके लिए उपयोग की जाने वाली विधि चुने गए नमूना प्रकार द्वारा निर्धारित की जाती है; प्रतिचयन विधियों की चर्चा करते समय, हम इसके तत्वों के चयन के बारे में भी बात करेंगे। और अंत में, शोधकर्ता को वास्तव में पहचाने गए उत्तरदाताओं की जांच करने की आवश्यकता होती है। इस स्तर पर, कई त्रुटियां करने की उच्च संभावना है।
अध्याय में इन समस्याओं और उनके समाधान के कुछ तरीकों पर चर्चा की गई है। 18.

नमूना योजनाओं के प्रकार (नमूनाकरण)

सभी नमूनाकरण विधियों को दो श्रेणियों में विभाजित किया जा सकता है: प्रायिकता नमूनों का अवलोकन और नियतात्मक नमूनों का अवलोकन। एक संभाव्य नमूने में, जनसंख्या के प्रत्येक सदस्य को एक निश्चित निर्दिष्ट गैर-शून्य संभावना के साथ शामिल किया जा सकता है। नमूने में जनसंख्या के कुछ सदस्यों को शामिल करने की संभावना भिन्न हो सकती है, लेकिन इसमें प्रत्येक तत्व को शामिल करने की संभावना ज्ञात है। यह संभावना नमूना सदस्यों का चयन करने के लिए उपयोग की जाने वाली एक विशेष यांत्रिक प्रक्रिया द्वारा निर्धारित की जाती है।

नियतात्मक नमूनों के लिए, नमूने में किसी भी तत्व को शामिल करने की संभावना का अनुमान लगाना असंभव हो जाता है। ऐसे नमूने की प्रतिनिधित्वशीलता की गारंटी नहीं दी जा सकती। उदाहरण के लिए, ऑलस्टेट कॉर्पोरेशन 14 मिलियन परिवारों (इसके ग्राहकों) के दावों के डेटा को संसाधित करने के लिए एक प्रणाली विकसित कर रहा था। कंपनी इस डेटा का उपयोग अपनी सेवाओं की मांग के पैटर्न को निर्धारित करने के लिए करने की योजना बना रही है, जैसे कि संभावना है कि मर्सिडीज बेंज के मालिक के पास एक छुट्टी घर भी होगा (जिसके लिए बीमा की आवश्यकता होगी)। हालाँकि डेटाबेस बहुत बड़ा है, कंपनी के पास इस संभावना का अनुमान लगाने का साधन नहीं है कि कोई विशेष ग्राहक दावा करेगा। कंपनी इस प्रकार यह सुनिश्चित नहीं कर सकती है कि दावा करने वाला ग्राहक डेटा कंपनी के सभी ग्राहकों का प्रतिनिधि है; और कुछ हद तक - संभावित ग्राहकों के संबंध में।

नमूना सदस्यों के लिए एक यांत्रिक चयन प्रक्रिया के बजाय, सभी नियतात्मक नमूने शोधकर्ता की व्यक्तिगत स्थिति, निर्णय या वरीयता पर आधारित होते हैं। ऐसी वरीयताएँ कभी-कभी जनसंख्या की विशेषताओं का अच्छा अनुमान दे सकती हैं, लेकिन कार्य के लिए नमूने की उपयुक्तता को निष्पक्ष रूप से निर्धारित करने का कोई तरीका नहीं है। नमूने के परिणामों की सटीकता का आकलन केवल तभी किया जा सकता है जब कुछ तत्वों के चयन की संभावना ज्ञात हो। इस कारण से, संभाव्यता नमूनाकरण के साथ काम करना आम तौर पर नमूनाकरण त्रुटि की भयावहता का आकलन करने के लिए एक बेहतर तरीका माना जाता है। नमूने को निश्चित आकार के नमूने और अनुक्रमिक नमूने में भी विभाजित किया जा सकता है। निश्चित आकार के नमूनों के साथ काम करते समय, नमूना आकार सर्वेक्षण शुरू होने से पहले निर्धारित किया जाता है, और परिणामों का विश्लेषण सभी आवश्यक डेटा के संग्रह से पहले होता है। हम मुख्य रूप से निश्चित आकार के नमूनों में रुचि लेंगे, क्योंकि इस प्रकार का आमतौर पर विपणन अनुसंधान में उपयोग किया जाता है।

सम्भाव्यता नमूनाचयन
एक नमूना जिसमें जनसंख्या के प्रत्येक तत्व को कुछ ज्ञात गैर-शून्य संभाव्यता के साथ शामिल किया जा सकता है।
नियतात्मक नमूनाकरण
कुछ विशेष प्राथमिकताओं या निर्णयों के आधार पर नमूनाकरण जो कुछ तत्वों के चयन को निर्धारित करता है; उसी समय, नमूने में जनसंख्या के मनमाने तत्व को शामिल करने की संभावना का अनुमान लगाना असंभव हो जाता है।

हालांकि, यह नहीं भूलना चाहिए कि अनुक्रमिक नमूने भी हैं जिनका उपयोग नीचे चर्चा की गई प्रत्येक बुनियादी नमूना डिजाइन के साथ किया जा सकता है।

अनुक्रमिक नमूने में, चयनित तत्वों की संख्या पहले से ज्ञात नहीं है, यह अनुक्रमिक निर्णयों की एक श्रृंखला के आधार पर निर्धारित की जाती है। यदि एक छोटे से नमूने का सर्वेक्षण विश्वसनीय परिणाम नहीं देता है, तो जांच किए जाने वाले तत्वों की सीमा का विस्तार किया जाता है। यदि उसके बाद परिणाम अनिर्णायक रहता है, तो नमूना आकार फिर से बढ़ा दिया जाता है। प्रत्येक चरण में, यह निर्णय लिया जाता है कि क्या प्राप्त परिणाम को पर्याप्त रूप से ठोस माना जाए या डेटा एकत्र करना जारी रखा जाए या नहीं। अनुक्रमिक नमूनाकरण के साथ काम करना डेटा के रुझान (परिवर्तन की प्रवृत्ति) का आकलन करना संभव बनाता है, जैसा कि वे एकत्र किए जाते हैं, जो उन मामलों में अतिरिक्त टिप्पणियों से जुड़ी लागतों को कम करता है जहां उनकी उपयोगिता शून्य हो जाती है।

संभाव्य और नियतात्मक दोनों नमूना योजनाएँ कई प्रकारों में आती हैं। उदाहरण के लिए, नियतात्मक नमूने गैर-प्रतिनिधि (सुविधाजनक), जानबूझकर या कोटा हो सकते हैं; संभाव्य नमूने सरल यादृच्छिक, स्तरीकृत या समूह (क्लस्टर) में विभाजित होते हैं, बदले में, उन्हें उपप्रकारों में विभाजित किया जा सकता है। अंजीर पर। चित्र 15.3 इस और अगले अध्याय में चर्चा किए जाने वाले नमूनों के प्रकारों को दर्शाता है।

फिक्स्ड सैंपल (फिक्स्ड सैंपल)
एक नमूना जिसका आकार प्राथमिकता निर्धारित किया जाता है; आवश्यक जानकारी चयनित तत्वों द्वारा निर्धारित की जाती है।
अनुक्रमिक नमूनाकरण
अनुक्रमिक निर्णयों की एक श्रृंखला के आधार पर गठित एक नमूना। यदि, एक छोटे नमूने पर विचार करने के बाद, परिणाम अनिर्णायक होता है, तो एक बड़े नमूने पर विचार किया जाता है; यदि इस कदम से परिणाम नहीं निकलता है, तो नमूना आकार फिर से बढ़ जाता है, आदि। इस प्रकार, प्रत्येक चरण में, यह निर्णय लिया जाता है कि प्राप्त परिणाम को पर्याप्त रूप से ठोस माना जा सकता है या नहीं।

यह याद रखना चाहिए कि मूल प्रकार के नमूनों को अधिक जटिल नमूना योजना बनाने के लिए जोड़ा जा सकता है। यदि आप उनके मूल प्रारंभिक प्रकारों को सीखते हैं, तो आपके लिए अधिक जटिल संयोजनों से निपटना आसान हो जाएगा।

नियतात्मक चयन

जैसा कि पहले ही उल्लेख किया गया है, नियतात्मक नमूने के तत्वों का चयन करते समय, निजी अनुमान या निर्णय निर्णायक भूमिका निभाते हैं। कभी-कभी ये आकलन शोधकर्ता से आते हैं, जबकि अन्य मामलों में जनसंख्या तत्वों का चयन फील्ड स्टाफ को दिया जाता है। चूंकि तत्वों को यंत्रवत् रूप से नहीं चुना जाता है, इसलिए नमूने में एक मनमाना तत्व शामिल करने की संभावना निर्धारित करना असंभव हो जाता है और तदनुसार, नमूनाकरण त्रुटि। चयनित नमूनाकरण प्रक्रिया के कारण त्रुटि की अज्ञानता शोधकर्ताओं को उनके अनुमानों की सटीकता का आकलन करने से रोकती है।

गैर-प्रतिनिधि (सुविधा) नमूने

गैर-प्रतिनिधि (सुविधा) नमूनेकभी-कभी यादृच्छिक के रूप में संदर्भित किया जाता है, चूंकि नमूना तत्वों का चयन "यादृच्छिक" तरीके से किया जाता है - उन तत्वों का चयन किया जाता है जो चयन अवधि के दौरान सबसे अधिक सुलभ होते हैं या दिखाई देते हैं।

हमारा दैनिक जीवन ऐसे चयनों के उदाहरणों से भरा पड़ा है। हम दोस्तों के साथ बात करते हैं और उनकी प्रतिक्रियाओं और स्थितियों के आधार पर हम समाज में व्याप्त राजनीतिक पूर्वाग्रहों के बारे में निष्कर्ष निकालते हैं; एक स्थानीय रेडियो स्टेशन लोगों को कुछ विवादास्पद मुद्दे पर अपनी राय व्यक्त करने के लिए प्रोत्साहित करता है, उनकी राय को प्रचलित माना जाता है; हम स्वयंसेवकों के सहयोग का आह्वान करते हैं और उन लोगों के साथ काम करते हैं जो स्वेच्छा से हमारी मदद करते हैं। सुविधा नमूनों के साथ समस्या स्पष्ट है—हम निश्चित नहीं हो सकते कि इस प्रकार के नमूने वास्तव में लक्षित जनसंख्या का प्रतिनिधित्व करते हैं। हम अभी भी संदेह कर सकते हैं कि हमारे मित्रों की राय समाज में प्रचलित राजनीतिक विचारों को सही ढंग से दर्शाती है, लेकिन हम अक्सर यह मानना ​​चाहते हैं कि इस तरह से चुने गए बड़े नमूने प्रतिनिधि हैं। आइए हम एक उदाहरण के साथ इस तरह की धारणा की गिरावट को दिखाते हैं।
कुछ साल पहले, शहर के स्थानीय टेलीविजन स्टेशनों में से एक, जहां इस पुस्तक के लेखक रहते हैं, ने स्थानीय समुदाय के हित के विषयों पर एक दैनिक जनमत सर्वेक्षण किया। "द मैडिसन पल्स" नामक सर्वेक्षण निम्नानुसार आयोजित किए गए थे। हर शाम छह बजे समाचार के दौरान, स्टेशन ने दर्शकों से एक विशिष्ट विवादास्पद मुद्दे के संबंध में एक प्रश्न पूछा, जिसका सकारात्मक या नकारात्मक उत्तर देना आवश्यक था।

एक सकारात्मक उत्तर के मामले में, एक नकारात्मक उत्तर के मामले में - दूसरे फोन नंबर पर कॉल करना आवश्यक था। "के लिए" और "विरुद्ध" वोटों की संख्या स्वचालित रूप से गिना गया था। दस बजे के समाचार प्रसारण ने टेलीफोन सर्वेक्षण के परिणामों की सूचना दी। हर शाम 500 से 1000 के बीच लोगों ने स्टूडियो को इस या उस मुद्दे पर अपनी स्थिति व्यक्त करने के लिए बुलाया; टेलीविजन टिप्पणीकार ने मतदान के परिणामों की समाज में प्रचलित राय के रूप में व्याख्या की।

गैर-प्रतिनिधि (सुविधा) नमूना
कभी-कभी यादृच्छिक कहा जाता है, क्योंकि नमूना तत्वों का चयन "यादृच्छिक" तरीके से किया जाता है - उन तत्वों का चयन किया जाता है जो चयन अवधि के दौरान सबसे अधिक सुलभ होते हैं या दिखाई देते हैं।

छह घंटे के एक एपिसोड में, दर्शकों से निम्नलिखित प्रश्न पूछा गया: "क्या आपको नहीं लगता कि मैडिसन में शराब पीने की उम्र कम करके 18 कर दी जानी चाहिए?" मौजूदा कानूनी योग्यता 21 साल के अनुरूप है। दर्शकों ने असाधारण गतिविधि के साथ इस प्रश्न पर प्रतिक्रिया व्यक्त की - उस शाम लगभग 4,000 लोगों ने स्टूडियो को फोन किया, जिनमें से 78% आयु सीमा कम करने के पक्ष में थे। यह स्पष्ट प्रतीत होता है कि 4,000 का एक नमूना 180,000 के एक समुदाय का "प्रतिनिधि होना चाहिए"। ऐसा कुछ भी नहीं है। जैसा कि आप अनुमान लगा सकते हैं, कुछ आयु समूह दूसरों की तुलना में ज्ञात परिणामों में अधिक रुचि रखते थे। तदनुसार, यह आश्चर्य की बात नहीं थी कि कुछ सप्ताह बाद इस मुद्दे की चर्चा में, यह पता चला कि सर्वेक्षण के लिए आवंटित समय के दौरान छात्रों ने एक साथ काम किया। उन्होंने टेलीविजन को बारी-बारी से फोन किया, प्रत्येक ने कई बार। इस प्रकार, कानून के उदारीकरण के लिए न तो नमूना आकार और न ही अधिवक्ताओं का प्रतिशत आश्चर्यजनक था। नमूना प्रतिनिधि नहीं था।

केवल नमूना आकार बढ़ाने से यह प्रतिनिधि नहीं बन जाता है। नमूने का प्रतिनिधित्व आकार द्वारा नहीं, बल्कि तत्वों के चयन की उचित प्रक्रिया द्वारा सुनिश्चित किया जाता है। जब सर्वेक्षण प्रतिभागियों को स्वेच्छा से चुना जाता है या नमूना आइटम उनकी उपलब्धता के आधार पर चुने जाते हैं, तो नमूनाकरण योजना नमूने के प्रतिनिधित्व की गारंटी नहीं देती है। अनुभवजन्य साक्ष्य बताते हैं कि सुविधा के लिए चुने गए नमूने शायद ही कभी प्रतिनिधि होते हैं (उनके आकार की परवाह किए बिना)। टेलीफोन पोल, जो 800-900 वोट मानते हैं, बड़े लेकिन अप्रतिनिधि नमूनों का सबसे आम रूप है।

जानबूझकर नमूनाकरण
नियतात्मक (लक्षित) नमूनाकरण, जिसके तत्व मैन्युअल रूप से चुने गए हैं; उन तत्वों का चयन किया जाता है जो शोधकर्ता की राय में सर्वेक्षण के उद्देश्यों को पूरा करते हैं।
वांछित विशेषताओं के साथ उत्तरदाताओं के प्रारंभिक सेट को सेट करने के लिए शोधकर्ता की क्षमता के आधार पर जानबूझकर नमूनाकरण; फिर इन उत्तरदाताओं को सूचनार्थियों के रूप में उपयोग किया जाता है जो व्यक्तियों के आगे चयन का निर्धारण करते हैं।

दुर्भाग्य से, बहुत से लोग ऐसे सर्वेक्षणों के परिणामों को विश्वास के साथ मानते हैं। अंतर्राष्ट्रीय विपणन अनुसंधान में गैर-प्रतिनिधि नमूनों के उपयोग के सबसे विशिष्ट उदाहरणों में से कुछ देशों का सर्वेक्षण है, जो वर्तमान में उस देश के क्षेत्र में रहने वाले विदेशियों के नमूने पर आधारित है, जिसने सर्वेक्षण शुरू किया था (उदाहरण के लिए, स्कैंडिनेवियाई में रहने वाले) संयुक्त राज्य अमेरिका)। हालांकि इस तरह के नमूने विचाराधीन जनसंख्या के कुछ पहलुओं पर कुछ प्रकाश डाल सकते हैं, यह याद रखना चाहिए कि ये व्यक्ति आमतौर पर एक "अमेरिकीकृत" अभिजात वर्ग का प्रतिनिधित्व करते हैं, जिनके अपने देश के साथ संबंध मनमाने ढंग से हो सकते हैं। वर्णनात्मक या कारणात्मक सर्वेक्षणों के लिए गैर-प्रतिनिधि नमूनों के उपयोग की अनुशंसा नहीं की जाती है। वे केवल कुछ विचारों या विचारों के परीक्षण के उद्देश्य से खोजपूर्ण अनुसंधान में अनुमेय हैं, लेकिन इस मामले में भी जानबूझकर नमूनों का उपयोग करना बेहतर है।

जानबूझकर चयन

जानबूझकर नमूने को कभी-कभी कहा जाता है विकेन्द्रित; उनके तत्व, जो शोधकर्ता की राय में, अध्ययन के उद्देश्यों को पूरा करते हैं, मैन्युअल रूप से चुने जाते हैं। प्रोक्टर और जुआअपने सिनसिनाटी मुख्यालय के पास रहने वाले 13 से 17 वर्ष की आयु के लोगों को विज्ञापन दिखाते समय इस विधि का उपयोग किया। कंपनी के खाद्य और पेय विभाग ने किशोरों के इस समूह को एक प्रकार के उपभोक्ता नमूने के रूप में काम पर रखा है। $1,000 के बदले में सप्ताह में 10 घंटे काम करना और एक संगीत कार्यक्रम में जाना, उन्होंने टेलीविजन विज्ञापनों को देखा, उत्पाद प्रदर्शन देखने के लिए कंपनी प्रबंधकों के साथ सुपरमार्केट गए, नए उत्पादों का परीक्षण किया और खरीद व्यवहार पर चर्चा की। यादृच्छिक रूप से "भर्ती" की प्रक्रिया के माध्यम से नमूने के लिए प्रतिनिधियों का चयन करके, एक कंपनी उन गुणों पर ध्यान केंद्रित कर सकती है जिन्हें उपयोगी माना जाता है, जैसे किशोरों की खुद को स्पष्ट रूप से व्यक्त करने की क्षमता, जोखिम पर कि उनके विचार उनकी उम्र के प्रतिनिधि नहीं हो सकते हैं समूह।

जैसा कि पहले ही उल्लेख किया गया है, सुविचारित नमूने की विशिष्ट विशेषता इसके तत्वों का दिशात्मक चयन है। कुछ मामलों में, नमूना वस्तुओं का चयन इसलिए नहीं किया जाता है क्योंकि वे प्रतिनिधि हैं, बल्कि इसलिए कि वे शोधकर्ताओं को उनकी रुचि की जानकारी प्रदान कर सकते हैं। जब अदालत किसी विशेषज्ञ की गवाही से निर्देशित होती है, तो यह एक निश्चित अर्थ में जानबूझकर चयन के उपयोग का सहारा लेती है। इसी तरह की स्थिति अनुसंधान परियोजनाओं के विकास में प्रबल हो सकती है। मुद्दे के प्रारंभिक अध्ययन के दौरान, शोधकर्ता मुख्य रूप से अध्ययन की संभावनाओं को निर्धारित करने में रुचि रखता है, जो नमूना तत्वों के चयन को निर्धारित करता है।

व्यापक नमूने लेनाविशिष्ट प्रकार की आबादी के साथ व्यवहार करते समय एक प्रकार का जानबूझकर नमूनाकरण होता है। यह नमूना वांछित विशेषताओं के साथ उत्तरदाताओं के प्रारंभिक सेट को निर्दिष्ट करने की शोधकर्ता की क्षमता पर निर्भर करता है। इन उत्तरदाताओं को तब व्यक्तियों के आगे के चयन को निर्धारित करने के लिए सूचनार्थियों के रूप में उपयोग किया जाता है।

उदाहरण के लिए, कल्पना कीजिए कि एक कंपनी एक ऐसे उत्पाद की आवश्यकता का मूल्यांकन करना चाहती है जो बधिर लोगों को फोन पर संवाद करने की अनुमति दे। बधिर समुदाय में प्रमुख व्यक्तियों की पहचान करके शोधकर्ता इस समस्या को विकसित करना शुरू कर सकते हैं; उत्तरार्द्ध समूह के अन्य सदस्यों का नाम दे सकता है जो सर्वेक्षण में भाग लेने के लिए सहमत होंगे। इस रणनीति के साथ, नमूना स्नोबॉल की तरह बढ़ता है।

जबकि शोधकर्ता समस्या समाधान के प्रारंभिक चरणों में है, जब नियोजित सर्वेक्षण की संभावनाएं और संभावित सीमाएं निर्धारित की जा रही हैं, जानबूझकर नमूनाकरण का उपयोग बहुत प्रभावी हो सकता है। लेकिन किसी भी मामले में हमें इस प्रकार के नमूने की कमजोरियों के बारे में नहीं भूलना चाहिए, क्योंकि इसका उपयोग शोधकर्ता द्वारा वर्णनात्मक या कारणात्मक अध्ययन में भी किया जा सकता है, जो उनके परिणामों की गुणवत्ता को प्रभावित करने में धीमा नहीं होगा। इस भुलक्कड़पन का एक उत्कृष्ट उदाहरण उपभोक्ता मूल्य सूचकांक ("सीपीआई") है। जैसा कि सूडमैन बताते हैं ( सुदमन): "सीपीआई केवल 56 शहरों और महानगरीय क्षेत्रों के लिए निर्धारित है, जिसका चयन राजनीतिक कारक से भी प्रभावित होता है। वास्तव में, ये शहर केवल अपना प्रतिनिधित्व कर सकते हैं, जबकि सूचकांक कहा जाता है शहरवासियों के लिए उपभोक्ता मूल्य सूचकांक जो प्रति घंटा मजदूरी कमाते हैं*, और कर्मचारीऔर संयुक्त राज्य अमेरिका के किसी भी क्षेत्र में मूल्य स्तर को दर्शाते हुए एक सूचकांक के रूप में अधिकांश लोगों को दिखाई देता है। खुदरा दुकानों का चुनाव भी गैर-यादृच्छिक रूप से किया जाता है, जिसके परिणामस्वरूप संभावित नमूनाकरण त्रुटि का आकलन असंभव हो जाता है» (हमारे इटैलिक) 2।

* अर्थात् कर्मयोगी। - टिप्पणी। प्रति।

कोटा के नमूने

नियतात्मक नमूनाकरण का तीसरा प्रकार - कोटा के नमूने; सर्वेक्षण की गई आबादी में कुछ विशेषताओं वाले तत्वों के समान अनुपात को शामिल करके इसकी ज्ञात प्रतिनिधित्व क्षमता प्राप्त की जाती है (देखें "अनुसंधान विंडो 15.1")। उदाहरण के तौर पर, कैंपस में रहने वाले छात्रों का एक प्रतिनिधि नमूना बनाने की कोशिश करने पर विचार करें। यदि 500 ​​व्यक्तियों के एक निश्चित नमूने में एक भी वरिष्ठ छात्र नहीं है, तो हमें अध्ययन के तहत आबादी के लिए इस नमूने पर प्राप्त परिणामों को लागू करने की वैधता और वैधता पर संदेह करने का अधिकार होगा। आनुपातिक नमूने के साथ काम करते समय, शोधकर्ता यह सुनिश्चित कर सकता है कि नमूने में स्नातक छात्रों का अनुपात छात्रों की कुल संख्या में उनके अनुपात के अनुरूप हो।

मान लीजिए कि एक शोधकर्ता विश्वविद्यालय के छात्रों का एक चयनात्मक अध्ययन करता है, जबकि वह इस तथ्य में रुचि रखता है कि नमूना न केवल एक या दूसरे लिंग से संबंधित है, बल्कि पाठ्यक्रमों द्वारा उनका वितरण भी दर्शाता है। बता दें कि छात्रों की कुल संख्या 10,000: 3,200 नए, 2,600 द्वितीय वर्ष, 2,200 तृतीय वर्ष के छात्र और 2,000 चौथे वर्ष के छात्र हैं; जिनमें से 7,000 लड़के और 3,000 लड़कियां हैं। 1,000 लोगों के नमूने के लिए, आनुपातिक नमूना योजना के लिए 320 नए, 260 द्वितीय वर्ष, 220 तृतीय-वर्ष और 200 स्नातक, 700 लड़के और 300 लड़कियों की आवश्यकता होती है। शोधकर्ता प्रत्येक साक्षात्कारकर्ता को एक निश्चित कोटा देकर इस योजना को लागू कर सकता है, जो यह निर्धारित करेगा कि उसे किन छात्रों से संपर्क करना चाहिए।

कोटा नमूनानियतात्मक नमूना इस तरह से चुना जाता है कि कुछ विशेषताओं वाले नमूना तत्वों का अनुपात लगभग अध्ययन के तहत जनसंख्या में समान तत्वों के अनुपात से मेल खाता है; प्रत्येक क्षेत्र कार्यकर्ता को एक कोटा सौंपा गया है जो उस आबादी की विशेषताओं को निर्धारित करता है जिसके साथ उसे संपर्क करना चाहिए।

20 साक्षात्कार आयोजित करने वाले एक साक्षात्कारकर्ता को यह पूछने का निर्देश दिया जा सकता है:

            • छह प्रथम वर्ष के छात्र - पांच लड़के और एक लड़की;
            • छह परिष्कार - चार लड़के और दो लड़कियाँ;
            • तृतीय वर्ष के चार छात्र - तीन लड़के और एक लड़की;
            • चार चौथे वर्ष के छात्र - दो लड़के और दो लड़कियां।

ध्यान दें कि विशिष्ट नमूना तत्वों का चयन अनुसंधान योजना द्वारा निर्धारित नहीं किया जाता है, बल्कि साक्षात्कारकर्ता की पसंद से होता है, जिसे केवल उन शर्तों का पालन करने के लिए कहा जाता है जो कोटा द्वारा निर्धारित की गई थीं: साक्षात्कार पांच नए, एक नए व्यक्ति, आदि।

यह भी ध्यान दें कि यह कोटा छात्र आबादी के लिंग वितरण को सटीक रूप से दर्शाता है, लेकिन कुछ हद तक पाठ्यक्रमों में छात्रों के वितरण को विकृत करता है; 70% (20 में से 14) साक्षात्कार लड़कों के साथ होते हैं, लेकिन केवल 30% (20 में से 6) प्रथम वर्ष के छात्रों के साथ होते हैं, जबकि वे कुल छात्रों की संख्या का 32% होते हैं। प्रत्येक व्यक्तिगत साक्षात्कारकर्ता को आवंटित कोटा जनसंख्या में नियंत्रण विशेषताओं के वितरण को प्रतिबिंबित नहीं कर सकता है, और आमतौर पर नहीं करता है - केवल अंतिम नमूना आनुपातिक होना चाहिए।

यह याद रखना चाहिए कि आनुपातिक नमूनाकरण वस्तुनिष्ठ नमूनाकरण प्रक्रिया की तुलना में व्यक्तिगत, व्यक्तिपरक दृष्टिकोण या निर्णय पर अधिक निर्भर करता है। इसके अलावा, जानबूझकर नमूनाकरण के विपरीत, यहां व्यक्तिगत निर्णय परियोजना डेवलपर के लिए नहीं बल्कि साक्षात्कारकर्ता के लिए है। सवाल उठता है कि क्या आनुपातिक नमूनों को प्रतिनिधि माना जा सकता है, भले ही वे आबादी में निहित घटकों के अनुपात को पुन: पेश करते हैं जिनकी कुछ नियंत्रण विशेषताएं हैं। इस संबंध में, तीन टिप्पणियां करने की आवश्यकता है।

सबसे पहले, नमूना कुछ अन्य महत्वपूर्ण विशेषताओं में जनसंख्या से बहुत अलग हो सकता है, जो परिणाम पर गंभीर प्रभाव डाल सकता है। उदाहरण के लिए, यदि अध्ययन छात्रों के बीच नस्लीय पूर्वाग्रह की समस्या के लिए समर्पित है, तो यह उदासीन परिस्थिति नहीं हो सकती है कि उत्तरदाता कहाँ से आए हैं: शहर से या ग्रामीण इलाकों से। चूंकि "शहर/ग्रामीण से" विशेषता के लिए कोटा निर्दिष्ट नहीं किया गया है, इसलिए इस विशेषता का सटीक प्रतिनिधित्व असंभव हो जाता है। बेशक, ऐसा एक विकल्प है: सभी संभावित महत्वपूर्ण विशेषताओं के लिए कोटा निर्धारित करना। हालांकि, नियंत्रण विशेषताओं की संख्या में वृद्धि विनिर्देश की जटिलता की ओर ले जाती है। यह, बदले में, जटिल बनाता है - और कभी-कभी इसे असंभव भी बनाता है - नमूना तत्वों का चयन और, किसी भी मामले में, इसकी कीमत में वृद्धि होती है। यदि, उदाहरण के लिए, शहरी या ग्रामीण संबद्धता और सामाजिक आर्थिक स्थिति भी अध्ययन के लिए प्रासंगिक हैं, तो साक्षात्कारकर्ता को प्रथम वर्ष के छात्र की तलाश करनी पड़ सकती है जो शहरी और उच्च या मध्यम वर्ग का हो। मैं मानता हूं कि सिर्फ एक पुरुष फ्रेशमैन को ढूंढना ज्यादा आसान है।

दूसरे, यह सुनिश्चित करना बहुत कठिन है कि यह नमूना वास्तव में प्रतिनिधि है। बेशक, आप यह देखने के लिए नमूने की जांच कर सकते हैं कि क्या उन विशेषताओं का वितरण जो नियंत्रण में शामिल नहीं हैं, जनसंख्या में उनका वितरण। हालांकि, इस तरह के परीक्षण से केवल नकारात्मक निष्कर्ष निकल सकते हैं। वितरण के केवल विचलन को प्रकट करना संभव है। यदि इन विशेषताओं में से प्रत्येक के लिए नमूने और जनसंख्या के वितरण एक दूसरे को दोहराते हैं, तो एक संभावना है कि नमूना किसी अन्य विशेषता में जनसंख्या से भिन्न हो, जो स्पष्ट रूप से निर्दिष्ट नहीं है।

और अंत में, तीसरा। साक्षात्कारकर्ता, अपने स्वयं के उपकरणों पर छोड़े जाने के कारण, कुछ कार्यों के लिए प्रवृत्त होते हैं। वे भी अक्सर अपने दोस्तों से पूछताछ करने का सहारा लेते हैं। चूंकि वे अक्सर स्वयं साक्षात्कारकर्ताओं की तरह हो जाते हैं, इसलिए त्रुटि का खतरा होता है। इंग्लैंड के साक्ष्य बताते हैं कि कोटा के नमूने निम्न हैं:

  1. सबसे सुलभ तत्वों की भूमिका का अतिशयोक्ति;
  2. छोटे परिवारों की भूमिका को कम करके आंकना;
  3. बच्चों वाले परिवारों की भूमिका का अतिशयोक्ति;
  4. औद्योगिक श्रमिकों की भूमिका को कम करके आंकना;
  5. उच्चतम और निम्नतम आय वाले लोगों की भूमिका को कम करके आंकना;
  6. खराब शिक्षित नागरिकों की भूमिका को कम करके आंकना;
  7. निम्न सामाजिक स्थिति पर कब्जा करने वाले व्यक्तियों की भूमिका को कम करना।
साक्षात्कारकर्ता जो बेतरतीब राहगीरों को रोककर पूर्व निर्धारित कोटा का चयन करते हैं, संभावित उत्तरदाताओं की बड़ी संख्या वाले क्षेत्रों पर ध्यान केंद्रित करने की संभावना है, जैसे शॉपिंग मॉल, रेलवे स्टेशन और हवाई अड्डे, बड़े सुपरमार्केट के प्रवेश द्वार, और इसी तरह। इस अभ्यास से उन लोगों के समूहों का अधिक प्रतिनिधित्व होता है जो ऐसी जगहों पर अक्सर जाते हैं। जब घर के दौरे की आवश्यकता होती है, तो साक्षात्कारकर्ता अक्सर सुविधा से प्रेरित होते हैं।
उदाहरण के लिए, वे केवल दिन के दौरान सर्वेक्षण कर सकते हैं, जिससे श्रमिकों की राय को कम करके आंका जाता है। अन्य बातों के अलावा, वे जर्जर इमारतों में प्रवेश नहीं करते हैं और, एक नियम के रूप में, उन इमारतों की ऊपरी मंजिलों तक नहीं जाते हैं जिनमें लिफ्ट नहीं है।

अध्ययन के तहत समस्या की बारीकियों के आधार पर, ये प्रवृत्तियाँ विभिन्न प्रकार की त्रुटियों को जन्म दे सकती हैं, लेकिन डेटा विश्लेषण के स्तर पर उन्हें ठीक करना बहुत कठिन लगता है। दूसरी ओर, नमूना तत्वों के एक वस्तुनिष्ठ चयन के साथ, शोधकर्ताओं के पास उनके निपटान में कुछ उपकरण हैं जो किसी दिए गए नमूने की प्रतिनिधित्व क्षमता का आकलन करने की प्रक्रिया को सरल बनाना संभव बनाते हैं। ऐसे नमूनों की प्रतिनिधित्व क्षमता की समस्या का विश्लेषण करते समय, शोधकर्ता नमूने की संरचना को इतना अधिक नहीं मानता जितना कि इसके तत्वों के चयन की प्रक्रिया।

रिसर्च विंडो: शानदार! लेकिन इसे कौन पढ़ेगा?

हर साल, विज्ञापनदाता लाखों डॉलर उन विज्ञापनों पर खर्च करते हैं जो विज्ञापन युग से लेकर यांकी तक अनगिनत प्रकाशनों के पन्नों पर दिखाई देते हैं। पाठ और छवि का एक निश्चित मूल्यांकन इसके प्रकाशन से पहले किया जा सकता है, जैसा कि वे कहते हैं, घर पर, एक विज्ञापन एजेंसी में; विज्ञापन प्रकाशित होने के बाद तक इसका वास्तव में परीक्षण और न्याय नहीं किया जाता है, पाठक के ध्यान के लिए समान रूप से सावधानीपूर्वक तैयार किए गए दर्जनों विज्ञापनों से घिरा हुआ है।

कंपनी दुनिया भर में रोपर स्टार्चउपभोक्ता, व्यापार, व्यापार और पेशेवर पत्रिकाओं और समाचार पत्रों में रखे गए विज्ञापनों की पठनीयता का मूल्यांकन करता है। अनुसंधान के परिणाम विज्ञापनदाताओं और एजेंसियों के ध्यान में लाए जाते हैं - बेशक, एक उचित शुल्क के लिए। क्योंकि विज्ञापनदाता अपने विज्ञापनों को उपभोक्ता, कंपनी तक पहुँचाने के लिए हर दिन बड़ी लंबाई में जाते हैं स्टार्चएक नमूना बनाने का फैसला किया जो ग्राहकों को विज्ञापन की प्रभावशीलता के बारे में समय पर और सटीक जानकारी देगा। हर साल कंपनी स्टार्चलगभग 20,000 विज्ञापनों पर विचार करते हुए, 50,000 से अधिक लोगों का साक्षात्कार लिया। सालाना लगभग 500 व्यक्तिगत प्रकाशनों का अध्ययन किया गया।

स्टार्च ने एक लिंग के न्यूनतम 100 पाठकों और दूसरे लिंग के 100 पाठकों के साथ आनुपातिक नमूनाकरण का उपयोग किया। स्टार्च ने निष्कर्ष निकाला कि इस नमूना आकार के साथ, पठनीयता के स्तर में मुख्य विचलन स्थिर हो गए। 18 वर्ष से अधिक आयु के पाठकों का व्यक्तिगत रूप से साक्षात्कार किया गया था, और सभी प्रकाशनों पर विचार किया गया था, विशेष आबादी के लिए अभिप्रेत लोगों को छोड़कर (जैसे, उपयुक्त आयु की लड़कियों का सत्रह पत्रिका के प्रकाशनों का मूल्यांकन करने के लिए साक्षात्कार किया गया था)।

सर्वेक्षण करते समय, किसी विशेष प्रकाशन के वितरण क्षेत्र को ध्यान में रखा गया। मान लीजिए कि लॉस एंजिल्स पत्रिका के अध्ययन ने दक्षिणी कैलिफोर्निया में रहने वाले पाठकों को देखा। "समय" का राष्ट्रव्यापी अध्ययन किया गया था। सर्वेक्षण पत्रिका के अलग-अलग मुद्दों के लिए समर्पित था और एक ही समय में 20-30 शहरों में आयोजित किया गया था।

प्रत्येक साक्षात्कारकर्ता को साक्षात्कारों का एक छोटा कोटा दिया गया था, जो सर्वेक्षण परिणामों के विचलन को कम करने के उद्देश्य से कार्य करता था। विभिन्न आय वाले विभिन्न व्यवसायों और आयु के लोगों के बीच प्रश्नावली वितरित की गई। इस तरह के प्रत्येक अध्ययन ने काफी व्यापक पाठकों के लिए पदों को प्रस्तुत करना संभव बना दिया। कई पेशेवर, व्यावसायिक और उद्योग प्रकाशनों पर विचार करते समय, उनकी सदस्यता और वितरण की बारीकियों को भी ध्यान में रखा गया। काफी संकीर्ण संचलन वाले प्रकाशनों को समर्पित सदस्यता सूची ने स्वीकार्य उत्तरदाताओं का चयन करना संभव बना दिया।

प्रत्येक सर्वेक्षण में, साक्षात्कारकर्ताओं ने उत्तरदाताओं से प्रकाशन के माध्यम से ब्राउज़ करने के लिए कहा और पूछा कि क्या उन्होंने कोई विज्ञापन देखा है। यदि उत्तर हां था, तो रजिस्ट्रार ने विज्ञापन की स्वीकृति की डिग्री का आकलन करने के लिए कई प्रश्न पूछे।

यह आकलन तीन गुना हो सकता है:

  • ध्यान दें: जिन्होंने पहले ही इस तरह की घोषणा के प्रकट होने के तथ्य पर ध्यान दिया है।
  • परिचित: जिन्हें विज्ञापन का कोई हिस्सा याद है, जो विज्ञापित ट्रेडमार्क या विज्ञापनदाता से संबंधित है।
  • पढ़ें: विज्ञापन का कम से कम आधा हिस्सा पढ़ने वाले लोग।

सभी विज्ञापनों का सर्वेक्षण करने के बाद, साक्षात्कारकर्ताओं ने प्रमुख वर्गीकरण जानकारी दर्ज की: लिंग, आयु, व्यवसाय, वैवाहिक स्थिति, राष्ट्रीयता, आय, परिवार का आकार और परिवार की संरचना, जो पाठक की रुचि की डिग्री के क्रॉस-टेबलेशन की अनुमति देती है।

जब ठीक से उपयोग किया जाता है, तो कंपनी डेटा स्टार्चविज्ञापनदाताओं और एजेंसियों को असफल और सफल दोनों प्रकार की विज्ञापन योजनाओं की पहचान करने की अनुमति दें जो पाठक का ध्यान आकर्षित करती हैं और उनका ध्यान खींचती हैं। इस तरह की जानकारी उन विज्ञापनदाताओं के लिए अत्यंत मूल्यवान है जो मुख्य रूप से अपने विज्ञापन अभियान की प्रभावशीलता में रुचि रखते हैं।

स्रोत: रोपर स्टार्च वर्ल्डवाइड, ममरोनेक, एनवाई 10543।

संभाव्यता के नमूने

शोधकर्ता संभाव्यता नमूने में जनसंख्या के किसी भी तत्व को शामिल करने की संभावना निर्धारित कर सकता है, क्योंकि इसके तत्वों का चयन कुछ वस्तुनिष्ठ प्रक्रिया के आधार पर किया जाता है और यह शोधकर्ता या क्षेत्र कार्यकर्ता की सनक और पूर्वाग्रहों पर निर्भर नहीं करता है। चूंकि तत्व चयन प्रक्रिया वस्तुनिष्ठ है, शोधकर्ता प्राप्त परिणामों की विश्वसनीयता का मूल्यांकन कर सकता है, जो नियतात्मक नमूनों के मामले में असंभव था, चाहे बाद के तत्वों का चयन कितना भी सावधानी से किया गया हो।

यह नहीं सोचा जाना चाहिए कि संभाव्य नमूने हमेशा नियतात्मक लोगों की तुलना में अधिक प्रतिनिधि होते हैं। वास्तव में, नियतात्मक नमूना भी अधिक प्रतिनिधि हो सकता है। संभाव्यता नमूने का लाभ यह है कि वे संभावित नमूनाकरण त्रुटि का अनुमान लगाने की अनुमति देते हैं। यदि शोधकर्ता नियतात्मक नमूने के साथ काम करता है, तो उसके पास अध्ययन के उद्देश्यों के लिए इसकी पर्याप्तता का आकलन करने के लिए एक वस्तुनिष्ठ तरीका नहीं है।

सामान्य उद्देश्यरहित नमूना

अधिकांश लोगों को साधारण यादृच्छिक नमूने किसी न किसी रूप में मिलते हैं, या तो संस्थान में एक सांख्यिकी पाठ्यक्रम के भाग के रूप में, या समाचार पत्रों या पत्रिकाओं में प्रासंगिक अध्ययनों के परिणामों के बारे में पढ़कर। एक साधारण यादृच्छिक नमूने में, नमूने में शामिल प्रत्येक तत्व में अध्ययन के तहत तत्वों के बीच होने की समान संभावना होती है, और मूल जनसंख्या में तत्वों का कोई भी संयोजन संभावित रूप से एक नमूना बन सकता है। उदाहरण के लिए, यदि हम किसी विशेष कॉलेज में नामांकित सभी छात्रों का एक सरल यादृच्छिक नमूना बनाना चाहते हैं, तो हमें बस सभी छात्रों की एक सूची बनाने की आवश्यकता है, इसमें प्रत्येक नाम के लिए एक संख्या निर्दिष्ट करें, और एक कंप्यूटर का उपयोग यादृच्छिक रूप से दिए गए चयन के लिए करें। तत्वों की संख्या।

जनसंख्या

जनसंख्या
कुछ निश्चित शर्तों को पूरा करने वाले तत्वों का एक समूह; इसे अध्ययन (लक्ष्य) जनसंख्या भी कहा जाता है।
पैरामीटर
सामान्य या अध्ययनित जनसंख्या की एक निश्चित विशेषता या संकेतक।

सामान्य, या अध्ययन, सेटवह संग्रह है जिससे चयन किया जाता है। इस जनसंख्या (जनसंख्या) को कई विशिष्ट मापदंडों द्वारा वर्णित किया जा सकता है जो सामान्य जनसंख्या की विशेषताएं हैं, जिनमें से प्रत्येक एक निश्चित मात्रात्मक संकेतक है जो एक जनसंख्या को दूसरे से अलग करता है।

कल्पना कीजिए कि जिस जनसंख्या का अध्ययन किया जा रहा है वह सिनसिनाटी की पूरी वयस्क आबादी है। इस जनसंख्या का वर्णन करने के लिए कई मापदंडों का उपयोग किया जा सकता है: औसत आयु, तृतीयक शिक्षा के साथ जनसंख्या का अनुपात, आय स्तर, आदि। ध्यान दें कि इन सभी संकेतकों का एक निश्चित मूल्य है। बेशक, हम अध्ययन के तहत जनसंख्या की पूरी जनगणना करके उनकी गणना कर सकते हैं। आमतौर पर, हालांकि, हम योग्यता पर भरोसा नहीं करते हैं, लेकिन जनसंख्या के आवश्यक मापदंडों को निर्धारित करने के लिए चयनात्मक अवलोकन के दौरान प्राप्त मूल्यों का चयन और उपयोग करते हैं।

हम बताते हैं कि तालिका में क्या कहा गया है। 15.1 20 लोगों की काल्पनिक आबादी का एक उदाहरण। इस तरह की छोटी काल्पनिक आबादी के साथ काम करने के कई फायदे हैं। सबसे पहले, छोटा सा नमूना आकार उन जनसंख्या मापदंडों की गणना करना आसान बनाता है जिनका उपयोग इसका वर्णन करने के लिए किया जा सकता है। दूसरे, यह खंड आपको यह समझने की अनुमति देता है कि जब एक विशेष प्रतिचयन योजना को अपनाया जाता है तो क्या हो सकता है। ये दोनों विशेषताएँ "सत्य" और इस मामले में ज्ञात जनसंख्या मूल्य के साथ नमूना परिणामों की तुलना करना आसान बनाती हैं, जो उस विशिष्ट स्थिति के मामले में नहीं है जिसमें वास्तविक जनसंख्या मूल्य अज्ञात है। इस मामले में "सही" मूल्य के साथ मूल्यांकन की तुलना विशेष स्पष्टता प्राप्त करती है।

मान लीजिए कि हम दो बेतरतीब ढंग से चुनी गई वस्तुओं से, मूल जनसंख्या में व्यक्तियों की औसत आय का अनुमान लगाना चाहते हैं। औसत आय इसका पैरामीटर होगा। इस औसत मूल्य का अनुमान लगाने के लिए, जिसे हम μ के रूप में निरूपित करते हैं, हमें सभी मानों के योग को उनकी संख्या से विभाजित करना चाहिए:

जनसंख्या माध्य μ = जनसंख्या तत्वों का योग / तत्वों की संख्या।

हमारे मामले में, गणना देते हैं:

व्युत्पन्न जनसंख्या

व्युत्पन्न जनसंख्यासभी संभावित नमूने शामिल होते हैं जिन्हें किसी दिए गए नमूनाकरण योजना (नमूना योजना) के अनुसार सामान्य आबादी से चुना जा सकता है। आंकड़ेनमूने की एक विशेषता या संकेतक है। नमूना आँकड़ा मान का उपयोग किसी विशेष जनसंख्या पैरामीटर का अनुमान लगाने के लिए किया जाता है। अलग-अलग नमूने एक ही जनसंख्या पैरामीटर के लिए अलग-अलग आँकड़े या अनुमान प्रदान करते हैं।

व्युत्पन्न जनसंख्या
सभी संभावित अलग-अलग नमूनों का सेट जो किसी दिए गए नमूनाकरण योजना के अनुसार सामान्य आबादी से चुने जा सकते हैं। सांख्यिकी एक नमूने की एक विशेषता या माप।

उन सभी संभावित नमूनों के व्युत्पन्न सेट पर विचार करें जिन्हें 20 व्यक्तियों की हमारी काल्पनिक आबादी से एक नमूना योजना द्वारा चुना जा सकता है जो मानता है कि नमूना आकार है एन = 2यादृच्छिक गैर-दोहराव चयन द्वारा प्राप्त किया जा सकता है।

एक पल के लिए मान लीजिए कि जनसंख्या की प्रत्येक इकाई के लिए डेटा - हमारे मामले में, किसी व्यक्ति का नाम और आय - हलकों पर लिखा जाता है, जिसके बाद उन्हें एक जग में उतारा जाता है और मिलाया जाता है। शोधकर्ता एक सर्कल को जग से निकालता है, उसमें से जानकारी लिखता है और एक तरफ रख देता है। वह जग से लिए गए दूसरे मग के साथ भी ऐसा ही करता है। फिर शोधकर्ता दोनों मगों को जग में लौटाता है, इसकी सामग्री को मिलाता है और क्रियाओं के समान क्रम को दोहराता है। तालिका में। 15.2 नामित प्रक्रिया के संभावित परिणामों को दर्शाता है। 20 हलकों के लिए, 190 ऐसे युग्म संयोजन संभव हैं।

प्रत्येक संयोजन के लिए, आप औसत आय की गणना कर सकते हैं। नमूने के लिए कहते हैं एबी (के = 1)

-ई नमूना माध्य = नमूनों का योग / नमूनों की संख्या =

अंजीर पर। 15.4 पूरी आबादी के लिए औसत आय का अनुमान और नमूने के लिए प्रत्येक अनुमान के लिए त्रुटि की मात्रा दिखाता है के = 25, 62,108,147और 189 .

नमूना औसत आय (सांख्यिकी) और जनसंख्या माध्य आय (एक पैरामीटर जिसे अनुमानित करने की आवश्यकता है) के बीच संबंध पर विचार करने के लिए आगे बढ़ने से पहले, आइए व्युत्पन्न जनसंख्या के बारे में कुछ शब्द कहें। सबसे पहले, व्यवहार में हम इस तरह के समुच्चय को संकलित नहीं करते हैं। इसमें बहुत अधिक समय और प्रयास की आवश्यकता होगी। व्यवसायी आवश्यक आकार के केवल एक नमूने को संकलित करने तक सीमित है। शोधकर्ता प्रयोग करता है अवधारणाव्युत्पन्न जनसंख्या और अंतिम निष्कर्ष तैयार करते समय नमूनाकरण वितरण की संबद्ध अवधारणा।

नीचे कैसे दिखाया जाएगा। दूसरे, यह याद रखना चाहिए कि एक व्युत्पन्न जनसंख्या को सभी संभावित विभिन्न नमूनों की समग्रता के रूप में परिभाषित किया जाता है, जिन्हें किसी दिए गए नमूनाकरण योजना के अनुसार सामान्य आबादी से चुना जा सकता है। जब प्रतिचयन योजना का कोई भाग बदला जाता है, तो व्युत्पन्न जनसंख्या भी बदल जाती है। इसलिए, यदि, हलकों को चुनते समय, शोधकर्ता दूसरे को हटाने से पहले हटाए गए डिस्क में से पहला जग में लौटाता है, तो व्युत्पन्न सेट में शामिल होगा।

नमूने एए, बीबी, आदि। यदि गैर-दोहराए गए नमूनों की संख्या 2 के बजाय 3 है, तो एबीसी प्रकार के नमूने होंगे, और उनमें से 1140 होंगे, न कि 190, जैसा कि पिछले मामले में था। जब नमूने के तत्वों को निर्धारित करने के लिए सरल यादृच्छिक चयन को किसी अन्य विधि में बदल दिया जाता है, तो व्युत्पन्न जनसंख्या भी बदल जाती है।

यह भी याद रखना चाहिए कि सामान्य आबादी से किसी दिए गए आकार के नमूने का चयन व्युत्पन्न आबादी से एक तत्व (190 में से 1) के चयन के बराबर है। यह तथ्य हमें कई सांख्यिकीय निष्कर्ष निकालने की अनुमति देता है।

नमूना माध्य और सामान्य माध्य

क्या हम वास्तविक जनसंख्या माध्य के साथ नमूना माध्य की बराबरी कर सकते हैं? किसी भी मामले में, हम इस तथ्य से आगे बढ़ते हैं कि वे आपस में जुड़े हुए हैं। हालाँकि, हम यह भी मानते हैं कि कोई त्रुटि होगी। उदाहरण के लिए, यह माना जा सकता है कि इंटरनेट उपयोगकर्ताओं से प्राप्त जानकारी "साधारण" आबादी के सर्वेक्षण के परिणामों से काफी भिन्न होगी। अन्य मामलों में, हम काफी सटीक मिलान मान सकते हैं, अन्यथा हम सामान्य मूल्य का अनुमान लगाने के लिए नमूना मूल्य का उपयोग नहीं कर सकते। लेकिन ऐसा करने में हमसे कितनी बड़ी गलती हो सकती है?

तालिका में निहित सभी नमूना साधनों को जोड़ते हैं। 15.2, और परिणामी योग को नमूनों की संख्या से विभाजित करें, यानी, औसत औसत करें।
हमें निम्नलिखित परिणाम प्राप्त होंगे:

यह सामान्य आबादी के औसत मूल्य के साथ मेल खाता है। उनका कहना है कि इस मामले में हम निपट रहे हैं निष्पक्ष आँकड़ा.

एक आँकड़ा निष्पक्ष कहलाता है यदि सभी संभावित नमूनों में इसका औसत अनुमानित जनसंख्या पैरामीटर के बराबर है। ध्यान दें कि हम यहां किसी विशेष मूल्य के बारे में बात नहीं कर रहे हैं।आंशिक अनुमान वास्तविक मान से बहुत दूर हो सकता है - उदाहरण के लिए, AB या ST नमूने लें। कुछ मामलों में, किसी भी संभावित नमूने पर विचार करते समय जनसंख्या का सही मूल्य प्राप्त नहीं हो सकता है, भले ही आँकड़े निष्पक्ष हों। हमारे मामले में, यह मामला नहीं है: कई संभावित नमूने - उदाहरण के लिए, एटी - वास्तविक जनसंख्या माध्य के बराबर एक नमूना माध्य देता है।

इन नमूना अनुमानों के वितरण और विशेष रूप से अनुमानों के इस फैलाव और जनसंख्या में आय के स्तर में भिन्नता के बीच संबंध पर विचार करना समझ में आता है। सामान्य जनसंख्या के विचरण का उपयोग भिन्नता के माप के रूप में किया जाता है। सामान्य जनसंख्या के विचरण को निर्धारित करने के लिए, हमें माध्य से प्रत्येक मान के विचलन की गणना करनी चाहिए, सभी विचलनों के वर्गों को जोड़ना चाहिए और परिणामी राशि को शब्दों की संख्या से विभाजित करना चाहिए। सामान्य जनसंख्या के प्रसरण को a ^ से निरूपित करें। तब:

जनसंख्या विचरण σ 2 = प्रत्येक तत्व के वर्ग अंतर का योग
जनसंख्या और जनसंख्या औसत / जनसंख्या तत्वों की संख्या =

फैलाव औसत मूल्यआय स्तर को इसी तरह परिभाषित किया जा सकता है। अर्थात्, हम प्रत्येक माध्य के विचलन को उनके कुल माध्य से निर्धारित करके, विचलनों के वर्गों का योग करके, और परिणामी योग को शब्दों की संख्या से विभाजित करके प्राप्त कर सकते हैं।

हम आम जनसंख्या में आय के स्तर के विचरण का उपयोग करके औसत आय स्तर के विचरण को दूसरे तरीके से भी परिभाषित कर सकते हैं, क्योंकि इन दो मात्राओं के बीच सीधा संबंध है। सटीक होने के लिए, ऐसे मामलों में जहां नमूना जनसंख्या के केवल एक छोटे हिस्से का प्रतिनिधित्व करता है, नमूना माध्य का भिन्नता नमूना आकार से विभाजित जनसंख्या के भिन्नता के बराबर है:

जहां σ x 2 आय स्तर के औसत नमूना मूल्य का भिन्नता है, σ 2 सामान्य जनसंख्या में आय स्तर का भिन्नता है, एन- नमूने का आकार।

अब आइए सामान्य आबादी में मात्रात्मक विशेषता के वितरण के साथ परिणामों के वितरण की तुलना करें। चित्र 15.5 से पता चलता है कि बॉक्स ए में दिखाए गए जनसंख्या विशेषता का वितरण बहु-शिखर है (20 मानों में से प्रत्येक केवल एक बार प्रकट होता है) और 9400 के वास्तविक जनसंख्या माध्य के बारे में सममित है।

नमूने का वितरण
किसी दिए गए नमूनाकरण योजना के तहत आबादी से निकाले जा सकने वाले सभी संभावित अलग-अलग नमूने के लिए गणना की गई किसी विशेष आंकड़े के मूल्यों का वितरण।

फ़ील्ड बी में दिखाए गए ग्रेड का वितरण तालिका में डेटा पर आधारित है। 15.3, जो बदले में तालिका से मान निर्दिष्ट करके संकलित किया गया था। समूह में उनकी संख्या की बाद की गणना के साथ, उनके आकार के आधार पर एक या दूसरे समूह को 15.2। फ़ील्ड बी एक पारंपरिक हिस्टोग्राम है, जिसे सांख्यिकी पाठ्यक्रम के अध्ययन की शुरुआत में माना जाता है, जो प्रतिनिधित्व करता है नमूने का वितरणआँकड़े। हम निम्नलिखित पारित करते हुए ध्यान देते हैं: नमूनाकरण वितरण की अवधारणा आंकड़ों की सबसे महत्वपूर्ण अवधारणा है, यह सांख्यिकीय अनुमानों के निर्माण की आधारशिला है। अध्ययन किए गए आँकड़ों के ज्ञात नमूना वितरण के अनुसार, हम सामान्य जनसंख्या के संगत पैरामीटर के बारे में निष्कर्ष निकाल सकते हैं। यदि, दूसरी ओर, यह केवल ज्ञात है कि नमूना अनुमान नमूने से नमूने में बदलता है, लेकिन इस परिवर्तन की प्रकृति अज्ञात है, तो इस अनुमान से जुड़ी नमूना त्रुटि को निर्धारित करना असंभव हो जाता है। चूंकि एक अनुमान का नमूना वितरण वर्णन करता है कि यह नमूने से नमूने में कैसे बदलता है, यह नमूना अनुमान की वैधता निर्धारित करने के लिए एक आधार प्रदान करता है। यह इस कारण से है कि संभाव्यता नमूनाकरण डिजाइन सांख्यिकीय अनुमान के लिए बहुत महत्वपूर्ण है।

नमूने में जनसंख्या के प्रत्येक सदस्य को शामिल करने की ज्ञात संभावनाओं को देखते हुए, साक्षात्कारकर्ता विभिन्न आँकड़ों का नमूना वितरण पा सकते हैं। यह ऐसे वितरण हैं जिन पर शोधकर्ता भरोसा करते हैं - चाहे वह नमूना माध्य हो, नमूना का अनुपात, नमूना भिन्नता, या कुछ अन्य आंकड़े - जब सामान्य आबादी के लिए नमूना अवलोकन के परिणाम का विस्तार किया जाता है। यह भी ध्यान दें कि आकार 2 के नमूने के लिए, नमूना माध्य का वितरण असमान है और वास्तविक माध्य के बारे में सममित है।

तो हमने दिखाया है कि:

  1. सभी संभावित नमूना माध्यों का माध्य सामान्य माध्य के बराबर है।
  2. नमूने के साधनों का विचरण किसी तरह से सामान्य विचरण से संबंधित है।
  3. नमूना साधनों का वितरण असमान है, जबकि सामान्य आबादी में मात्रात्मक विशेषता के मूल्यों का वितरण बहु-मोडल है।

केंद्रीय सीमा प्रमेय

एक प्रमेय कह रहा है कि आकार के साधारण यादृच्छिक नमूने के लिए एन, बड़े पैमाने पर सामान्य औसत μ और विचरण σ 2 के साथ सामान्य आबादी से अलग एननमूना माध्य x का वितरण μ के बराबर केंद्र और एक भिन्नता σ 2 के साथ सामान्य हो जाता है। इस सन्निकटन की सटीकता बढ़ने के साथ बढ़ती है एन.

केंद्रीय सीमा प्रमेय। अनुमानों के असमान वितरण को केंद्रीय सीमा प्रमेय की अभिव्यक्ति के रूप में माना जा सकता है, जिसमें कहा गया है कि मात्रा के सरल यादृच्छिक नमूने के लिए एन, बड़े के लिए सही मतलब μ और विचरण σ 2 के साथ सामान्य आबादी से चुना गया एननमूने का वितरण सही मतलब के बराबर केंद्र के साथ सामान्य दृष्टिकोण और नमूना आकार के जनसंख्या भिन्नता के अनुपात के बराबर एक भिन्नता है, यानी:

यह सन्निकटन अधिक से अधिक सटीक हो जाता है एन. यह याद रखना। जनसंख्या के प्रकार के बावजूद, पर्याप्त बड़े आकार के नमूनों के लिए नमूना साधनों का वितरण सामान्य होगा। पर्याप्त रूप से बड़ी मात्रा का क्या अर्थ है? यदि सामान्य आबादी की मात्रात्मक विशेषता के मूल्यों का वितरण सामान्य है, तो नमूने के वितरण का मतलब नमूने के साथ मात्रा के साथ होता है एन=1। यदि जनसंख्या में एक चर (मात्रात्मक विशेषता) का वितरण सममित है लेकिन सामान्य नहीं है, तो बहुत छोटे आकार के नमूने नमूना साधनों का सामान्य वितरण देंगे। यदि सामान्य जनसंख्या की मात्रात्मक विशेषता के वितरण में स्पष्ट विषमता है, तो बड़े नमूनों की आवश्यकता है। और फिर भी, नमूना माध्य का वितरण केवल तभी सामान्य माना जा सकता है जब हम पर्याप्त आकार के नमूने के साथ काम कर रहे हों।

एक सामान्य वक्र का उपयोग करके निष्कर्ष निकालने के लिए, सामान्य जनसंख्या की मात्रात्मक विशेषता के मूल्यों के वितरण की सामान्यता की स्थिति से आगे बढ़ना आवश्यक नहीं है। बल्कि, हम केंद्रीय सीमा प्रमेय पर भरोसा करते हैं और, जनसंख्या वितरण के आधार पर, ऐसा नमूना आकार निर्धारित करते हैं जो हमें एक सामान्य वक्र के साथ काम करने की अनुमति देगा। सौभाग्य से, आँकड़ों का सामान्य वितरण अपेक्षाकृत छोटे आकार के नमूनों द्वारा प्रदान किया जाता है - अंजीर। 15.6 इस परिस्थिति को स्पष्ट रूप से प्रदर्शित करता है। विश्वास अंतराल अनुमान। क्या उपरोक्त सामान्य औसत के बारे में कुछ निष्कर्ष निकालने में हमारी मदद कर सकता है? दरअसल, व्यवहार में, हम केवल एक का चयन करते हैं, और किसी दिए गए आकार के सभी संभावित नमूने नहीं, और प्राप्त आंकड़ों के आधार पर, हम लक्ष्य समूह के बारे में कुछ निष्कर्ष निकालते हैं।

यह कैसे होता है? जैसा कि आप जानते हैं, एक सामान्य बंटन के साथ, सभी प्रेक्षणों के एक निश्चित प्रतिशत का एक निश्चित मानक विचलन होता है; कहते हैं कि 95% प्रेक्षण माध्य के ±1.96 मानक विचलन के भीतर फिट होते हैं। नमूना साधनों का सामान्य वितरण, जिस पर केंद्रीय सीमा प्रमेय लागू किया जा सकता है, इस अर्थ में कोई अपवाद नहीं है। ऐसे नमूना वितरण का माध्य सामान्य माध्य μ के बराबर होता है, और इसके मानक विचलन को माध्य की मानक त्रुटि कहा जाता है:

यह पता चला है कि:

  • नमूने के 68.26% का अर्थ है सामान्य माध्य से ± σ x से अधिक नहीं;
  • नमूने के 95.45% का अर्थ है सामान्य माध्य से ± σ x से अधिक नहीं;
  • 99.73% नमूने का अर्थ है सामान्य माध्य से ± σ x से अधिक नहीं,

यानी चुने गए मूल्य के आधार पर नमूने का एक निश्चित अनुपात जेडमूल्य द्वारा निर्धारित अंतराल में संलग्न किया जाएगा जेड. इस अभिव्यक्ति को असमानता के रूप में फिर से लिखा जा सकता है:

सामान्य औसत - जेड < Среднее по выборке < Генеральное среднее + जेड(माध्य की मानक त्रुटि)

इस प्रकार, एक निश्चित संभावना के साथ नमूना मतलब अंतराल में है, जिसकी सीमाएं वितरण के औसत मूल्य का योग और अंतर और मानक विचलन की एक निश्चित संख्या है। इस असमानता को रूप में परिवर्तित किया जा सकता है:

नमूना माध्य - जेड(माध्य की मानक त्रुटि)< Генеральное среднее < Среднее по выборке + जेड(माध्य की मानक त्रुटि)

यदि अनुपात 15.1 देखा जाता है, उदाहरण के लिए, 95% मामलों में ( जेड= 1.96), तो 95% मामलों में अनुपात 15.2 भी देखा जाता है। ऐसे मामलों में जहां निष्कर्ष एकल नमूना माध्य पर आधारित है, हम अभिव्यक्ति 15.2 का उपयोग करते हैं।

अभिव्यक्ति 15.2 को याद रखना महत्वपूर्ण है इसका मतलब यह नहीं है कि किसी दिए गए नमूने के अनुरूप अंतराल में आवश्यक रूप से सामान्य माध्य शामिल होना चाहिए। अंतराल का चयन प्रक्रिया से अधिक लेना-देना है।इस माध्य के आसपास बने अंतराल में सही जनसंख्या माध्य शामिल हो भी सकता है और नहीं भी। किए गए निष्कर्षों की शुद्धता में हमारा विश्वास इस तथ्य पर आधारित है कि चयनित नमूनाकरण योजना के अनुसार निर्मित सभी अंतरालों में से 95% में सही माध्य होगा। हम मानते हैं कि हमारा नमूना इस 95% का है।

इस महत्वपूर्ण बिंदु को स्पष्ट करने के लिए, एक पल के लिए कल्पना करें कि आकार के नमूने के लिए नमूने का वितरण मतलब है एन= 2 हमारे काल्पनिक उदाहरण में सामान्य है। तालिका 15.4 दिए गए डिज़ाइन के अनुसार चुने जा सकने वाले संभावित 190 नमूनों में से पहले 10 के परिणामों को ग्राफिक रूप से दर्शाती है। ध्यान दें कि 10 में से केवल 7 अंतरालों में एक सामान्य या सही माध्य शामिल होता है। निष्कर्ष की शुद्धता में विश्वास किसी निजी आकलन के कारण नहीं, बल्कि ठीक-ठीक है प्रक्रियाअनुमान। यह प्रक्रिया ऐसी है कि 100 नमूनों के लिए जिनके लिए नमूना माध्य और विश्वास अंतराल की गणना की जाएगी, 95 मामलों में इस अंतराल में सही सामान्य मान शामिल होगा। इस नमूने की सटीकता उस प्रक्रिया से निर्धारित होती है जिसके द्वारा नमूना बनाया गया था। एक प्रतिनिधि नमूना डिजाइन सभी नमूनों की प्रतिनिधित्व क्षमता की गारंटी नहीं देता है। सांख्यिकीय अनुमान प्रक्रियाएं नमूनाकरण योजना के प्रतिनिधित्व पर आधारित होती हैं, यही वजह है कि यह प्रक्रिया संभाव्यता नमूनों के लिए इतनी महत्वपूर्ण है।

संभाव्य नमूनाकरण हमें परिणामों की सटीकता का मूल्यांकन करने की अनुमति देता है क्योंकि वास्तविक मूल्य के अनुमानों की निकटता होती है। आँकड़ों की मानक त्रुटि जितनी बड़ी होगी, अनुमानों के बिखराव की डिग्री उतनी ही अधिक होगी और प्रक्रिया की सटीकता कम होगी।

कुछ लोग इस तथ्य से भ्रमित हो सकते हैं कि आत्मविश्वास का स्तर प्रक्रिया से संबंधित है, न कि किसी विशेष नमूना मूल्य से, हालांकि, यह याद रखना चाहिए कि सामान्य मूल्य के अनुमान के विश्वास स्तर के मूल्य को इसके द्वारा समायोजित किया जा सकता है शोधकर्ता। यदि आप जोखिम नहीं लेना चाहते हैं और डरते हैं कि आप उन पांच नमूना अंतरालों में से एक में आ सकते हैं जिसमें जनसंख्या माध्य शामिल नहीं है, तो आप 99% विश्वास अंतराल चुन सकते हैं जहां सौ नमूना अंतरालों में से केवल एक में शामिल नहीं है जनसंख्या का मतलब। इसके अलावा, यदि आप नमूना आकार बढ़ा सकते हैं, तो आप जनसंख्या मूल्य के अनुमान की वांछित सटीकता प्रदान करते हुए, परिणाम में विश्वास की डिग्री बढ़ा सकते हैं। हम इस बारे में चैप में अधिक विस्तार से बात करेंगे। 17.

हम जिस प्रक्रिया का वर्णन कर रहे हैं, उसमें एक और घटक है, जो एक निश्चित शर्मिंदगी का कारण बन सकता है। कॉन्फ़िडेंस इंटरवल का आकलन करते समय, तीन मात्राओं का उपयोग किया जाता है: x , जेडऔर σ x। नमूना माध्य x की गणना नमूना डेटा से की जाती है, जेडवांछित आत्मविश्वास स्तर के आधार पर चुना जाता है। लेकिन माध्य σ x की मूल माध्य वर्ग त्रुटि के बारे में क्या? यह इसके बराबर है:

और इसलिए, इसे निर्धारित करने के लिए, हमें सामान्य जनसंख्या की मात्रात्मक विशेषता के मानक विचलन से पूछने की आवश्यकता है, अर्थात 5. मानक विचलन वाले मामलों में क्या करना है एसअज्ञात? यह समस्या दो कारणों से उत्पन्न नहीं होती है। सबसे पहले, आमतौर पर विपणन अनुसंधान में उपयोग की जाने वाली अधिकांश मात्रात्मक विशेषताओं के लिए, विपणक के लिए ब्याज के अधिकांश चर के स्तर की तुलना में भिन्नता बहुत धीरे-धीरे बदलती है। तदनुसार, यदि अध्ययन दोहराया जाता है, तो हम गणना में पिछले, पहले से प्राप्त मूल्य का उपयोग कर सकते हैं। दूसरा, एक बार जब नमूना चुन लिया जाता है और डेटा प्राप्त हो जाता है, तो हम नमूना भिन्नता का निर्धारण करके जनसंख्या भिन्नता का अनुमान लगा सकते हैं। निष्पक्ष नमूना विचरण को इस प्रकार परिभाषित किया गया है:

नमूना विचरण ŝ 2 = नमूना माध्य से चुकता विचलन का योग / (नमूना किए गए आइटमों की संख्या -1)। नमूना विचरण निर्धारित करने के लिए, हमें पहले नमूना माध्य ज्ञात करना होगा। फिर प्रत्येक नमूना मान और नमूना माध्य के बीच अंतर पाया जाता है; इन अंतरों को वर्ग, योग, और एक संख्या से विभाजित किया जाता है जो नमूना टिप्पणियों की संख्या माइनस एक के बराबर होती है। नमूना प्रसरण न केवल कुल प्रसरण का अनुमान प्रदान करता है, बल्कि इसका उपयोग माध्य की मानक त्रुटि का अनुमान लगाने के लिए भी किया जा सकता है। जब सामान्य प्रसरण σ 2 ज्ञात हो, मूल माध्य वर्ग त्रुटि σ x भी ज्ञात हो, क्योंकि:

जब सामान्य प्रसरण अज्ञात होता है, तो माध्य की मानक त्रुटि का केवल अनुमान लगाया जा सकता है। यह अनुमान दिया गया है ŝ x, जो नमूना आकार के वर्गमूल से विभाजित नमूने के मानक विचलन के बराबर है, अर्थात। अनुमान उसी तरह निर्धारित किया जाता है जैसे वास्तविक मूल्य का अनुमान निर्धारित किया गया था, लेकिन सामान्य मानक विचलन के बजाय, नमूने के मानक विचलन को गणना सूत्र में प्रतिस्थापित किया जाता है। तो, आइए नमूना एबी के लिए 5800 के नमूना माध्य के साथ कहें:

तदनुसार, ŝ = 283, और

और 95% रिक्ति अब है

जो पिछले मूल्य से कम है।

तालिका में। 15.5 विभिन्न औसतों और फैलावों के लिए गणना सूत्रों का सार प्रस्तुत करता है, जिन पर इस अध्याय में चर्चा की गई थी। एक साधारण यादृच्छिक नमूने का गठन। हमारे उदाहरण में, नमूना तत्वों का चयन एक जग का उपयोग करके किया गया था, जिसमें मूल जनसंख्या के सभी तत्व शामिल थे। इसने हमें व्युत्पन्न जनसंख्या और नमूनाकरण वितरण की अवधारणाओं की कल्पना करने की अनुमति दी। हम व्यवहार में ऐसी पद्धति का उपयोग करने की अनुशंसा नहीं करते हैं, क्योंकि इससे त्रुटि की संभावना बढ़ जाती है। मग आकार और बनावट दोनों में भिन्न हो सकते हैं, जो कुछ मामलों में एक से दूसरे के लिए वरीयता का कारण बन सकते हैं। लॉटरी के माध्यम से किए गए वियतनामी अभियान में प्रतिभागियों का चयन इस तरह की गलती के उदाहरण के रूप में काम कर सकता है।

बड़े ड्रम से जन्मतिथि वाली डिस्क खींचकर चयन किया गया। टेलीविजन इस प्रक्रिया को पूरे देश में प्रसारित करता है। दुर्भाग्य से, डिस्क को ड्रम में एक व्यवस्थित तरीके से लोड किया गया था, जिसमें जनवरी की तारीखें पहले और दिसंबर की तारीखें आखिरी थीं। हालाँकि ड्रम को तीव्र कताई के अधीन किया गया था, दिसंबर की तारीखें जनवरी की तुलना में बहुत अधिक बार गिरती थीं। इसके बाद, इस प्रक्रिया को इस तरह संशोधित किया गया कि ऐसी व्यवस्थित त्रुटियों की संभावना काफी कम हो गई। एक साधारण यादृच्छिक नमूना उत्पन्न करने की पसंदीदा विधि यादृच्छिक संख्याओं की तालिका के उपयोग पर आधारित है।

ऐसी तालिका का उपयोग करने में निम्नलिखित चरणों का क्रम शामिल है। सबसे पहले, जनसंख्या के तत्वों को 1 से लगातार संख्याओं को निर्दिष्ट किया जाना चाहिए एन; तत्व के लिए हमारी काल्पनिक जनसंख्या में नंबर 1 तत्व को सौंपा जाएगा बी- संख्या 2, आदि। दूसरे, यादृच्छिक संख्याओं की तालिका में अंकों की संख्या संख्या के समान होनी चाहिए एन. के लिए एन= 20 दो अंकों की संख्या का उपयोग किया जाएगा; के लिए एन 100 और 999 के बीच - तीन अंकों की संख्या, आदि। तीसरा, प्रारंभिक स्थिति को यादृच्छिक रूप से निर्धारित किया जाना चाहिए। हम यादृच्छिक संख्याओं की संगत तालिका खोल सकते हैं और अपनी आँखें बंद कर सकते हैं, जैसा कि वे कहते हैं, उस पर अपनी उंगली से प्रहार करें। क्योंकि यादृच्छिक संख्या तालिका में संख्याएँ यादृच्छिक क्रम में हैं, प्रारंभिक स्थिति वास्तव में मायने नहीं रखती है।

और अंत में, हम किसी भी मनमाने ढंग से चुनी गई दिशा में आगे बढ़ सकते हैं - ऊपर, नीचे या पार, उन तत्वों का चयन करना जिनकी संख्या तालिका से यादृच्छिक संख्याओं के अनुरूप होगी। जो कहा गया है उसे स्पष्ट करने के लिए, यादृच्छिक संख्याओं की संक्षिप्त तालिका (तालिका 15.6) पर विचार करें। क्योंकि एन= 20, हमें केवल दो अंकों की संख्या के साथ कार्य करना चाहिए। इस अर्थ में, टैब। 15.6 हमें पूरी तरह से सूट करता है। मान लीजिए कि हमने पहले से कॉलम को नीचे ले जाने का फैसला किया है, प्रारंभिक स्थिति ग्यारहवीं पंक्ति और चौथे कॉलम के चौराहे पर है, जहां संख्या 77 स्थित है। यह संख्या बहुत बड़ी है, और इसलिए इसे छोड़ दिया जाना चाहिए। अगली दो संख्याओं को भी हटा दिया जाएगा, जबकि चौथे मान 02 का उपयोग किया जाएगा क्योंकि 2 तत्व संख्या है में.

अगले पांच नंबर भी बहुत बड़े होने के कारण खारिज कर दिए जाएंगे, जबकि नंबर 05 तत्व को इंगित करेगा . तो तत्व मेंऔर हमारा दो-तत्व वाला नमूना बन जाएगा, जिसके द्वारा हम इस जनसंख्या की आय के स्तर का न्याय करेंगे। एक वैकल्पिक रणनीति भी संभव है, जिसमें चयन के आधार के रूप में यादृच्छिक संख्या उत्पन्न करने वाले एक कंप्यूटर प्रोग्राम का उपयोग किया जाएगा। हाल के प्रकाशनों से संकेत मिलता है कि ऐसे कार्यक्रमों द्वारा उत्पन्न संख्याएं पूरी तरह से यादृच्छिक नहीं हैं, जो जटिल गणितीय मॉडल बनाते समय एक निश्चित तरीके से खुद को प्रकट कर सकती हैं, लेकिन उनका उपयोग अधिकांश अनुप्रयुक्त विपणन अनुसंधान के लिए किया जा सकता है। फिर से ध्यान दें कि एक साधारण यादृच्छिक नमूने के लिए सामान्य आबादी के तत्वों की अनुक्रमिक क्रमांकित सूची के संकलन की आवश्यकता होती है।

दूसरे शब्दों में, मूल जनसंख्या के प्रत्येक सदस्य की पहचान की जानी चाहिए। कुछ आबादी के लिए, ऐसा करना मुश्किल नहीं है, उदाहरण के लिए, 500 सबसे बड़े अमेरिकी निगमों के एक अध्ययन में, जिसकी एक सूची फॉर्च्यून पत्रिका में दी गई है। यह सूची पहले ही संकलित की जा चुकी है, इसलिए इस मामले में एक साधारण यादृच्छिक नमूना बनाना मुश्किल नहीं होगा। अन्य प्रारंभिक आबादी के लिए (उदाहरण के लिए, किसी विशेष शहर में रहने वाले सभी परिवारों के लिए), एक सामान्य सूची संकलित करना अत्यंत कठिन है, जो शोधकर्ताओं को अन्य नमूना सर्वेक्षण योजनाओं का सहारा लेने के लिए मजबूर करता है।

सारांश

सीखने का उद्देश्य 1
जनगणना (योग्यता) और नमूनाकरण की अवधारणाओं के बीच स्पष्ट रूप से अंतर करें

जनसंख्या (जनसंख्या) की पूर्ण जनगणना कहलाती है योग्य. नमूनासेट, चयनित तत्वों से गठित।

सीखने का उद्देश्य 2
एक नमूना आबादी प्राप्त करने के लिए शोधकर्ताओं द्वारा कार्यान्वित छह चरणों का सार और क्रम जानें

नमूना लेने की प्रक्रिया को छह चरणों में विभाजित किया गया है:

  1. जनसंख्या असाइनमेंट;
  2. नमूनाकरण फ्रेम का निर्धारण;
  3. चयन प्रक्रिया का विकल्प;
  4. नमूना आकार का निर्धारण;
  5. नमूना तत्वों का चयन;
  6. चयनित तत्वों की परीक्षा

सीखने का उद्देश्य 3
"नमूनाकरण फ्रेम" की अवधारणा को परिभाषित करें

नमूनाकरण फ्रेम उन वस्तुओं की सूची है जिनसे नमूना लिया जाएगा।

सीखने का उद्देश्य 4
संभाव्य और नियतात्मक नमूने के बीच अंतर स्पष्ट करें

एक संभाव्य नमूने में, जनसंख्या के प्रत्येक सदस्य को एक निश्चित के साथ शामिल किया जा सकता है गैर शून्य दियासंभावना। नमूने में जनसंख्या के कुछ सदस्यों को शामिल करने की संभावनाएँ एक दूसरे से भिन्न हो सकती हैं, लेकिन इसमें प्रत्येक तत्व को शामिल करने की संभावना ज्ञात है। नियतात्मक नमूनों के लिए, नमूने में किसी भी तत्व को शामिल करने की संभावना का अनुमान लगाना असंभव हो जाता है। ऐसे नमूने की प्रतिनिधित्वशीलता की गारंटी नहीं दी जा सकती। सभी नियतात्मक चयन व्यक्तिगत स्थिति, निर्णय या वरीयता पर आधारित होते हैं। ऐसी वरीयताएँ कभी-कभी जनसंख्या की विशेषताओं का अच्छा अनुमान दे सकती हैं, लेकिन कार्य के लिए नमूने की उपयुक्तता को निष्पक्ष रूप से निर्धारित करने का कोई तरीका नहीं है।

सीखने का उद्देश्य 5
निश्चित आकार के नमूने और बहु-स्तरीय (लगातार) नमूने के बीच अंतर करें

निश्चित आकार के नमूनों के साथ काम करते समय, सर्वेक्षण शुरू होने से पहले नमूना आकार निर्धारित किया जाता है और परिणामों का विश्लेषण सभी आवश्यक डेटा के संग्रह से पहले किया जाता है। अनुक्रमिक नमूने में, चयनित तत्वों की संख्या पहले से ज्ञात नहीं है, यह अनुक्रमिक निर्णयों की एक श्रृंखला के आधार पर निर्धारित की जाती है।

सीखने का उद्देश्य 6
समझाएं कि जानबूझकर नमूनाकरण क्या है और इसकी ताकत और कमजोरियों दोनों का वर्णन करें

जानबूझकर नमूना लेने वाली वस्तुओं को हाथ से चुना जाता है और सर्वेक्षण के प्रयोजनों के लिए उपयुक्त के रूप में शोधकर्ता को प्रस्तुत किया जाता है। यह माना जाता है कि चयनित तत्व अध्ययन की गई जनसंख्या की पूरी तस्वीर दे सकते हैं। जब तक शोधकर्ता समस्या समाधान के शुरुआती चरणों में है, जब नियोजित सर्वेक्षण की संभावनाएं और संभावित सीमाएं निर्धारित की जा रही हैं, जानबूझकर नमूनाकरण का उपयोग बहुत प्रभावी हो सकता है। लेकिन किसी भी मामले में हमें इस प्रकार के नमूने की कमजोरियों के बारे में नहीं भूलना चाहिए, क्योंकि इसका उपयोग शोधकर्ता द्वारा वर्णनात्मक या कारणात्मक अध्ययन में भी किया जा सकता है, जो उनके परिणामों की गुणवत्ता को प्रभावित करने में धीमा नहीं होगा।

सीखने का उद्देश्य 7
कोटा नमूनाकरण की अवधारणा को परिभाषित करें

आनुपातिक नमूनाकरण इस तरह से चुना जाता है कि कुछ विशेषताओं वाले नमूना तत्वों का अनुपात लगभग अध्ययन के तहत जनसंख्या में समान तत्वों के अनुपात से मेल खाता है; ऐसा करने के लिए, प्रत्येक काउंटर को एक कोटा सौंपा गया है जो जनसंख्या की विशेषताओं को निर्धारित करता है जिसके साथ उसे संपर्क करना चाहिए।

सीखने का उद्देश्य 8
व्याख्या करें कि चयन प्रक्रिया में पैरामीटर क्या है

पैरामीटर - सामान्य या अध्ययनित जनसंख्या की एक निश्चित विशेषता या संकेतक; एक निश्चित मात्रात्मक संकेतक जो एक सेट को दूसरे से अलग करता है।

सीखने का उद्देश्य 9
व्याख्या करें कि एक व्युत्पन्न सेट क्या है

व्युत्पन्न जनसंख्या में सभी संभावित नमूने शामिल होते हैं जिन्हें किसी दिए गए नमूनाकरण योजना के अनुसार सामान्य जनसंख्या से चुना जा सकता है।

सीखने का उद्देश्य 10
समझाइए कि प्रतिचयन वितरण की अवधारणा सांख्यिकी की सबसे महत्वपूर्ण अवधारणा क्यों है।

नमूना वितरण की अवधारणा सांख्यिकीय अनुमान की आधारशिला है। अध्ययन किए गए आँकड़ों के ज्ञात नमूना वितरण के अनुसार, हम सामान्य जनसंख्या के संगत पैरामीटर के बारे में निष्कर्ष निकाल सकते हैं। यदि, दूसरी ओर, यह केवल ज्ञात है कि नमूना अनुमान नमूने से नमूने में बदलता है, लेकिन इस परिवर्तन की प्रकृति अज्ञात है, तो इस अनुमान से जुड़ी नमूना त्रुटि को निर्धारित करना असंभव हो जाता है। चूंकि एक अनुमान का नमूना वितरण वर्णन करता है कि यह नमूने से नमूने में कैसे बदलता है, यह नमूना अनुमान की वैधता निर्धारित करने के लिए एक आधार प्रदान करता है।

नमूना या नमूना सेट - अध्ययन में भाग लेने के लिए सामान्य आबादी से चुने गए एक निश्चित प्रक्रिया का उपयोग करके मामलों (विषयों, वस्तुओं, घटनाओं, नमूने) का एक सेट।

नमूना विशेषताएं:

  • नमूने की गुणात्मक विशेषताएं - हम वास्तव में किसे चुनते हैं और इसके लिए हम नमूना निर्माण के किन तरीकों का उपयोग करते हैं।
  • नमूने की मात्रात्मक विशेषता यह है कि हम कितने मामलों का चयन करते हैं, दूसरे शब्दों में, नमूना आकार।

सैंपलिंग की जरूरत है

  • अध्ययन का विषय बहुत व्यापक है। उदाहरण के लिए, एक वैश्विक कंपनी के उत्पादों के उपभोक्ता भौगोलिक रूप से बिखरे बाजारों की एक बड़ी संख्या हैं।
  • प्राथमिक जानकारी एकत्र करने की आवश्यकता है।

आश्रित और स्वतंत्र नमूने

दो (या अधिक) नमूनों की तुलना करते समय, उनकी निर्भरता एक महत्वपूर्ण पैरामीटर है। यदि एक होमोमोर्फिक जोड़ी स्थापित करना संभव है (अर्थात, जब नमूना X से एक मामला नमूना Y से एक और केवल एक मामले से मेल खाता है और इसके विपरीत) दो नमूनों में प्रत्येक मामले के लिए (और संबंध का यह आधार विशेषता के लिए महत्वपूर्ण है) नमूने में मापा जाता है), ऐसे नमूने आश्रित कहलाते हैं। आश्रित चयन के उदाहरण:

  • जुड़वा बच्चों की जोड़ी
  • प्रायोगिक प्रदर्शन से पहले और बाद में किसी भी विशेषता के दो माप,
  • पति और पत्नियाँ

यदि नमूनों के बीच ऐसा कोई संबंध नहीं है, तो इन नमूनों को स्वतंत्र माना जाता है, उदाहरण के लिए:

  • पुरुषों और महिलाओं,
  • मनोवैज्ञानिक और गणितज्ञ।

तदनुसार, आश्रित नमूनों का आकार हमेशा समान होता है, जबकि स्वतंत्र नमूनों का आकार भिन्न हो सकता है।

सांख्यिकी, समाजशास्त्र, विपणन में "नमूना" की अवधारणा को दो अर्थों में माना जाता है। सबसे पहले, यह अध्ययन की जाने वाली सामान्य आबादी के तत्वों का एक समूह है, अर्थात नमूना सेट। दूसरे, नमूना प्रतिनिधित्व सुनिश्चित करने की आवश्यक शर्त के तहत नमूना आबादी बनाने की प्रक्रिया है। विभिन्न प्रकार के नमूने (चयन) और नमूने के प्रकार आवंटित करें।

नमूने के प्रकार के रूप में, सिद्धांत रूप में उनमें से तीन हैं। हम सामान्य आबादी से नमूनाकरण इकाइयों के चयन के दृष्टिकोण के सिद्धांतों के बारे में बात कर रहे हैं। वे इस प्रकार हो सकते हैं:

सहज चयन, अर्थात। नमूने में सामान्य आबादी की इकाइयों को शामिल करने की स्वैच्छिकता और पहुंच के सिद्धांत के आधार पर चयन। यह विशेष रूप से मेल और प्रेस सर्वेक्षणों में अक्सर प्रयोग किया जाता है। इस तरह के चयन का मुख्य नुकसान सामान्य जनसंख्या के गुणात्मक प्रतिनिधित्व की असंभवता है;

संभाव्य(अनियमित) चयन- समाजशास्त्रीय अनुसंधान में उपयोग किए जाने वाले मुख्य में से एक। इस तरह के चयन का मुख्य सिद्धांत यह सुनिश्चित करना है कि सामान्य जनसंख्या की प्रत्येक इकाई नमूने में प्रवेश करने में सक्षम हो। इस प्रयोजन के लिए, यादृच्छिक संख्याओं की सारणी, लॉटरी चयन, यांत्रिक चयन का उपयोग किया जाता है;

स्तरीकृत चयन, जो सामान्य आबादी के गुणात्मक मॉडल के निर्माण पर आधारित है, फिर - मौजूदा मॉडल के आधार पर नमूना आबादी में अवलोकन इकाइयों का चयन।

[औरस्रोत: विकिपीडिया, पोलटोरक वी.ए. विपणन अनुसंधान: तरीके और प्रौद्योगिकियां]


टास्क नंबर 3

प्रश्न: सामाजिक परिवर्तन की अवधारणा की सामग्री का विस्तार करें।

सामाजिक परिवर्तन की अवधारणा।"सामाजिक परिवर्तन" की अवधारणा सामाजिक समुदायों, समूहों, संस्थाओं, संगठनों और समाजों में एक दूसरे के साथ-साथ व्यक्तियों के साथ उनके संबंधों में समय के साथ होने वाले विभिन्न परिवर्तनों को संदर्भित करती है। ऐसे परिवर्तन किए जा सकते हैं: पारस्परिक संबंधों के स्तर पर (उदाहरण के लिए, परिवार की संरचना और कार्यों में परिवर्तन); छोटे और बड़े सामाजिक समूहों के स्तर पर (रूस में, विशेष रूप से, उनकी सामग्री और उनके संगठन के संदर्भ में), संगठनों और संस्थानों के स्तर पर (शिक्षा, विज्ञान लगातार परिवर्तन के अधीन हैं) मजदूर वर्ग, किसान अब बदल रहा है, नए सामाजिक समूह - उद्यमी), सामाजिक और वैश्विक स्तर पर (प्रवास प्रक्रिया, कुछ देशों के आर्थिक और तकनीकी विकास और दूसरों में ठहराव और संकट, मानव जाति के अस्तित्व के लिए पर्यावरण और सैन्य खतरा, वगैरह।)।

आज तक, नमूना प्रकारों के वर्गीकरण की एक बड़ी संख्या है, विभिन्न शोधकर्ता अलग-अलग तरीकों से नमूना बनाने के अपने और दूसरों के तरीकों को वर्गीकृत करते हैं। अलग-अलग प्रकाशनों में, एक ही नमूने के अलग-अलग नाम मिल सकते हैं, जिससे उनका अध्ययन करना मुश्किल हो जाता है। इन वर्गीकरणों में से एक पर विचार करें, जो प्रयुक्त साहित्य में पाए जाने वाले सभी को जोड़ता है।

यादृच्छिक नमूना।

इस तरह का एक नमूना सबसे सटीक, प्रतिनिधित्व (नमूने की क्षमता "सामान्य आबादी में मामलों की स्थिति को सही ढंग से प्रतिबिंबित करने के लिए जिससे इसे निकाला जाता है और जिसके लिए इसका अध्ययन करने का इरादा है") गणितीय तरीकों का उपयोग करके प्राप्त किया जाता है। यादृच्छिक प्रतिचयन की एक विशेषता यह है कि सामान्य जनसंख्या की सभी इकाइयों में प्रतिदर्श में शामिल होने की समान संभावना होती है। परिभाषा के अनुसार, यादृच्छिक प्रतिचयन यादृच्छिकता के सिद्धांत को संतुष्ट करता है। "नमूने में शामिल होने की संभावनाओं की समानता आवश्यक है क्योंकि इसे लागू करना मुश्किल है। समान अवसरों के इस "सांख्यिकीय लोकतंत्र" को सुनिश्चित करने के लिए, समाजशास्त्री आम तौर पर एक नमूना फ्रेम तैयार करेंगे, जो जनसंख्या के सभी तत्वों की एक पूर्ण और सटीक सूची या क्रमांकित सूची है। उदाहरण के लिए, नमूना फ्रेम एक उद्यम के कर्मचारियों की सूची, टेलीफोन निर्देशिका, कार मालिकों की पंजीकरण सूची, मतदान केंद्रों पर मतदाता सूची, घर की किताबें, साथ ही समाजशास्त्री द्वारा स्वयं संकलित विभिन्न सूचियाँ हो सकती हैं, जो कि उद्देश्यों के आधार पर होती हैं। अध्ययन (उन गलियों की एक सूची जिन पर उत्तरदाताओं का चयन किया जाता है)।

रैंडम सैंपलिंग का इस्तेमाल आमतौर पर चुनाव, जनमत संग्रह और अन्य सार्वजनिक कार्यक्रमों से पहले जनमत सर्वेक्षणों में किया जाता है।

इस पद्धति का लाभ यादृच्छिकता के सिद्धांत का पूर्ण पालन है और परिणामस्वरूप, व्यवस्थित त्रुटियों से बचा जाता है।

यादृच्छिक प्रतिचयन के कई नुकसान हैं जो व्यवहार में इसका उपयोग करना कठिन बनाते हैं:

  • 1. सामान्य जनसंख्या के तत्वों की सूची की आवश्यकता। यहाँ कठिनाई इस तथ्य में निहित है कि ऐसी सूची प्राप्त करना हमेशा संभव नहीं होता है। नतीजतन, उन मामलों में जहां सामान्य जनसंख्या के तत्वों की सूची प्राप्त करना असंभव है, यादृच्छिक चयन करना असंभव है।
  • 2. सर्वेक्षण की जटिलता। यादृच्छिक चयन के लिए मतदान प्रक्रिया बहुत बोझिल और समय लेने वाली है। आखिरकार, यादृच्छिक चयन के परिणामस्वरूप, शोधकर्ता आउटपुट में उत्तरदाताओं के नामों (फोन नंबर, पते, आदि) की एक सूची प्राप्त करता है, जिन्हें साक्षात्कार की आवश्यकता होती है। अर्थात्, साक्षात्कारकर्ताओं को प्रत्येक उत्तरदाता के पीछे "दौड़ना" पड़ता है और "कुछ प्रश्नों" का उत्तर देने के लिए उनकी सहमति लेनी होती है।

इस कार्य को जटिल बनाना यह तथ्य है कि कभी-कभी उत्तरदाताओं को ढूंढना इतना आसान नहीं होता है; यदि प्रतिवादी अनुपस्थित है, तो उसे कई बार जाना होगा (कम से कम तीन बार से कम नहीं)।

उपरोक्त सभी से सर्वेक्षण करने में लगने वाला समय बढ़ जाता है। अतिरिक्त साक्षात्कारकर्ताओं को आकर्षित करके ही समय की लागत को कम किया जा सकता है, अर्थात केवल अतिरिक्त पैसे की कीमत पर। इसके अलावा, उत्तर न देने वालों की तथाकथित समस्या भी है।

3. अपेक्षाकृत बड़ा नमूना आकार। अपेक्षाकृत उच्च स्तर की सटीकता के साथ परिणाम प्राप्त करने के लिए, यादृच्छिक चयन के लिए अन्य प्रकार के चयनों की तुलना में पर्याप्त बड़े नमूना आकार की आवश्यकता होती है। दूसरे शब्दों में, यादृच्छिक चयन में सटीकता की कम डिग्री होती है, जो अंततः इसकी कम दक्षता का कारण है। एक नमूना अधिक कुशल माना जाता है यदि: उसी कीमत पर यह अधिक सटीक है, और उसी सटीकता पर यह सस्ता है।

सरल यादृच्छिक चयन।

"आबादी से सरल यादृच्छिक चयन से पता चलता है कि:

  • सामान्य जनसंख्या सजातीय है;
  • इसके सभी तत्व अनुसंधान के लिए समान सीमा तक उपलब्ध हैं;
  • · तत्वों की एक पूरी सूची है जो जनसंख्या का निर्माण करती है (या कम से कम एक प्रतिनिधि नमूना फ्रेम);
  • · तालिका या कंप्यूटर यादृच्छिक संख्या जनरेटर का उपयोग करके इस सूची में यादृच्छिक चयन प्रक्रिया लागू की जाती है|

व्यवस्थित नमूना लेने की विधि।

इस पद्धति में यह तथ्य शामिल है कि नमूना फ्रेम से, जो सामान्य आबादी के तत्वों की एक पूरी क्रमांकित सूची है, समान अंतराल (चरणों) पर, उदाहरण के लिए, प्रत्येक दूसरे, तीसरे या दसवें, उत्तरदाताओं की एक निश्चित संख्या का चयन किया जाता है।

अंतराल (के) की गणना सूत्र द्वारा की जाती है:

जहाँ N सामान्य जनसंख्या के तत्वों की कुल संख्या है, और n नमूना जनसंख्या के तत्वों की संख्या है।

यादृच्छिक संख्याओं की तालिका के अनुसार पहले उत्तरदाता को आवश्यक रूप से यादृच्छिक रूप से चुना जाता है।

इस विधि से व्यवस्थित त्रुटि हो सकती है यदि सूची को किसी भी विशेषता के अनुसार रैंक किया गया है, तब से उस स्थान की बहुत परिभाषा जहां यादृच्छिक चयन शुरू होता है, पूरे नमूने की औसत विशेषताओं को प्रभावित करेगा। जब सामान्य जनसंख्या बहुत बड़ी होती है या शोधकर्ता को इसकी पूरी सूची नहीं पता होती है, तो सामान्य जनसंख्या में तत्वों के क्रम के नियम को जानना आवश्यक है, क्योंकि चयन अंतराल विशेषता के वितरण की अव्यक्त आवधिकता के साथ मेल खा सकता है। सामान्य आबादी, और यह बदले में पूर्वाग्रहों को जन्म देगी।

व्यवस्थित नमूनाकरण की विधि एक छोटे से नमूने के आकार के साथ भी, एक साधारण चयन तकनीक का उपयोग करके पर्याप्त रूप से बड़ी सामान्य आबादी का अध्ययन करने की अनुमति देती है।

सीरियल सैंपलिंग।

सीरियल सैंपलिंग के साथ, चयन की इकाइयाँ स्वयं व्यक्ति नहीं हैं, बल्कि समूह (क्लस्टर या घोंसले) हैं। आमतौर पर, सामान्य आबादी को प्राकृतिक घोंसलों में विभाजित किया जाता है, क्योंकि "कृत्रिम घोंसले बनाते समय, सामान्य आबादी के प्रत्येक व्यक्तिगत तत्व को केवल एक घोंसले में निर्दिष्ट करना और लगभग एक ही आकार के घोंसलों को सुनिश्चित करना मुश्किल हो जाता है" एक निश्चित विशेषता के अनुसार। परिवार, ब्रिगेड, कक्षाएं, छात्र समूह, स्कूल - स्कूली बच्चों का अध्ययन करते समय, और अस्पताल - रोगियों का अध्ययन करते समय, साथ ही जिले, शहर, और इसी तरह क्लस्टर के रूप में कार्य करते हैं।

क्लस्टर प्रक्रिया का आवेदन चार अनिवार्य शर्तों पर आधारित है:

  • 1) सामान्य जनसंख्या का प्रत्येक तत्व केवल एक समूह से संबंधित हो सकता है;
  • 2) प्रत्येक क्लस्टर की सामान्य आबादी के तत्वों की संख्या ज्ञात होनी चाहिए या सटीकता की स्वीकार्य डिग्री के साथ अनुमान लगाया जा सकता है;
  • 3) क्लस्टर स्थानिक रूप से बिखरे हुए नहीं होने चाहिए और बहुत बड़े नहीं होने चाहिए, अन्यथा क्लस्टर नमूना अपने वित्तीय लाभ खो देता है;
  • 4) समूहों का चुनाव इस तरह से किया जाना चाहिए कि नमूनाकरण त्रुटि की वृद्धि न्यूनतम हो (अध्ययन के तहत विशेषता और बहुत बड़े के संदर्भ में विभिन्न समूहों को सजातीय नहीं होना चाहिए)।

समूहों के चयन के बाद, वे, एक नियम के रूप में, निरंतर अनुसंधान के अधीन हैं, लेकिन यदि आवश्यक हो, तो वे घोंसले से नमूना लेते हैं।

"श्रृंखला से चुने गए उत्तरदाताओं की संख्या इसमें तत्वों की कुल संख्या के समानुपाती होती है। प्रत्येक (श्रृंखला) से उचित यादृच्छिक या यांत्रिक नमूने का उपयोग करके विश्लेषण की इकाइयों का चयन करना संभव है। प्रत्येक श्रृंखला से अलग-अलग चुने जाने वाले उत्तरदाताओं की संख्या अनुपात से निर्धारित की जाती है:

जहां मैं सामान्य आबादी में पहचानी जाने वाली श्रृंखला की संख्या है, नी श्रृंखला में इकाइयों की संख्या है।

नेस्टेड चयन के फायदों को संगठनात्मक सादगी और उत्तरदाताओं के साक्षात्कार की सुविधा कहा जा सकता है जो एक साथ हैं और स्थानिक रूप से बिखरे हुए नहीं हैं, साथ ही तथ्य यह है कि उत्तरदाताओं का उनके प्राकृतिक वातावरण में अध्ययन किया जाता है, और यह निश्चित रूप से प्राथमिक जानकारी की गुणवत्ता को प्रभावित करता है। प्राप्त हुआ। कभी-कभी घोंसलों पर निरंतर शोध किया जाता है, और यह प्रत्येक उत्तरदाता के पीछे भागने की तुलना में बहुत आसान है, और ऐसा करने में, हमें धन और समय दोनों प्राप्त होते हैं।

लेकिन साथ ही, यह सुनिश्चित करना आवश्यक है कि सामान्य आबादी में समूहों की संख्या काफी बड़ी हो, अन्यथा यादृच्छिकता के किसी भी सिद्धांत का कोई सवाल ही नहीं हो सकता है। इसके अलावा, इस तथ्य के कारण गलतियाँ संभव हैं कि सर्वेक्षण के समय समूह के सभी सदस्यों को पकड़ना संभव नहीं है।

स्तरीकृत प्रतिचयन।

इसका उपयोग उन मामलों में किया जाता है "जब अध्ययन के लक्ष्यों और उद्देश्यों के लिए कुछ समूह मानदंडों के अनुसार उत्तरदाताओं के संभावित चयन की आवश्यकता होती है", या जब हम एक विषम सामान्य आबादी से निपट रहे हों, या जब यह बहुत बड़ा हो या जटिल संरचना हो, और संपूर्ण सामान्य जनसंख्या समुच्चय के लिए नमूना फ्रेम इसके अलग-अलग हिस्सों की तुलना में प्राप्त करना अधिक कठिन है। चयन परिणामों की सटीकता में सुधार करने के लिए, नमूनाकरण प्रक्रिया में सामान्य आबादी को स्तरों में विभाजित करना शामिल है ("स्ट्रैटम" एक सामाजिक, आयु, या अन्य समूह, शाब्दिक रूप से "परत") है, जो सजातीय हैं और चुनावी इरादों का अध्ययन करने के लिए उपयोग किया जाता है , सामाजिक वर्ग और आयु, आय के स्तर से संबंध, आदि। एक बार स्तरों की पहचान हो जाने के बाद, उनमें से प्रत्येक में एक साधारण यादृच्छिक या व्यवस्थित नमूना लिया जाता है, अपने स्वयं के नमूने के फ्रेम के साथ।

नमूना रखने के तीन तरीके हैं (ताकि नमूना अपना यादृच्छिक चरित्र न खोए):

  • 1. आनुपातिक नमूनाकरण: प्रत्येक स्तर से नमूना इकाइयों का एक निश्चित प्रतिशत (5-10%) चुना जाता है, "स्तर से नमूने का आकार सामान्य जनसंख्या में परत के आकार के समानुपाती होता है।" यह तरीका बहुत ही सरल और विश्वसनीय है।
  • 2. नमूने का समान वितरण: प्रत्येक स्तर से समान संख्या में इकाइयों का चयन किया जाता है (उदाहरण के लिए, 200-300)। इसका उपयोग उन मामलों में किया जाता है जब प्रारंभिक जनसंख्या के स्तर की मात्रा शोधकर्ता के लिए अज्ञात होती है।
  • 3. नमूने का इष्टतम स्थान: यह माना जाता है कि नमूने में सबसे विषम परतों को इकाइयों की सबसे बड़ी मात्रा और सजातीय - सबसे छोटी मात्रा द्वारा दर्शाया जाना चाहिए। एक ही विधि का उपयोग बहुत कम ही किया जाता है, क्योंकि सामान्य आबादी में सुविधाओं की भिन्नता के बारे में जानकारी की कमी के कारण व्यवहार में इसे लागू करना मुश्किल होता है।

जब एक स्तरीकृत नमूने को ज़ोन्ड नमूना कहा जाता है, तो इसका अर्थ है कि स्तरीकरण प्रादेशिक सिद्धांत के अनुसार होता है। उदाहरण के लिए, सर्वेक्षण अक्सर क्षेत्र द्वारा ज़ोनिंग का उपयोग करते हैं।

यह विधि विशेष रूप से अच्छी होती है जब जनसंख्या विषम होती है। हालाँकि, स्तरीकृत नमूनाकरण केवल तभी लागू किया जा सकता है जब जनसंख्या के बारे में अतिरिक्त जानकारी हो (उदाहरण के लिए, हमें पुरुषों और महिलाओं के प्रतिशत की आवश्यकता है, यदि हम लिंग द्वारा नमूने को स्तरीकृत करना चाहते हैं)। इस तरह की जानकारी का अभाव स्तरीकृत नमूने के उपयोग को असंभव बना देता है। स्तरीकृत चयन का एक और नुकसान पूर्वाग्रह की संभावना है।

गैर-यादृच्छिक नमूना।

इकाइयों के चयन की इस पद्धति के साथ, हम नमूना आबादी में शामिल होने वाले प्रत्येक तत्व की संभावना की अग्रिम गणना नहीं कर सकते हैं, जिससे नमूने की प्रतिनिधित्व क्षमता की गणना करना असंभव हो जाता है। इस मामले में, यह अनिवार्य नहीं है, क्योंकि वस्तु के मात्रात्मक पैरामीटर अध्ययन में निर्णायक भूमिका नहीं निभाते हैं, और इसका लक्ष्य किसी व्यक्तिगत सामाजिक घटना का गहन गुणात्मक विवरण होगा।

आमतौर पर निम्नलिखित मामलों में गैर-यादृच्छिक चयन का उपयोग किया जाता है:

  • 1. के कारण यादृच्छिक चयन करना असंभव है:
    • सीमित संसाधन (धन की कमी, अनुसंधान के लिए आवंटित समय की कमी, जनसंख्या इकाइयों की सूची की कमी, और इसी तरह)
    • नैतिक मुद्दे (यदि वह मना करता है तो आप उत्तर देने वाले को जवाब देने के लिए मजबूर नहीं कर सकते)
  • 2. यादृच्छिक चयन की कोई ज़रूरत नहीं है।

इस तरह के नमूने में चयन यादृच्छिककरण के सिद्धांतों के अनुसार नहीं किया जाता है (जो नमूने में सामान्य आबादी के एक तत्व का चयन करने की "यादृच्छिकता" सुनिश्चित करता है। इनमें शामिल हैं, उदाहरण के लिए, सूची से पहले पते का यादृच्छिक चयन। , एक पंक्ति में समान अपार्टमेंट के सर्वेक्षण पर प्रतिबंध, एक परिवार में उत्तरदाताओं के यादृच्छिक चयन की प्रक्रिया") , और व्यक्तिपरक मानदंडों के अनुसार - पहुंच, विशिष्टता, समान प्रतिनिधित्व, और इसी तरह। गैर-यादृच्छिक विधियों का मुख्य नुकसान यह है कि ऐसी कोई कठोर सांख्यिकीय विधियाँ नहीं हैं जो प्राप्त परिणामों को सामान्य बनाने की अनुमति दें। ऐसे परिणामों (और अध्ययन के निष्कर्ष) की सटीकता और वैधता का आकलन व्यक्तिपरक निर्णय, अनुभव और सैद्धांतिक वरीयता का विषय बना रहता है।

यादृच्छिक चयन।

इस पद्धति को लागू करते समय, शोधकर्ता कुछ हद तक नमूने को नियंत्रित करता है (उदाहरण के लिए, एक पत्रिका में एक प्रश्नावली प्रकाशित करके, वह केवल इस पत्रिका के पाठकों को संबोधित करता है), लेकिन नमूने में शामिल करने का निर्णय स्वयं प्रतिवादी द्वारा किया जाता है। यही है, इसका आकार अक्सर पहले से ज्ञात नहीं होता है, लेकिन एक विशिष्ट स्थिति - उत्तरदाताओं की गतिविधि द्वारा निर्धारित किया जाता है। इसका मतलब यह है कि उत्तरदाताओं की सरणी की संरचना को पहले से निर्धारित करना भी असंभव है जो प्रश्नावली भरेंगे और वापस करेंगे। इसलिए, यह विधि नमूने के प्रतिनिधि होने का दावा नहीं करती है, और अध्ययन के निष्कर्ष बहुत बार सर्वेक्षण की गई जनसंख्या पर ही लागू होते हैं।

सहज नमूने के आवेदन के क्षेत्र:

  • 1) समाचार पत्रों और पत्रिकाओं में प्रकाशित प्रश्नावली;
  • 2) मेल पोल;
  • 3) सुपरमार्केट के हॉल में खरीदारों का सर्वेक्षण;
  • 4) स्टॉप पर और सार्वजनिक परिवहन में यात्रियों का सर्वेक्षण।

मल्टी-स्टेज और सिंगल-स्टेज सैंपलिंग।

चयन में चरणों की संख्या के अनुसार नमूने को एकल-चरण और बहु-चरण में विभाजित किया गया है। एकल-चरण नमूनाकरण मानता है कि सर्वेक्षण के लिए उत्तरदाताओं को तुरंत सामान्य आबादी से चुना जाता है। मल्टी-स्टेज सैंपलिंग प्रक्रिया में कई चरण शामिल होते हैं, और उनमें से प्रत्येक में सैंपलिंग यूनिट बदल जाती है। "पहले चरण (प्राथमिक इकाइयों) के चयन की इकाइयाँ हैं, माध्यमिक स्तर (द्वितीयक इकाइयों) के चयन की इकाइयाँ हैं, और इसी तरह। निम्नतम स्तर की वस्तुएँ, जिनसे सीधे सूचनाएँ एकत्रित की जाती हैं, अवलोकन की इकाइयाँ कहलाती हैं। उदाहरण के लिए, अध्ययन का कार्य पूरे देश में छात्रों के खाली समय का अध्ययन करना है।

प्रक्रिया निम्नानुसार बनाई जाएगी:

  • 1. क्षेत्रों का चयन;
  • 2. उनमें शहर का चयन, जहां विश्वविद्यालय हैं;
  • 3. शिक्षण संस्थानों का चयन जिसमें अध्ययन किया जाएगा;
  • 4. अकादमिक समूहों का चयन;
  • 5. छात्रों का चयन।

मल्टी-स्टेज सैंपलिंग स्थानीय स्तर पर नहीं, बल्कि क्षेत्रीय, राष्ट्रीय, अंतर्राष्ट्रीय स्तर पर की जाती है। इस तरह के पैमाने पर एकल-चरण के नमूने का उपयोग करना तर्कहीन है, और ऐसा अध्ययन बहुत महंगा होगा। इस संबंध में बहु-स्तरीय नमूनाकरण किफायती है और किसी वस्तु के चयन के दृष्टिकोण को सरल करता है।

लेकिन यह ध्यान में रखा जाना चाहिए कि नमूने में जितने अधिक चरण होंगे, उतनी ही अधिक प्रतिनिधि त्रुटि होगी, त्रुटियों की संभावना बढ़ जाएगी, जिससे शोध परिणामों में विकृति आएगी।

कुछ प्रकार के नमूनों पर विचार करने के बाद, यह समझना भी आवश्यक है कि नमूना आकार क्या है और नमूनाकरण त्रुटियाँ क्या हैं और उनसे कैसे बचा जा सकता है।

नमूनाकरण की अवधारणा।

व्याख्यान 4

1. प्रतिचयन की अवधारणा। 2. नमूने के प्रकार और नमूने बनाने के तरीके।3. नमूना आकार का निर्धारण।

जनसंख्याउन सभी तत्वों का समुच्चय है जिनमें कुछ सामान्य गुण होते हैं जो उनके लक्षण वर्णन के लिए आवश्यक हैं। नमूने का निर्माण सामान्य आबादी के समोच्च के ज्ञान पर आधारित है, जिसे शोधकर्ता के हित के सभी उपभोक्ताओं की सूची के रूप में समझा जाता है। उदाहरण के लिए, किसी निश्चित क्षेत्र या शहर में सभी मकान मालिकों की सूची, या उत्पादों को बेचने वाले सभी आउटलेट की सूची।

सामान्य आबादी की मात्रा और अध्ययन के उद्देश्यों के आधार पर विधियों का उपयोग किया जा सकता है निरंतरया चयनात्मकपरीक्षा। संचालन करते समय निरंतरसर्वेक्षण जनसंख्या की सभी इकाइयों की जांच करता है। इस पद्धति का उपयोग किया जा सकता है यदि सामान्य जनसंख्या के तत्वों की संख्या कम है (उपभोक्ता अनुसंधान में वीआईपी ग्राहक, व्यवसाय-से-व्यवसाय अनुसंधान में संगठन)।

मार्केटिंग रिसर्च में डेटा प्राप्त करने का सबसे आम तरीका है चयनात्मकअवलोकन। नमूने में इकाइयों के चयन के लिए कुछ नियमों का कार्यान्वयन और नमूने की प्रतिनिधित्व क्षमता के संबंध में आपको नमूना डेटा को सामान्य आबादी में वितरित करने की अनुमति मिलती है।

नमूना बनाते समय, हम उपयोग करते हैं संभाव्य और असंभवता (नियतात्मक) तरीके।

संभाव्यता नमूनाकरण एक नमूना है जिसमें अध्ययन की वस्तु का प्रत्येक तत्व संभाव्यता की एक निश्चित डिग्री के साथ गिर सकता है। संभाव्यता नमूनों में, जनसंख्या का प्रत्येक तत्व ज्ञात होता है और सर्वेक्षण में शामिल होने की एक निश्चित संभावना होती है। यह ध्यान दिया जाना चाहिए कि जनसंख्या के आकार के बारे में जानकारी की कमी के कारण संभावनाओं की सटीक गणना करना संभव नहीं है। इसलिए, "निश्चित संभाव्यता" शब्द का जनसंख्या के सटीक आकार को जानने के बजाय नमूनाकरण नियमों के साथ अधिक करना है।

नियतात्मक नमूनाकरण (गैर-संभाव्यता नमूनाकरण) - एक नमूना जिसमें तत्व पूर्व निर्धारित प्राथमिकताओं या निर्णयों के आधार पर आते हैं। में असंभवता के नमूनेसामान्य आबादी के प्रत्येक वस्तु को नमूने में लाने की समान संभावना की स्थिति पूरी नहीं होती है। के लिए इस प्रकारनमूनाकरण, नमूनाकरण त्रुटि (त्रुटि) की गणना करना असंभव है। लेकिन इसका मतलब यह नहीं है कि अध्ययन के दौरान गलत परिणाम प्राप्त होंगे। अविश्वसनीय नमूनों के लिए कम समय और धन की आवश्यकता होती है। अक्सर, असंभाव्यता के नमूने अपेक्षाकृत छोटी आबादी (हजारों, दसियों हज़ार उपभोक्ताओं) के लिए उपयोग किए जाते हैं।

निम्नलिखित प्रकार के नियतात्मक नमूने प्रतिष्ठित हैं:


· अप्रतिनिधि;

जानबूझकर किया गया;

कोटा;

· मुख्य सरणी।

गैर-प्रतिनिधि (सुविधा नमूनाकरण) नमूने सबसे सुलभ तत्वों (दुकानों में ग्राहक, सड़क पर राहगीर, आदि) के चयन पर आधारित होते हैं। शोधकर्ता इस सिद्धांत पर निर्भर करता है कि प्रतिवादी अनुमानित सामान्य आबादी से संबंधित है।

जजमेंटल सैंपलिंग उन वस्तुओं के मैन्युअल चयन पर आधारित है जो शोधकर्ता मानते हैं कि अध्ययन के उद्देश्यों को पूरा करते हैं। जानबूझकर प्रतिचयन का एक प्रकार स्नोबॉल प्रतिचयन है। इसमें प्रारंभिक तत्वों को परिभाषित करना शामिल है, जिनमें से प्रत्येक कई नए लोगों को इंगित करता है, और इसी तरह। इस तरह के नमूने का उपयोग विशिष्ट विशेषताओं वाली वस्तुओं की जांच करते समय किया जाता है, समान वस्तुओं के कुल सेट में एक छोटे से हिस्से पर कब्जा कर लिया जाता है, और एक दूसरे के साथ मिलकर काम करता है। जानबूझकर नमूनाकरण में एक अप्रतिनिधि नमूने के समान मुख्य नुकसान होता है - इसकी त्रुटि और प्रतिनिधित्व की निम्न डिग्री का आकलन करने की असंभवता।

कोटा नमूना - कोटा नमूनाकरण - मुख्य विशेषताओं के अनुसार उसी अनुपात में नमूने में तत्वों को शामिल करके नियतात्मक नमूने जिसमें वे कुल अध्ययन आबादी में मौजूद हैं

सबसे लोकप्रिय नमूनाकरण विधियों में से एक। कोटा पद्धति का उपयोग करते समय, एक या अधिक विशेषताओं का चयन किया जाता है, जिसके अनुसार नमूना नियंत्रित किया जाएगा। नमूने में इकाइयों की संख्या जिनकी कुछ विशेषताएं हैं, जनसंख्या में ऐसी इकाइयों की संख्या के अनुपात में होनी चाहिए। यह माना जाता है कि कोटा पद्धति का उपयोग करते समय, यादृच्छिक चयन की तुलना में छोटे आकार का एक नमूना बनाना संभव है, क्योंकि कोटा चयन दिए गए मापदंडों के अनुसार नमूने और सामान्य आबादी के बीच लगभग पूर्ण मेल देता है, अर्थात। नमूने की प्रतिनिधित्वशीलता (प्रतिनिधित्व) की संपत्ति देखी जाती है। हालाँकि, इस कथन की गणितीय विधियों द्वारा पुष्टि नहीं की जा सकती है। अक्सर, सामाजिक-जनसांख्यिकीय विशेषताओं (लिंग, आयु, शिक्षा, आय स्तर, आदि) कोटा मापदंडों के रूप में उपयोग किया जाता है।

तरीका मुख्य सरणी सामान्य जनसंख्या की 50% से अधिक वस्तुओं के नमूने में शामिल करना शामिल है। सर्वे का फायदा मुख्य सरणी विधियह है कि नमूने का सामान्य जनसंख्या में उच्च अनुपात है। यह संभावित त्रुटियों को समाप्त करना संभव बनाता है। सिद्धांत रूप में, सामान्य आबादी में उत्तरदाताओं के एक बड़े अनुपात का साक्षात्कार करना पर्याप्त है, जो नमूना माध्य और सामान्य माध्य के बीच के अंतर को कम करता है।

संभाव्य तरीके।यदि प्रतिचयन इकाइयों को प्रतिदर्श में शामिल होने का ज्ञात अवसर (संभाव्यता) है, तो प्रतिदर्श को संभाव्य कहा जाता है। संभाव्य तरीकों में शामिल हैं:

सरल यादृच्छिक चयन

· व्यवस्थित चयन;

· क्लस्टर चयन;

स्तरीकृत चयन।

सरल यादृच्छिक नमूनाकरण (SRS) - एक नमूना जिसमें अध्ययन की वस्तु का प्रत्येक तत्व समान संभावना के साथ नमूना आबादी में गिर सकता है। संभावना नमूना बनाने की सबसे सरल विधि। ऐसा नमूना उनकी पूरी सूची से तत्वों के यादृच्छिक परिवर्तनीय चयन द्वारा बनता है। इस तरह के नमूने का मुख्य नुकसान अध्ययन की गई आबादी के तत्वों की पूरी सूची की आवश्यकता है। , जो विपणन अनुसंधान के अभ्यास में शायद ही कभी प्रदान किया जाता है। एक साधारण यादृच्छिक नमूने के साथ, सामान्य आबादी की इकाइयों के पूरे द्रव्यमान से बिना किसी समूह में प्रारंभिक विभाजन के चयन किया जाता है, और प्रत्येक तत्व में नमूना (पी) में शामिल होने की समान संभावना होती है, जिसकी गणना इस प्रकार की जा सकती है सामान्य जनसंख्या के आकार के लिए नमूना आकार का अनुपात। उदाहरण के लिए, यदि जनसंख्या का आकार 10,000,000 लोगों का है और नमूना आकार 600 लोगों का है, तो किसी विशेष व्यक्ति के नमूने में शामिल होने की संभावना 6% (400/10,000 * 100) है। एक यादृच्छिक नमूने को व्यवस्थित करने का सबसे आसान तरीका बहुत से ड्रा करना या यादृच्छिक संख्याओं की तालिका का उपयोग करना है। एक टेलीफोन साक्षात्कार में, एक कंप्यूटर बेतरतीब ढंग से फ़ोन नंबर उत्पन्न कर सकता है क्योंकि इसमें एक यादृच्छिक संख्या जनरेटर होता है।

खंड द्वितीय। गणित सांख्यिकी

विषय 6। चयनात्मक विधि। रूपांतर श्रृंखला

और इसकी विशेषताएं

गणितीय सांख्यिकी उन प्रतिमानों के अध्ययन से संबंधित है जो प्रेक्षणों के परिणामों के आधार पर सामूहिक परिघटनाओं को नियंत्रित करते हैं।

एमएस का उद्देश्य: वैज्ञानिक और व्यावहारिक निष्कर्ष प्राप्त करने के लिए सांख्यिकीय डेटा एकत्र करने और संसाधित करने के तरीकों का निर्माण।

दो को हल करने के लिए गणितीय आँकड़ों के तरीकों की आवश्यकता है कार्य:

1) प्रयोगों या टिप्पणियों के परिणामस्वरूप प्राप्त सांख्यिकीय जानकारी एकत्र करने और समूहीकृत करने के तरीकों का संकेत;

2) सांख्यिकीय डेटा विश्लेषण विधियों का विकास (वितरण कार्यों और मापदंडों का मूल्यांकन; सांख्यिकीय परिकल्पनाओं का परीक्षण; यादृच्छिक चर के बीच निर्भरता का मूल्यांकन)।

चयनात्मक अवलोकन की अवधारणा और इसके सैद्धांतिक गुण।

सांख्यिकीय अवलोकनों के अभ्यास में, दो प्रकार के अवलोकनों को प्रतिष्ठित किया जाता है:

सतत, जब जनसंख्या की सभी वस्तुओं का अध्ययन किया जाता है (जनसंख्या जनगणना);

चुनिंदा, जब यादृच्छिक रूप से चयनित वस्तुओं का एक हिस्सा अध्ययन किया जाता है (जनसंख्या के एक हिस्से को कवर करने वाले समाजशास्त्रीय अध्ययन)।

चयनात्मक अवलोकन का सिद्धांत सांख्यिकीय नियमितताओं पर आधारित है जो सामूहिक घटनाओं और प्रक्रियाओं में बनते और पाए जाते हैं।

संयोग से जुड़े पैटर्न और केवल विभिन्न प्रकार की घटनाओं में खुद को एक कानून के रूप में प्रकट करने वाले पैटर्न कहलाते हैं सांख्यिकीय. पैटर्न की यह संपत्ति बड़ी संख्या के कानून से जुड़ी है। बड़ी संख्या के कानून का गणितीय आधार, और सामान्य रूप से सांख्यिकीय विज्ञान, प्रायिकता का सिद्धांत है, जो यादृच्छिक घटना (घटनाओं) का अध्ययन करता है जिसमें एक स्थिर विशिष्टता होती है, और इसके परिणामस्वरूप, संभाव्यता, जो द्रव्यमान में पैटर्न की पहचान करने में मदद करती है। घटना की पुनरावृत्ति।

सामान्य जनसंख्या और नमूना। नमूना प्रकार।

सामान्य जनसंख्याअध्ययन की जाने वाली सभी वस्तुओं का समुच्चय है, जिससे एक नमूना बनाया जाता है।

नमूना सेट, या, नमूना, प्रत्यक्ष अध्ययन के अधीन, सामान्य आबादी से बेतरतीब ढंग से चुनी गई वस्तुओं का एक समूह है।

जनसंख्या का आकारइसकी वस्तुओं की संख्या है। सामान्य जनसंख्या में परिमित और अनंत आकार (एन) दोनों हो सकते हैं, जबकि नमूने में केवल परिमित आकार (एन) हो सकता है।

उदाहरण. 2000 उत्पादों में से 100 उत्पादों को सर्वेक्षण के लिए चुना गया था, तो सामान्य जनसंख्या की मात्रा है, और नमूना आकार है।

नमूनाकरण विधि- यह एक शोध पद्धति है जिसमें एक नमूने का उपयोग करके सामान्य आबादी के गुणों की जांच की जाती है. इसी समय, इस भाग के अध्ययन में प्राप्त निष्कर्ष वस्तुओं के पूरे सेट में वितरित किए जाते हैं।

नमूना प्रकार

सामान्य उद्देश्यरहित नमूना, सामान्य आबादी को भागों में विभाजित किए बिना तत्वों के यादृच्छिक चयन द्वारा गठित।

यांत्रिक नमूनाकरण, जिसमें सामान्य आबादी के तत्वों को एक निश्चित अंतराल पर चुना जाता है। इसलिए, यदि नमूना आकार सामान्य का 10% होना चाहिए, तो प्रत्येक 10वें तत्व का चयन किया जाता है।

ठेठ नमूना, जिसमें विशिष्ट समूहों से यादृच्छिक रूप से तत्वों का चयन किया जाता है, जिसमें सामान्य जनसंख्या को कुछ मानदंडों के अनुसार विभाजित किया जाता है। उदाहरण के लिए, प्रत्येक मशीन के उत्पादन से भागों का चयन, न कि कुल से।

सीरियल सैंपलिंग, जिसमें अलग-अलग तत्वों को यादृच्छिक रूप से नहीं, बल्कि जनसंख्या (श्रृंखला) के पूरे समूहों को चुना जाता है।

दोहराया गयाएक नमूना कहा जाता है जिसमें अध्ययन के बाद चयनित वस्तु को सामान्य जनसंख्या में वापस कर दिया जाता है और इसे फिर से चुना जा सकता है।

न दोहराईएक नमूना कहा जाता है जिसमें नमूने में चयनित वस्तु सामान्य जनसंख्या में वापस नहीं आती है।

प्रतिनिधि(प्रतिनिधि) एक नमूना है जिसके द्वारा हम संपूर्ण सामान्य आबादी में रुचि के गुण का न्याय कर सकते हैं। नमूना प्रतिनिधित्व की शर्तें:

1) नमूने के हिस्से सामान्य आबादी के हिस्सों के अनुपात में होने चाहिए;

2) नमूना अध्ययन के तहत विशेषता की सभी विशेषताओं को स्पष्ट रूप से प्रदर्शित करना चाहिए;

3) नमूना काफी बड़ा होना चाहिए;

4) यादृच्छिक नमूनाकरण।