সবাইকে জিজ্ঞেস করা কি সম্ভব?
ধরুন আপনি জানতে চান বাংলাদেশের মানুষ মাসে গড়ে কত টাকা মোবাইল রিচার্জে খরচ করে। সবচেয়ে নির্ভুল উত্তর পেতে হলে আপনাকে ১৭ কোটি মানুষের প্রত্যেককে জিজ্ঞেস করতে হবে। কিন্তু সেটা কি সম্ভব? না। এতে কয়েক বছর লেগে যাবে, কোটি কোটি টাকা খরচ হবে, এবং জিজ্ঞেস করতে করতে অনেকের উত্তর বদলে যাবে।
তাহলে কী করবেন? একটা ছোট দল বেছে নিয়ে তাদের জিজ্ঞেস করবেন, তারপর সেই উত্তর থেকে পুরো দেশ সম্পর্কে অনুমান করবেন। এটাই পরিসংখ্যানের মূল ভিত্তি।
জনসংখ্যা (Population) কী?
পরিসংখ্যানে "জনসংখ্যা" বলতে শুধু মানুষ বোঝায় না। এটা হলো সেই সম্পূর্ণ দল যেটা সম্পর্কে আপনি জানতে চান। এটা মানুষ হতে পারে, জিনিসও হতে পারে।
- বাংলাদেশের সব SSC পরীক্ষার্থী - যদি আপনি SSC ফলাফল নিয়ে গবেষণা করেন
- ঢাকার সব রিকশা - যদি রিকশাচালকদের আয় জানতে চান
- একটা গার্মেন্টস ফ্যাক্টরির সব শার্ট - যদি মান নিয়ন্ত্রণ করতে চান
- বাংলাদেশের সব ধানক্ষেত - যদি ফলন নিয়ে গবেষণা করেন
জনসংখ্যা হলো আপনার গবেষণার পুরো মহাবিশ্ব।
নমুনা (Sample) কী?
নমুনা হলো জনসংখ্যার একটা ছোট অংশ যেটাকে আপনি আসলে পর্যবেক্ষণ করেন বা জিজ্ঞেস করেন। ভালো নমুনা পুরো জনসংখ্যার একটা ক্ষুদ্র প্রতিচ্ছবি - ঠিক যেমন এক চামচ তরকারি চেখে পুরো হাঁড়ির স্বাদ বোঝা যায়।
ধরুন বাংলাদেশ পরিসংখ্যান ব্যুরো (BBS) জানতে চায় দেশের পরিবারগুলোর গড় মাসিক খরচ কত। তারা সারা দেশ থেকে ২০,০০০ পরিবার বেছে নিয়ে জরিপ চালায়। এখানে:
- জনসংখ্যা: বাংলাদেশের সব পরিবার (প্রায় ৪ কোটি)
- নমুনা: জরিপে অংশ নেওয়া ২০,০০০ পরিবার
কেন নমুনা ব্যবহার করি?
পুরো জনসংখ্যার ডেটা সংগ্রহ করা (যাকে আদমশুমারি বা সেন্সাস বলে) প্রায়ই অসম্ভব বা অব্যবহারিক। কারণগুলো হলো:
- খরচ: ১৭ কোটি মানুষের জরিপে বিশাল অর্থ লাগবে।
- সময়: ডেটা সংগ্রহ করতে করতে পরিস্থিতি বদলে যায়।
- ধ্বংসাত্মক পরীক্ষা: গার্মেন্টসে কাপড়ের মান পরীক্ষা করতে গেলে কাপড় ছিঁড়তে হয়। সব কাপড় পরীক্ষা করলে বিক্রি করার কিছু থাকবে না!
- যথেষ্ট ভালো: সঠিকভাবে নেওয়া নমুনা থেকে খুব নির্ভুল অনুমান করা সম্ভব।
ভালো নমুনা কীভাবে নেবেন?
নমুনার মান নির্ভর করে সেটা কতটা জনসংখ্যার প্রতিনিধি। যদি আপনি শুধু ঢাকার গুলশানে জরিপ করেন, সেটা পুরো বাংলাদেশের প্রতিনিধি হবে না।
দৈব নমুনায়ন (Random Sampling)
সবচেয়ে ভালো পদ্ধতি হলো দৈব নমুনায়ন - যেখানে জনসংখ্যার প্রতিটা সদস্যের নমুনায় আসার সমান সুযোগ থাকে। এটা ঠিক লটারির মতো - সবার সমান সম্ভাবনা।
ধরুন একটা কলেজে ৫০০০ ছাত্রছাত্রী আছে এবং আপনি তাদের ক্যান্টিনের খাবার নিয়ে মতামত জানতে চান। আপনি সব ছাত্রের রোল নম্বর থেকে লটারি করে ২০০ জন বেছে নিলেন। প্রত্যেকের বাছাই হওয়ার সমান সম্ভাবনা ছিল, তাই এটা দৈব নমুনা।
কিন্তু যদি আপনি শুধু নিজের ক্লাসের বন্ধুদের জিজ্ঞেস করেন, সেটা দৈব নমুনা নয় - আপনার বন্ধুদের মতামত পুরো কলেজের প্রতিনিধি নাও হতে পারে।
স্তরভিত্তিক নমুনায়ন (Stratified Sampling)
জনসংখ্যাকে কয়েকটা গ্রুপে ভাগ করে প্রতি গ্রুপ থেকে দৈবভাবে নমুনা নেওয়া। যেমন বাংলাদেশের জরিপে প্রতিটা বিভাগ থেকে আনুপাতিক হারে নমুনা নেওয়া - যাতে কোনো অঞ্চল বাদ না পড়ে।
প্যারামিটার বনাম স্ট্যাটিস্টিক
দুটো গুরুত্বপূর্ণ শব্দ জেনে রাখুন:
- প্যারামিটার: পুরো জনসংখ্যার বৈশিষ্ট্য বর্ণনা করে। যেমন "বাংলাদেশের সব পরিবারের গড় মাসিক আয়" - এটা প্যারামিটার। সাধারণত আমরা এটা জানি না, অনুমান করি।
- স্ট্যাটিস্টিক: নমুনা থেকে হিসাব করা মান। যেমন "জরিপে অংশ নেওয়া ২০,০০০ পরিবারের গড় মাসিক আয় ২৮,০০০ টাকা" - এটা স্ট্যাটিস্টিক। এটা দিয়ে প্যারামিটার অনুমান করা হয়।
খারাপ নমুনার বিপদ
খারাপ নমুনা থেকে বিভ্রান্তিকর সিদ্ধান্ত আসে। ধরুন কেউ জানতে চায় বাংলাদেশিদের গড় মাসিক আয় কত। তিনি শুধু ফেসবুকে একটা পোল দিলেন। সমস্যা কী?
- যাদের ইন্টারনেট নেই তারা বাদ পড়ছে
- গ্রামের মানুষ কম উত্তর দেবে
- যারা ফেসবুক ব্যবহার করে তাদের গড় আয় সাধারণত বেশি
ফলে এই জরিপের ফলাফল আসল চিত্র থেকে অনেক আলাদা হবে।
জনসংখ্যা হলো যে সম্পূর্ণ দলকে আপনি জানতে চান, আর নমুনা হলো সেই দলের একটা ছোট অংশ যেটা আপনি আসলে পর্যবেক্ষণ করেন। পুরো জনসংখ্যার ডেটা সংগ্রহ করা প্রায়ই অসম্ভব, তাই আমরা নমুনা ব্যবহার করি। ভালো নমুনা জনসংখ্যার প্রতিনিধি হতে হবে - নইলে সিদ্ধান্ত ভুল হবে। দৈব নমুনায়ন এই নিশ্চয়তা দেওয়ার সবচেয়ে ভালো উপায়।