জনসংখ্যা ও নমুনা

কঠিনতা: প্রাথমিক পড়ার সময়: 8 মিনিট

সবাইকে জিজ্ঞেস করা কি সম্ভব?

ধরুন আপনি জানতে চান বাংলাদেশের মানুষ মাসে গড়ে কত টাকা মোবাইল রিচার্জে খরচ করে। সবচেয়ে নির্ভুল উত্তর পেতে হলে আপনাকে ১৭ কোটি মানুষের প্রত্যেককে জিজ্ঞেস করতে হবে। কিন্তু সেটা কি সম্ভব? না। এতে কয়েক বছর লেগে যাবে, কোটি কোটি টাকা খরচ হবে, এবং জিজ্ঞেস করতে করতে অনেকের উত্তর বদলে যাবে।

জনসংখ্যা নমুনা

তাহলে কী করবেন? একটা ছোট দল বেছে নিয়ে তাদের জিজ্ঞেস করবেন, তারপর সেই উত্তর থেকে পুরো দেশ সম্পর্কে অনুমান করবেন। এটাই পরিসংখ্যানের মূল ভিত্তি।

জনসংখ্যা (Population) কী?

পরিসংখ্যানে "জনসংখ্যা" বলতে শুধু মানুষ বোঝায় না। এটা হলো সেই সম্পূর্ণ দল যেটা সম্পর্কে আপনি জানতে চান। এটা মানুষ হতে পারে, জিনিসও হতে পারে।

উদাহরণ
  • বাংলাদেশের সব SSC পরীক্ষার্থী - যদি আপনি SSC ফলাফল নিয়ে গবেষণা করেন
  • ঢাকার সব রিকশা - যদি রিকশাচালকদের আয় জানতে চান
  • একটা গার্মেন্টস ফ্যাক্টরির সব শার্ট - যদি মান নিয়ন্ত্রণ করতে চান
  • বাংলাদেশের সব ধানক্ষেত - যদি ফলন নিয়ে গবেষণা করেন

জনসংখ্যা হলো আপনার গবেষণার পুরো মহাবিশ্ব।

নমুনা (Sample) কী?

নমুনা হলো জনসংখ্যার একটা ছোট অংশ যেটাকে আপনি আসলে পর্যবেক্ষণ করেন বা জিজ্ঞেস করেন। ভালো নমুনা পুরো জনসংখ্যার একটা ক্ষুদ্র প্রতিচ্ছবি - ঠিক যেমন এক চামচ তরকারি চেখে পুরো হাঁড়ির স্বাদ বোঝা যায়।

উদাহরণ

ধরুন বাংলাদেশ পরিসংখ্যান ব্যুরো (BBS) জানতে চায় দেশের পরিবারগুলোর গড় মাসিক খরচ কত। তারা সারা দেশ থেকে ২০,০০০ পরিবার বেছে নিয়ে জরিপ চালায়। এখানে:

  • জনসংখ্যা: বাংলাদেশের সব পরিবার (প্রায় ৪ কোটি)
  • নমুনা: জরিপে অংশ নেওয়া ২০,০০০ পরিবার

কেন নমুনা ব্যবহার করি?

পুরো জনসংখ্যার ডেটা সংগ্রহ করা (যাকে আদমশুমারি বা সেন্সাস বলে) প্রায়ই অসম্ভব বা অব্যবহারিক। কারণগুলো হলো:

  • খরচ: ১৭ কোটি মানুষের জরিপে বিশাল অর্থ লাগবে।
  • সময়: ডেটা সংগ্রহ করতে করতে পরিস্থিতি বদলে যায়।
  • ধ্বংসাত্মক পরীক্ষা: গার্মেন্টসে কাপড়ের মান পরীক্ষা করতে গেলে কাপড় ছিঁড়তে হয়। সব কাপড় পরীক্ষা করলে বিক্রি করার কিছু থাকবে না!
  • যথেষ্ট ভালো: সঠিকভাবে নেওয়া নমুনা থেকে খুব নির্ভুল অনুমান করা সম্ভব।

ভালো নমুনা কীভাবে নেবেন?

নমুনার মান নির্ভর করে সেটা কতটা জনসংখ্যার প্রতিনিধি। যদি আপনি শুধু ঢাকার গুলশানে জরিপ করেন, সেটা পুরো বাংলাদেশের প্রতিনিধি হবে না।

দৈব নমুনায়ন (Random Sampling)

সবচেয়ে ভালো পদ্ধতি হলো দৈব নমুনায়ন - যেখানে জনসংখ্যার প্রতিটা সদস্যের নমুনায় আসার সমান সুযোগ থাকে। এটা ঠিক লটারির মতো - সবার সমান সম্ভাবনা।

উদাহরণ

ধরুন একটা কলেজে ৫০০০ ছাত্রছাত্রী আছে এবং আপনি তাদের ক্যান্টিনের খাবার নিয়ে মতামত জানতে চান। আপনি সব ছাত্রের রোল নম্বর থেকে লটারি করে ২০০ জন বেছে নিলেন। প্রত্যেকের বাছাই হওয়ার সমান সম্ভাবনা ছিল, তাই এটা দৈব নমুনা।

কিন্তু যদি আপনি শুধু নিজের ক্লাসের বন্ধুদের জিজ্ঞেস করেন, সেটা দৈব নমুনা নয় - আপনার বন্ধুদের মতামত পুরো কলেজের প্রতিনিধি নাও হতে পারে।

স্তরভিত্তিক নমুনায়ন (Stratified Sampling)

জনসংখ্যাকে কয়েকটা গ্রুপে ভাগ করে প্রতি গ্রুপ থেকে দৈবভাবে নমুনা নেওয়া। যেমন বাংলাদেশের জরিপে প্রতিটা বিভাগ থেকে আনুপাতিক হারে নমুনা নেওয়া - যাতে কোনো অঞ্চল বাদ না পড়ে।

প্যারামিটার বনাম স্ট্যাটিস্টিক

দুটো গুরুত্বপূর্ণ শব্দ জেনে রাখুন:

  • প্যারামিটার: পুরো জনসংখ্যার বৈশিষ্ট্য বর্ণনা করে। যেমন "বাংলাদেশের সব পরিবারের গড় মাসিক আয়" - এটা প্যারামিটার। সাধারণত আমরা এটা জানি না, অনুমান করি।
  • স্ট্যাটিস্টিক: নমুনা থেকে হিসাব করা মান। যেমন "জরিপে অংশ নেওয়া ২০,০০০ পরিবারের গড় মাসিক আয় ২৮,০০০ টাকা" - এটা স্ট্যাটিস্টিক। এটা দিয়ে প্যারামিটার অনুমান করা হয়।

খারাপ নমুনার বিপদ

খারাপ নমুনা থেকে বিভ্রান্তিকর সিদ্ধান্ত আসে। ধরুন কেউ জানতে চায় বাংলাদেশিদের গড় মাসিক আয় কত। তিনি শুধু ফেসবুকে একটা পোল দিলেন। সমস্যা কী?

  • যাদের ইন্টারনেট নেই তারা বাদ পড়ছে
  • গ্রামের মানুষ কম উত্তর দেবে
  • যারা ফেসবুক ব্যবহার করে তাদের গড় আয় সাধারণত বেশি

ফলে এই জরিপের ফলাফল আসল চিত্র থেকে অনেক আলাদা হবে।

মূল বিষয়

জনসংখ্যা হলো যে সম্পূর্ণ দলকে আপনি জানতে চান, আর নমুনা হলো সেই দলের একটা ছোট অংশ যেটা আপনি আসলে পর্যবেক্ষণ করেন। পুরো জনসংখ্যার ডেটা সংগ্রহ করা প্রায়ই অসম্ভব, তাই আমরা নমুনা ব্যবহার করি। ভালো নমুনা জনসংখ্যার প্রতিনিধি হতে হবে - নইলে সিদ্ধান্ত ভুল হবে। দৈব নমুনায়ন এই নিশ্চয়তা দেওয়ার সবচেয়ে ভালো উপায়।