সম্ভাব্যতা বিন্যাস

কঠিনতা: মধ্যবর্তী পড়ার সময়: 15 মিনিট

সম্ভাব্যতা বিন্যাস কী?

ধরুন আপনি ছয়টা ছক্কা একসাথে গড়ালেন। মোট কত আসতে পারে? ৬ থেকে ৩৬ পর্যন্ত। কিন্তু সব মোটই কি সমান সম্ভাব্য? না। মোট ৬ (সব ছক্কায় ১) বা ৩৬ (সব ছক্কায় ৬) আসার সম্ভাবনা অত্যন্ত কম, কিন্তু মোট ২১ (মাঝামাঝি) আসার সম্ভাবনা অনেক বেশি।

0 9 18 27 36 45 1 2 3 4 5 6 7 8 9

সম্ভাব্যতা বিন্যাস হলো সব সম্ভাব্য ফলাফল আর তাদের সম্ভাব্যতার একটা সম্পূর্ণ তালিকা বা নকশা। এটা আপনাকে বলে কোন ফলাফল কতটা সম্ভাব্য।

দ্বিপদ বিন্যাস (Binomial Distribution)

এটা সবচেয়ে সহজ বিন্যাসগুলোর একটা। এটা কাজ করে যখন:

  • একটা পরীক্ষা নির্দিষ্ট সংখ্যকবার করা হয়
  • প্রতিবার দুটোমাত্র ফলাফল - সফল বা ব্যর্থ
  • প্রতিবার সফলতার সম্ভাব্যতা একই
  • পরীক্ষাগুলো স্বাধীন
উদাহরণ

বাংলাদেশের একটা গার্মেন্টস ফ্যাক্টরিতে প্রতিটা শার্টে ত্রুটি থাকার সম্ভাবনা ৫%। একটা কার্টনে ২০টা শার্ট আছে। কার্টনে ঠিক ২টা ত্রুটিপূর্ণ শার্ট থাকার সম্ভাব্যতা কত?

এটা দ্বিপদ বিন্যাস - প্রতিটা শার্ট হয় ত্রুটিপূর্ণ (৫%) না হয় ভালো (৯৫%), ২০ বার পরীক্ষা।

দ্বিপদ সূত্র দিয়ে হিসাব করলে: P(ঠিক ২টা ত্রুটি) ≈ ১৮.৯%

মজার বিষয় - একটাও ত্রুটি না থাকার সম্ভাব্যতা = ০.৯৫²⁰ ≈ ৩৫.৮%। মানে প্রতি তিনটার একটা কার্টনে সব শার্ট ভালো।

স্বাভাবিক বিন্যাস (Normal Distribution)

এটা পরিসংখ্যানের সবচেয়ে গুরুত্বপূর্ণ বিন্যাস - একে "ঘণ্টা বক্ররেখা" (bell curve) বলা হয় কারণ এর আকার ঘণ্টার মতো। প্রকৃতিতে অসংখ্য জিনিস এই ধরনে মেনে চলে।

140 150 160 170 180 190 200
উদাহরণ

বাংলাদেশে SSC পরীক্ষায় লক্ষ লক্ষ ছাত্রছাত্রী অংশ নেয়। তাদের নম্বরের বিন্যাস প্রায় ঘণ্টাকৃতি:

  • বেশিরভাগ ছাত্র মাঝামাঝি নম্বর পায় (কেন্দ্রে জমা)
  • খুব কম নম্বর বা খুব বেশি নম্বর - দুটোই বিরল (দুই প্রান্তে কম)
  • বক্ররেখা গড়ের চারপাশে প্রতিসম - বাম আর ডান দিক একই রকম

স্বাভাবিক বিন্যাসের বৈশিষ্ট্য

  • গড়, মধ্যমা এবং প্রচুরক একই বিন্দুতে থাকে - ঠিক মাঝখানে
  • বক্ররেখা গড়ের সাপেক্ষে প্রতিসম
  • সম্পূর্ণভাবে দুটো সংখ্যা দিয়ে বর্ণনা করা যায়: গড় (μ) আর আদর্শ বিচ্যুতি (σ)

৬৮-৯৫-৯৯.৭ নিয়ম

স্বাভাবিক বিন্যাসের একটা চমৎকার বৈশিষ্ট্য:

  • ৬৮% ডেটা গড় থেকে ১ আদর্শ বিচ্যুতির মধ্যে
  • ৯৫% ডেটা গড় থেকে ২ আদর্শ বিচ্যুতির মধ্যে
  • ৯৯.৭% ডেটা গড় থেকে ৩ আদর্শ বিচ্যুতির মধ্যে
উদাহরণ

ধরুন বাংলাদেশি প্রাপ্তবয়স্ক পুরুষদের গড় উচ্চতা ১৬৫ সেমি, আদর্শ বিচ্যুতি ৭ সেমি, এবং উচ্চতা প্রায় স্বাভাবিক বিন্যাস মেনে চলে।

  • ৬৮% পুরুষের উচ্চতা ১৫৮-১৭২ সেমি (১৬৫ ± ৭)
  • ৯৫% পুরুষের উচ্চতা ১৫১-১৭৯ সেমি (১৬৫ ± ১৪)
  • ৯৯.৭% পুরুষের উচ্চতা ১৪৪-১৮৬ সেমি (১৬৫ ± ২১)

তাহলে ১৮৬ সেমি-র (প্রায় ৬ ফুট ১ ইঞ্চি) বেশি লম্বা পুরুষ কত? মাত্র ০.১৫% - হাজারে দেড় জন! তাই ক্রিকেটে ৬ ফুটের বেশি লম্বা পেসার পাওয়া বাংলাদেশে এত কঠিন।

অন্যান্য বিন্যাস

আরো কিছু বিন্যাস সংক্ষেপে জেনে রাখুন:

  • সমবিন্যাস (Uniform): সব ফলাফলের সম্ভাব্যতা সমান। যেমন একটা ন্যায্য ছক্কায় ১-৬ প্রতিটার সম্ভাব্যতা ১/৬।
  • পোয়াসোঁ বিন্যাস (Poisson): নির্দিষ্ট সময়ে বিরল ঘটনার সংখ্যা। যেমন ঢাকার একটা মোড়ে ঘণ্টায় কতটা দুর্ঘটনা হয়।
  • সূচকীয় বিন্যাস (Exponential): দুটো ঘটনার মধ্যে সময়ের ব্যবধান। যেমন বাসস্ট্যান্ডে পরবর্তী বাস আসতে কত সময় লাগবে।

কেন সম্ভাব্যতা বিন্যাস গুরুত্বপূর্ণ?

বিন্যাস জানা মানে ভবিষ্যদ্বাণী করতে পারা। যদি জানেন ডেটা কোন বিন্যাস মেনে চলে, তাহলে:

17 1 16 2 17 3 16 4 17 5 17 6
  • নির্দিষ্ট মান পাওয়ার সম্ভাব্যতা হিসাব করতে পারেন
  • অস্বাভাবিক মান চিনতে পারেন
  • ভবিষ্যতের ফলাফল সম্পর্কে আন্দাজ করতে পারেন
মূল বিষয়

সম্ভাব্যতা বিন্যাস বলে কোন ফলাফল কতটা সম্ভাব্য। দ্বিপদ বিন্যাস হ্যাঁ/না পরিস্থিতিতে কাজ করে, আর স্বাভাবিক বিন্যাস (ঘণ্টা বক্ররেখা) প্রকৃতির অসংখ্য জিনিসে দেখা যায়। ৬৮-৯৫-৯৯.৭ নিয়ম দিয়ে স্বাভাবিক বিন্যাসের ডেটা দ্রুত বুঝতে পারবেন। এই ধারণাগুলো পরবর্তী পাঠগুলোর - বিশেষ করে অনুমানমূলক পরিসংখ্যানের - ভিত্তি।