সম্ভাব্যতা বিন্যাস কী?
ধরুন আপনি ছয়টা ছক্কা একসাথে গড়ালেন। মোট কত আসতে পারে? ৬ থেকে ৩৬ পর্যন্ত। কিন্তু সব মোটই কি সমান সম্ভাব্য? না। মোট ৬ (সব ছক্কায় ১) বা ৩৬ (সব ছক্কায় ৬) আসার সম্ভাবনা অত্যন্ত কম, কিন্তু মোট ২১ (মাঝামাঝি) আসার সম্ভাবনা অনেক বেশি।
সম্ভাব্যতা বিন্যাস হলো সব সম্ভাব্য ফলাফল আর তাদের সম্ভাব্যতার একটা সম্পূর্ণ তালিকা বা নকশা। এটা আপনাকে বলে কোন ফলাফল কতটা সম্ভাব্য।
দ্বিপদ বিন্যাস (Binomial Distribution)
এটা সবচেয়ে সহজ বিন্যাসগুলোর একটা। এটা কাজ করে যখন:
- একটা পরীক্ষা নির্দিষ্ট সংখ্যকবার করা হয়
- প্রতিবার দুটোমাত্র ফলাফল - সফল বা ব্যর্থ
- প্রতিবার সফলতার সম্ভাব্যতা একই
- পরীক্ষাগুলো স্বাধীন
বাংলাদেশের একটা গার্মেন্টস ফ্যাক্টরিতে প্রতিটা শার্টে ত্রুটি থাকার সম্ভাবনা ৫%। একটা কার্টনে ২০টা শার্ট আছে। কার্টনে ঠিক ২টা ত্রুটিপূর্ণ শার্ট থাকার সম্ভাব্যতা কত?
এটা দ্বিপদ বিন্যাস - প্রতিটা শার্ট হয় ত্রুটিপূর্ণ (৫%) না হয় ভালো (৯৫%), ২০ বার পরীক্ষা।
দ্বিপদ সূত্র দিয়ে হিসাব করলে: P(ঠিক ২টা ত্রুটি) ≈ ১৮.৯%
মজার বিষয় - একটাও ত্রুটি না থাকার সম্ভাব্যতা = ০.৯৫²⁰ ≈ ৩৫.৮%। মানে প্রতি তিনটার একটা কার্টনে সব শার্ট ভালো।
স্বাভাবিক বিন্যাস (Normal Distribution)
এটা পরিসংখ্যানের সবচেয়ে গুরুত্বপূর্ণ বিন্যাস - একে "ঘণ্টা বক্ররেখা" (bell curve) বলা হয় কারণ এর আকার ঘণ্টার মতো। প্রকৃতিতে অসংখ্য জিনিস এই ধরনে মেনে চলে।
বাংলাদেশে SSC পরীক্ষায় লক্ষ লক্ষ ছাত্রছাত্রী অংশ নেয়। তাদের নম্বরের বিন্যাস প্রায় ঘণ্টাকৃতি:
- বেশিরভাগ ছাত্র মাঝামাঝি নম্বর পায় (কেন্দ্রে জমা)
- খুব কম নম্বর বা খুব বেশি নম্বর - দুটোই বিরল (দুই প্রান্তে কম)
- বক্ররেখা গড়ের চারপাশে প্রতিসম - বাম আর ডান দিক একই রকম
স্বাভাবিক বিন্যাসের বৈশিষ্ট্য
- গড়, মধ্যমা এবং প্রচুরক একই বিন্দুতে থাকে - ঠিক মাঝখানে
- বক্ররেখা গড়ের সাপেক্ষে প্রতিসম
- সম্পূর্ণভাবে দুটো সংখ্যা দিয়ে বর্ণনা করা যায়: গড় (μ) আর আদর্শ বিচ্যুতি (σ)
৬৮-৯৫-৯৯.৭ নিয়ম
স্বাভাবিক বিন্যাসের একটা চমৎকার বৈশিষ্ট্য:
- ৬৮% ডেটা গড় থেকে ১ আদর্শ বিচ্যুতির মধ্যে
- ৯৫% ডেটা গড় থেকে ২ আদর্শ বিচ্যুতির মধ্যে
- ৯৯.৭% ডেটা গড় থেকে ৩ আদর্শ বিচ্যুতির মধ্যে
ধরুন বাংলাদেশি প্রাপ্তবয়স্ক পুরুষদের গড় উচ্চতা ১৬৫ সেমি, আদর্শ বিচ্যুতি ৭ সেমি, এবং উচ্চতা প্রায় স্বাভাবিক বিন্যাস মেনে চলে।
- ৬৮% পুরুষের উচ্চতা ১৫৮-১৭২ সেমি (১৬৫ ± ৭)
- ৯৫% পুরুষের উচ্চতা ১৫১-১৭৯ সেমি (১৬৫ ± ১৪)
- ৯৯.৭% পুরুষের উচ্চতা ১৪৪-১৮৬ সেমি (১৬৫ ± ২১)
তাহলে ১৮৬ সেমি-র (প্রায় ৬ ফুট ১ ইঞ্চি) বেশি লম্বা পুরুষ কত? মাত্র ০.১৫% - হাজারে দেড় জন! তাই ক্রিকেটে ৬ ফুটের বেশি লম্বা পেসার পাওয়া বাংলাদেশে এত কঠিন।
অন্যান্য বিন্যাস
আরো কিছু বিন্যাস সংক্ষেপে জেনে রাখুন:
- সমবিন্যাস (Uniform): সব ফলাফলের সম্ভাব্যতা সমান। যেমন একটা ন্যায্য ছক্কায় ১-৬ প্রতিটার সম্ভাব্যতা ১/৬।
- পোয়াসোঁ বিন্যাস (Poisson): নির্দিষ্ট সময়ে বিরল ঘটনার সংখ্যা। যেমন ঢাকার একটা মোড়ে ঘণ্টায় কতটা দুর্ঘটনা হয়।
- সূচকীয় বিন্যাস (Exponential): দুটো ঘটনার মধ্যে সময়ের ব্যবধান। যেমন বাসস্ট্যান্ডে পরবর্তী বাস আসতে কত সময় লাগবে।
কেন সম্ভাব্যতা বিন্যাস গুরুত্বপূর্ণ?
বিন্যাস জানা মানে ভবিষ্যদ্বাণী করতে পারা। যদি জানেন ডেটা কোন বিন্যাস মেনে চলে, তাহলে:
- নির্দিষ্ট মান পাওয়ার সম্ভাব্যতা হিসাব করতে পারেন
- অস্বাভাবিক মান চিনতে পারেন
- ভবিষ্যতের ফলাফল সম্পর্কে আন্দাজ করতে পারেন
সম্ভাব্যতা বিন্যাস বলে কোন ফলাফল কতটা সম্ভাব্য। দ্বিপদ বিন্যাস হ্যাঁ/না পরিস্থিতিতে কাজ করে, আর স্বাভাবিক বিন্যাস (ঘণ্টা বক্ররেখা) প্রকৃতির অসংখ্য জিনিসে দেখা যায়। ৬৮-৯৫-৯৯.৭ নিয়ম দিয়ে স্বাভাবিক বিন্যাসের ডেটা দ্রুত বুঝতে পারবেন। এই ধারণাগুলো পরবর্তী পাঠগুলোর - বিশেষ করে অনুমানমূলক পরিসংখ্যানের - ভিত্তি।