নতুন প্রমাণে বিশ্বাস আপডেট করা
আমরা সবাই প্রতিদিন নিজেদের ধারণা আপডেট করি। সকালে ভেবেছিলেন আজ অফিসে কম কাজ থাকবে, কিন্তু বসের ফোন আসলো - এখন ধারণা বদলে গেল। এভাবে নতুন তথ্য পেয়ে পুরনো বিশ্বাস আপডেট করার একটা গাণিতিক পদ্ধতি হলো বেইজের উপপাদ্য। এটা আঠারো শতকের গণিতবিদ টমাস বেইজের নামে।
বেইজের সূত্র
P(ক | খ) = [P(খ | ক) × P(ক)] ÷ P(খ)
সহজ ভাষায়:
- P(ক): প্রাক-সম্ভাব্যতা (prior) - নতুন তথ্যের আগে আপনার বিশ্বাস
- P(খ | ক): সম্ভাব্যতা (likelihood) - ক সত্যি হলে খ ঘটার সম্ভাবনা কতটুকু
- P(খ): প্রমাণের সম্ভাব্যতা - খ ঘটার সামগ্রিক সম্ভাবনা
- P(ক | খ): পশ্চাৎ-সম্ভাব্যতা (posterior) - নতুন তথ্যের পর আপডেট করা বিশ্বাস
একটা সহজ উদাহরণ দিয়ে শুরু করি
ঢাকায় বর্ষাকালে ৬০% দিন বৃষ্টি হয়। যেদিন বৃষ্টি হবে, সেদিন সকালে মেঘলা আকাশ দেখা যায় ৯০% ক্ষেত্রে। যেদিন বৃষ্টি হয় না, সেদিনও ২০% ক্ষেত্রে সকালে মেঘলা থাকে।
আজ সকালে আকাশ মেঘলা। আজ বৃষ্টি হওয়ার সম্ভাব্যতা কত?
- P(বৃষ্টি) = ০.৬০
- P(মেঘলা | বৃষ্টি) = ০.৯০
- P(মেঘলা | বৃষ্টি নেই) = ০.২০
- P(মেঘলা) = P(মেঘলা | বৃষ্টি) × P(বৃষ্টি) + P(মেঘলা | বৃষ্টি নেই) × P(বৃষ্টি নেই)
- P(মেঘলা) = ০.৯০ × ০.৬০ + ০.২০ × ০.৪০ = ০.৫৪ + ০.০৮ = ০.৬২
P(বৃষ্টি | মেঘলা) = (০.৯০ × ০.৬০) ÷ ০.৬২ = ০.৫৪ ÷ ০.৬২ ≈ ০.৮৭ বা ৮৭%
মেঘলা আকাশ দেখে বৃষ্টির সম্ভাব্যতা ৬০% থেকে বেড়ে ৮৭% হলো - কারণ মেঘলা আকাশ বৃষ্টির একটা শক্তিশালী সংকেত।
রোগ নির্ণয়ে বেইজের উপপাদ্য
চিকিৎসায় বেইজের উপপাদ্য অত্যন্ত গুরুত্বপূর্ণ। আগের পাঠের ডায়াবেটিসের উদাহরণ মনে আছে? সেটা আসলে বেইজের উপপাদ্যই ছিল।
বাংলাদেশে একটা বিরল রোগ আছে যা ১০,০০০ জনে ১ জনের হয়। পরীক্ষাটা ৯৯% নির্ভুল - রোগ থাকলে ৯৯% পজিটিভ দেখায়, না থাকলে ৯৯% নেগেটিভ দেখায়। আপনার পরীক্ষা পজিটিভ এসেছে। আসলেই রোগ থাকার সম্ভাবনা কত?
- P(রোগ) = ১/১০,০০০ = ০.০০০১
- P(পজিটিভ | রোগ) = ০.৯৯
- P(পজিটিভ | রোগ নেই) = ০.০১
- P(পজিটিভ) = ০.৯৯ × ০.০০০১ + ০.০১ × ০.৯৯৯৯ = ০.০০০০৯৯ + ০.০০৯৯৯৯ ≈ ০.০১০১
P(রোগ | পজিটিভ) = ০.০০০০৯৯ ÷ ০.০১০১ ≈ ০.০০৯৮ বা প্রায় ১%
৯৯% নির্ভুল পরীক্ষা পজিটিভ হওয়া সত্ত্বেও আসলে রোগ থাকার সম্ভাবনা মাত্র ১%! কারণ রোগটা এত বিরল যে বেশিরভাগ পজিটিভ ফলাফল আসলে ভুল পজিটিভ।
এই জন্যই ডাক্তাররা বিরল রোগের ক্ষেত্রে একাধিক পরীক্ষা করেন।
বেইজীয় চিন্তা দৈনন্দিন জীবনে
আপনাকে সূত্র মনে রাখতে হবে না। মূল বিষয়টা হলো এই চিন্তার ধরন:
ধরুন আপনি daraz.com.bd থেকে একটা ফোন কিনবেন। বিক্রেতার রেটিং ৪.৫/৫। আপনার বিশ্বাস - সম্ভবত ভালো পণ্য পাবেন (প্রাক-সম্ভাব্যতা বেশি)।
তারপর দেখলেন সাম্প্রতিক ১০টা রিভিউয়ের ৭টায় লেখা "নকল পণ্য পেয়েছি।" এটা নতুন প্রমাণ। এই প্রমাণ দেখে আপনার বিশ্বাস আপডেট হবে - এখন ভালো পণ্য পাওয়ার সম্ভাব্যতা কমে যাবে।
এটাই বেইজীয় চিন্তা - নতুন প্রমাণ দিয়ে বিশ্বাস আপডেট করা।
প্রাক-সম্ভাব্যতার গুরুত্ব
বেইজের উপপাদ্যে প্রাক-সম্ভাব্যতা অনেক গুরুত্বপূর্ণ। একই প্রমাণ আলাদা প্রাক-সম্ভাব্যতায় আলাদা ফলাফল দেয়।
উপরের রোগের উদাহরণে রোগটা যদি বিরল না হয়ে সাধারণ হতো (ধরুন ১০% মানুষের আছে), তাহলে পজিটিভ পরীক্ষায় রোগ থাকার সম্ভাব্যতা অনেক বেশি হতো - প্রায় ৯২%। একই পরীক্ষা, একই নির্ভুলতা, কিন্তু রোগ কতটা সাধারণ সেটা ফলাফল বদলে দিচ্ছে।
কোথায় ব্যবহৃত হয়?
- স্প্যাম ফিল্টার: ইমেইলে "লটারি জিতেছেন" লেখা থাকলে স্প্যাম হওয়ার সম্ভাব্যতা কত?
- আবহাওয়া পূর্বাভাস: নতুন স্যাটেলাইট ডেটা পেয়ে পূর্বাভাস আপডেট করা।
- বীমা: দাবির ইতিহাস দেখে প্রিমিয়াম নির্ধারণ।
- মান নিয়ন্ত্রণ: গার্মেন্টসে ত্রুটিপূর্ণ পণ্য শনাক্তকরণ।
বেইজের উপপাদ্য আমাদের শেখায় নতুন প্রমাণ পেলে পুরনো বিশ্বাস কীভাবে আপডেট করতে হয়। প্রাক-সম্ভাব্যতা (আগের বিশ্বাস) + নতুন প্রমাণ = পশ্চাৎ-সম্ভাব্যতা (আপডেট করা বিশ্বাস)। বিশেষভাবে মনে রাখুন - বিরল ঘটনার ক্ষেত্রে এমনকি অত্যন্ত নির্ভুল পরীক্ষাও অনেক ভুল পজিটিভ দিতে পারে। এই চিন্তার ধরন আয়ত্ত করলে আপনি তথ্য থেকে আরো বুদ্ধিমান সিদ্ধান্ত নিতে পারবেন।