বেইজের উপপাদ্য

কঠিনতা: মধ্যবর্তী পড়ার সময়: 15 মিনিট

নতুন প্রমাণে বিশ্বাস আপডেট করা

আমরা সবাই প্রতিদিন নিজেদের ধারণা আপডেট করি। সকালে ভেবেছিলেন আজ অফিসে কম কাজ থাকবে, কিন্তু বসের ফোন আসলো - এখন ধারণা বদলে গেল। এভাবে নতুন তথ্য পেয়ে পুরনো বিশ্বাস আপডেট করার একটা গাণিতিক পদ্ধতি হলো বেইজের উপপাদ্য। এটা আঠারো শতকের গণিতবিদ টমাস বেইজের নামে।

0.01 +রোগ 0.99 -রোগ 0.95 +পরীক্ষা 0.05 -পরীক্ষা 0.05 +পরীক্ষা 0.95 -পরীক্ষা

বেইজের সূত্র

P(ক | খ) = [P(খ | ক) × P(ক)] ÷ P(খ)

সহজ ভাষায়:

  • P(ক): প্রাক-সম্ভাব্যতা (prior) - নতুন তথ্যের আগে আপনার বিশ্বাস
  • P(খ | ক): সম্ভাব্যতা (likelihood) - ক সত্যি হলে খ ঘটার সম্ভাবনা কতটুকু
  • P(খ): প্রমাণের সম্ভাব্যতা - খ ঘটার সামগ্রিক সম্ভাবনা
  • P(ক | খ): পশ্চাৎ-সম্ভাব্যতা (posterior) - নতুন তথ্যের পর আপডেট করা বিশ্বাস

একটা সহজ উদাহরণ দিয়ে শুরু করি

উদাহরণ

ঢাকায় বর্ষাকালে ৬০% দিন বৃষ্টি হয়। যেদিন বৃষ্টি হবে, সেদিন সকালে মেঘলা আকাশ দেখা যায় ৯০% ক্ষেত্রে। যেদিন বৃষ্টি হয় না, সেদিনও ২০% ক্ষেত্রে সকালে মেঘলা থাকে।

আজ সকালে আকাশ মেঘলা। আজ বৃষ্টি হওয়ার সম্ভাব্যতা কত?

  • P(বৃষ্টি) = ০.৬০
  • P(মেঘলা | বৃষ্টি) = ০.৯০
  • P(মেঘলা | বৃষ্টি নেই) = ০.২০
  • P(মেঘলা) = P(মেঘলা | বৃষ্টি) × P(বৃষ্টি) + P(মেঘলা | বৃষ্টি নেই) × P(বৃষ্টি নেই)
  • P(মেঘলা) = ০.৯০ × ০.৬০ + ০.২০ × ০.৪০ = ০.৫৪ + ০.০৮ = ০.৬২

P(বৃষ্টি | মেঘলা) = (০.৯০ × ০.৬০) ÷ ০.৬২ = ০.৫৪ ÷ ০.৬২ ≈ ০.৮৭ বা ৮৭%

মেঘলা আকাশ দেখে বৃষ্টির সম্ভাব্যতা ৬০% থেকে বেড়ে ৮৭% হলো - কারণ মেঘলা আকাশ বৃষ্টির একটা শক্তিশালী সংকেত।

রোগ নির্ণয়ে বেইজের উপপাদ্য

চিকিৎসায় বেইজের উপপাদ্য অত্যন্ত গুরুত্বপূর্ণ। আগের পাঠের ডায়াবেটিসের উদাহরণ মনে আছে? সেটা আসলে বেইজের উপপাদ্যই ছিল।

উদাহরণ

বাংলাদেশে একটা বিরল রোগ আছে যা ১০,০০০ জনে ১ জনের হয়। পরীক্ষাটা ৯৯% নির্ভুল - রোগ থাকলে ৯৯% পজিটিভ দেখায়, না থাকলে ৯৯% নেগেটিভ দেখায়। আপনার পরীক্ষা পজিটিভ এসেছে। আসলেই রোগ থাকার সম্ভাবনা কত?

  • P(রোগ) = ১/১০,০০০ = ০.০০০১
  • P(পজিটিভ | রোগ) = ০.৯৯
  • P(পজিটিভ | রোগ নেই) = ০.০১
  • P(পজিটিভ) = ০.৯৯ × ০.০০০১ + ০.০১ × ০.৯৯৯৯ = ০.০০০০৯৯ + ০.০০৯৯৯৯ ≈ ০.০১০১

P(রোগ | পজিটিভ) = ০.০০০০৯৯ ÷ ০.০১০১ ≈ ০.০০৯৮ বা প্রায় ১%

৯৯% নির্ভুল পরীক্ষা পজিটিভ হওয়া সত্ত্বেও আসলে রোগ থাকার সম্ভাবনা মাত্র ১%! কারণ রোগটা এত বিরল যে বেশিরভাগ পজিটিভ ফলাফল আসলে ভুল পজিটিভ।

এই জন্যই ডাক্তাররা বিরল রোগের ক্ষেত্রে একাধিক পরীক্ষা করেন।

বেইজীয় চিন্তা দৈনন্দিন জীবনে

আপনাকে সূত্র মনে রাখতে হবে না। মূল বিষয়টা হলো এই চিন্তার ধরন:

1 পূর্বে 16 পরে
উদাহরণ

ধরুন আপনি daraz.com.bd থেকে একটা ফোন কিনবেন। বিক্রেতার রেটিং ৪.৫/৫। আপনার বিশ্বাস - সম্ভবত ভালো পণ্য পাবেন (প্রাক-সম্ভাব্যতা বেশি)।

তারপর দেখলেন সাম্প্রতিক ১০টা রিভিউয়ের ৭টায় লেখা "নকল পণ্য পেয়েছি।" এটা নতুন প্রমাণ। এই প্রমাণ দেখে আপনার বিশ্বাস আপডেট হবে - এখন ভালো পণ্য পাওয়ার সম্ভাব্যতা কমে যাবে।

এটাই বেইজীয় চিন্তা - নতুন প্রমাণ দিয়ে বিশ্বাস আপডেট করা।

প্রাক-সম্ভাব্যতার গুরুত্ব

বেইজের উপপাদ্যে প্রাক-সম্ভাব্যতা অনেক গুরুত্বপূর্ণ। একই প্রমাণ আলাদা প্রাক-সম্ভাব্যতায় আলাদা ফলাফল দেয়।

উপরের রোগের উদাহরণে রোগটা যদি বিরল না হয়ে সাধারণ হতো (ধরুন ১০% মানুষের আছে), তাহলে পজিটিভ পরীক্ষায় রোগ থাকার সম্ভাব্যতা অনেক বেশি হতো - প্রায় ৯২%। একই পরীক্ষা, একই নির্ভুলতা, কিন্তু রোগ কতটা সাধারণ সেটা ফলাফল বদলে দিচ্ছে।

কোথায় ব্যবহৃত হয়?

  • স্প্যাম ফিল্টার: ইমেইলে "লটারি জিতেছেন" লেখা থাকলে স্প্যাম হওয়ার সম্ভাব্যতা কত?
  • আবহাওয়া পূর্বাভাস: নতুন স্যাটেলাইট ডেটা পেয়ে পূর্বাভাস আপডেট করা।
  • বীমা: দাবির ইতিহাস দেখে প্রিমিয়াম নির্ধারণ।
  • মান নিয়ন্ত্রণ: গার্মেন্টসে ত্রুটিপূর্ণ পণ্য শনাক্তকরণ।
মূল বিষয়

বেইজের উপপাদ্য আমাদের শেখায় নতুন প্রমাণ পেলে পুরনো বিশ্বাস কীভাবে আপডেট করতে হয়। প্রাক-সম্ভাব্যতা (আগের বিশ্বাস) + নতুন প্রমাণ = পশ্চাৎ-সম্ভাব্যতা (আপডেট করা বিশ্বাস)। বিশেষভাবে মনে রাখুন - বিরল ঘটনার ক্ষেত্রে এমনকি অত্যন্ত নির্ভুল পরীক্ষাও অনেক ভুল পজিটিভ দিতে পারে। এই চিন্তার ধরন আয়ত্ত করলে আপনি তথ্য থেকে আরো বুদ্ধিমান সিদ্ধান্ত নিতে পারবেন।