প্রকল্প পরীক্ষণ

কঠিনতা: মধ্যবর্তী পড়ার সময়: 15 মিনিট

তথ্য দিয়ে দাবি যাচাই

প্রতিদিন আমরা দাবি শুনি। "এই কোচিং সেন্টারে পড়লে GPA ৫ পাবে।" "নতুন সারে ধানের ফলন ২০% বাড়ে।" "এই ওষুধ মাথাব্যথা ৫ মিনিটে সারায়।" কিন্তু এই দাবিগুলো কি সত্যি, নাকি শুধু কাকতালীয়?

-3 -2 -1 0 1 2 3

প্রকল্প পরীক্ষণ (hypothesis testing) হলো তথ্য দিয়ে দাবি যাচাই করার একটা সুশৃঙ্খল পদ্ধতি। এটা বলে একটা ফলাফল কি সত্যিই তাৎপর্যপূর্ণ, নাকি শুধু দৈবচয়নের খেলা।

আদালতের উপমা

প্রকল্প পরীক্ষণ বোঝার সবচেয়ে সহজ উপায় হলো আদালতের সাথে তুলনা করা।

আদালতে আসামি "নির্দোষ যতক্ষণ না দোষ প্রমাণিত হয়।" রাষ্ট্রপক্ষকে পর্যাপ্ত প্রমাণ দিতে হয়। প্রমাণ যথেষ্ট শক্তিশালী হলে "দোষী" রায় আসে। না হলে "নির্দোষ" - যার মানে দোষ প্রমাণ হয়নি, আসলেই নির্দোষ প্রমাণ হয়নি।

প্রকল্প পরীক্ষণও ঠিক এমন:

  • ধরে নিই কিছুই ঘটছে না (নির্দোষ ধরে নেওয়ার মতো)
  • তথ্য সংগ্রহ করি (প্রমাণ)
  • তথ্য যথেষ্ট শক্তিশালী হলে শুরুর ধারণা বাতিল করি
  • না হলে শুরুর ধারণা বহাল রাখি

শূন্য ও বিকল্প প্রকল্প

প্রতিটা পরীক্ষায় দুটো প্রতিদ্বন্দ্বী বক্তব্য থাকে:

ফলাফল 0.5 2.3 4.1 0

শূন্য প্রকল্প (H₀): "কিছুই ঘটছে না" বক্তব্য। কোনো প্রভাব নেই, পার্থক্য নেই, সম্পর্ক নেই। এটা ডিফল্ট - নির্দোষ ধরে নেওয়ার মতো।

বিকল্প প্রকল্প (H₁): আপনি যা প্রমাণ করতে চান। প্রভাব আছে, পার্থক্য আছে, সম্পর্ক আছে।

উদাহরণ

একটা নতুন সার বাজারে এসেছে। দাবি করা হচ্ছে এতে ধানের ফলন বাড়ে।

H₀: নতুন সার পুরনো সারের চেয়ে ভালো না। ফলনের পার্থক্য দৈবচয়নের কারণে।

H₁: নতুন সার আসলেই ফলন বাড়ায়।

গবেষক ৫০টা জমিতে নতুন সার আর ৫০টায় পুরনো সার দিলেন। ফলন তুলনা করলেন। নতুন সারের জমিতে গড়ে প্রতি একরে ২ মণ বেশি ফলন হলো। কিন্তু এটা কি সত্যিই সারের কারণে, নাকি দৈবচয়নে এমন হতে পারতো? পরিসংখ্যানগত পরীক্ষা সেই উত্তর দেবে।

পরীক্ষার ধাপ

  1. প্রকল্প লিখুন: H₀ (কিছু হচ্ছে না) এবং H₁ (কিছু হচ্ছে)
  2. তথ্য সংগ্রহ করুন: পরীক্ষা চালান বা পর্যবেক্ষণ করুন
  3. তথ্য বিশ্লেষণ করুন: H₀ সত্যি হলে এই ফলাফল কতটা অসম্ভাব্য?
  4. সিদ্ধান্ত নিন: ফলাফল খুবই অসম্ভাব্য হলে H₀ বাতিল করুন, নইলে করবেন না

"খুবই অসম্ভাব্য" সাধারণত মানে ৫% এর কম সম্ভাবনা - P-মানের পাঠে এটা বিস্তারিত জানবেন।

দুই ধরনের ভুল

যত সাবধানই হন, ভুল সিদ্ধান্তের সম্ভাবনা থাকে। দুইভাবে ভুল হতে পারে:

-3 -2 -1 0 1 2 3

টাইপ I ত্রুটি (মিথ্যা অ্যালার্ম)

H₀ আসলে সত্যি কিন্তু আপনি বাতিল করলেন। কিছু ঘটেনি, কিন্তু আপনি ঘোষণা করলেন ঘটেছে। আদালতে: নির্দোষকে শাস্তি দেওয়া।

টাইপ II ত্রুটি (মিস করা)

H₀ আসলে ভুল কিন্তু আপনি বাতিল করলেন না। কিছু ঘটছে, কিন্তু আপনি ধরতে পারলেন না। আদালতে: দোষীকে ছেড়ে দেওয়া।

উদাহরণ

স্মোক ডিটেক্টর দিয়ে ভাবুন। টাইপ I ত্রুটি: আগুন নেই কিন্তু অ্যালার্ম বাজলো - বিরক্তিকর, কিন্তু নিরাপদ। টাইপ II ত্রুটি: আগুন আছে কিন্তু অ্যালার্ম বাজলো না - বিপজ্জনক!

পরিসংখ্যানেও এই দুই ত্রুটির মধ্যে ভারসাম্য রাখতে হয়। প্রমাণের মানদণ্ড বাড়ালে মিথ্যা অ্যালার্ম কমে কিন্তু আসল ঘটনা মিস হওয়ার সম্ভাবনা বাড়ে।

"পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" মানে কী?

সংবাদে দেখলেন "গবেষণায় দেখা গেছে ফলাফল পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ।" মানে গবেষকরা H₀ বাতিল করেছেন - তথ্য "কিছুই হচ্ছে না" ধারণার সাথে মেলেনি।

কিন্তু "তাৎপর্যপূর্ণ" মানে বিশাল বা গুরুত্বপূর্ণ নয়। একটা ওষুধ ০.১% উন্নতি আনতে পারে - পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ, কিন্তু বাস্তবে গুরুত্বহীন। "তাৎপর্যপূর্ণ" শুধু মানে "দৈবচয়নে হওয়ার সম্ভাবনা কম।"

কোথায় ব্যবহার হয়?

  • ওষুধ: নতুন ওষুধ কি প্লাসিবোর চেয়ে ভালো?
  • কৃষি: নতুন জাতের ধান কি বেশি ফলন দেয়?
  • শিক্ষা: নতুন শিক্ষাপদ্ধতি কি পুরনোটার চেয়ে ভালো?
  • ব্যবসা: ওয়েবসাইটের নতুন ডিজাইন কি বেশি বিক্রি আনছে?
মূল বিষয়

প্রকল্প পরীক্ষণ তথ্য দিয়ে দাবি যাচাইয়ের একটা সুশৃঙ্খল পদ্ধতি। শূন্য প্রকল্প (কিছু হচ্ছে না) ধরে শুরু করতে হয়, তারপর তথ্য যথেষ্ট শক্তিশালী প্রমাণ দিলেই সেটা বাতিল করা যায়। দুই ধরনের ভুল সম্ভব: মিথ্যা অ্যালার্ম (টাইপ I) এবং আসল ঘটনা মিস করা (টাইপ II)। এই কাঠামো বুঝলে আপনি সংবাদ, গবেষণা আর দৈনন্দিন দাবিগুলো আরো সমালোচনামূলকভাবে মূল্যায়ন করতে পারবেন।