P-মান ব্যাখ্যা

কঠিনতা: মধ্যবর্তী পড়ার সময়: 12 মিনিট

P-মান: সবচেয়ে বেশি ভুল বোঝা ধারণা

P-মান সম্ভবত পরিসংখ্যানের সবচেয়ে বেশি উচ্চারিত এবং সবচেয়ে বেশি ভুল বোঝা শব্দ। গবেষণাপত্র, সংবাদ, এমনকি আদালতে P-মানের কথা আসে। এটা সঠিকভাবে বোঝা অত্যন্ত জরুরি।

-3 -2 -1 0 1 2 3

P-মান আসলে কী?

P-মান হলো: যদি শূন্য প্রকল্প সত্যি হয়, তাহলে আপনি যে ফলাফল পেয়েছেন সেটা (বা তার চেয়ে চরম কিছু) পাওয়ার সম্ভাব্যতা কত?

সহজ ভাষায়: "কিছুই ঘটছে না" পৃথিবীতে এই ফলাফল কতটা আশ্চর্যজনক?

উদাহরণ

ধরুন আপনার বন্ধু দাবি করছে তার একটা মুদ্রা ন্যায্য (হেড আর টেইলের সম্ভাবনা সমান)। আপনি ২০ বার নিক্ষেপ করলেন, ১৬ বার হেড আসলো।

H₀: মুদ্রা ন্যায্য (P(হেড) = ০.৫)

ন্যায্য মুদ্রায় ২০ বারের মধ্যে ১৬ বা তার বেশি হেড আসার সম্ভাব্যতা (P-মান) ≈ ০.০০৬ বা ০.৬%।

মানে ন্যায্য মুদ্রায় এমন হওয়ার সম্ভাবনা হাজারে ৬। এটা এত কম যে আপনি সন্দেহ করবেন - মুদ্রাটা সম্ভবত ন্যায্য নয়।

০.০৫ এর তাৎপর্য

পরিসংখ্যানে সাধারণত একটা সীমারেখা নির্ধারণ করা হয় - "তাৎপর্য স্তর" (significance level), সাধারণত ০.০৫ বা ৫%। এটাকে α (আলফা) বলা হয়।

45 p<0.01 30 p<0.05 15 p<0.10 10 p>0.10
  • P-মান ≤ ০.০৫: ফলাফল "পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" - H₀ বাতিল করুন
  • P-মান > ০.০৫: ফলাফল তাৎপর্যপূর্ণ নয় - H₀ বাতিল করার যথেষ্ট প্রমাণ নেই

০.০৫ কোনো জাদু সংখ্যা নয় - এটা একটা রীতি। কিছু ক্ষেত্রে ০.০১ বা ০.১০ ব্যবহার করা হয়। ওষুধের পরীক্ষায় কঠোরতর মানদণ্ড (০.০১) ব্যবহৃত হয় কারণ ভুলের পরিণাম মারাত্মক।

উদাহরণ

একটা গবেষণায় দেখা হচ্ছে নতুন শিক্ষাপদ্ধতি কি SSC ফলাফল উন্নত করে। দুটো স্কুলে পরীক্ষা চালানো হলো - একটায় নতুন পদ্ধতি, অন্যটায় পুরনো।

  • নতুন পদ্ধতির স্কুল: গড় নম্বর ৭২
  • পুরনো পদ্ধতির স্কুল: গড় নম্বর ৬৮
  • P-মান = ০.০৩

P-মান ০.০৩ < ০.০৫, তাই ফলাফল তাৎপর্যপূর্ণ। গবেষক বলবেন: "শূন্য প্রকল্প বাতিল - নতুন পদ্ধতি আসলেই ফলাফল উন্নত করেছে এমন প্রমাণ পাওয়া গেছে।"

P-মান কী বলে না - সবচেয়ে গুরুত্বপূর্ণ অংশ

অনেকে P-মান ভুল বোঝে। পরিষ্কার করি:

  • P-মান H₀ সত্যি হওয়ার সম্ভাব্যতা নয়। P = ০.০৩ মানে "H₀ সত্যি হওয়ার ৩% সম্ভাবনা" নয়। মানে হলো "H₀ সত্যি হলে এই ফলাফল পাওয়ার ৩% সম্ভাবনা।"
  • P-মান প্রভাবের আকার বলে না। P = ০.০০১ মানে বিশাল প্রভাব নয় - শুধু মানে শক্তিশালী প্রমাণ। প্রভাব ক্ষুদ্র কিন্তু নমুনা বিশাল হলেও P-মান খুব ছোট হতে পারে।
  • P > ০.০৫ মানে "প্রভাব নেই" নয়। মানে "প্রভাব আছে বলার যথেষ্ট প্রমাণ নেই।" হয়তো নমুনা ছোট ছিল।
উদাহরণ

ধরুন দুটো গবেষণা:

গবেষণা ক: নতুন সার ফলন বাড়ায় ০.৫ মণ/একর। নমুনা ১০,০০০ জমি। P = ০.০০১।

গবেষণা খ: নতুন সার ফলন বাড়ায় ৫ মণ/একর। নমুনা ২০ জমি। P = ০.০৮।

গবেষণা ক-এর P-মান ছোট, কিন্তু ০.৫ মণ বাড়তি ফলন কি সারের অতিরিক্ত দামের তুলনায় কাজের? গবেষণা খ-এর প্রভাব অনেক বড় (৫ মণ!) কিন্তু ছোট নমুনায় P-মান ০.০৫ পার হয়নি। বড় নমুনায় আবার পরীক্ষা করলে হয়তো তাৎপর্যপূর্ণ হবে।

শুধু P-মান দেখলে ভুল সিদ্ধান্ত নেবেন - প্রভাবের আকারও দেখতে হবে।

P-মান নিয়ে বিতর্ক

সাম্প্রতিক বছরে P-মানের অতিনির্ভরতা নিয়ে বিজ্ঞানী সমাজে তীব্র বিতর্ক হয়েছে। অনেক গবেষক শুধু P ≤ ০.০৫ পেতে ডেটা নিয়ে নানা কৌশল অবলম্বন করেন ("P-hacking")। তাই আধুনিক পরিসংখ্যানে শুধু P-মান না দেখে প্রভাবের আকার, আস্থা ব্যবধান এবং গবেষণার পুনরাবৃত্তি - সবকিছু মিলিয়ে দেখার কথা বলা হয়।

-3 -2 -1 0 1 2 3
মূল বিষয়

P-মান বলে শূন্য প্রকল্প সত্যি হলে আপনার ফলাফল কতটা আশ্চর্যজনক। P ≤ ০.০৫ হলে সাধারণত "তাৎপর্যপূর্ণ" বলা হয়। কিন্তু P-মান প্রভাবের আকার বলে না, H₀ সত্যি হওয়ার সম্ভাব্যতাও নয়। শুধু P-মানের উপর নির্ভর না করে প্রভাবের আকার এবং বাস্তব তাৎপর্যও বিবেচনা করুন।