P-মান: সবচেয়ে বেশি ভুল বোঝা ধারণা
P-মান সম্ভবত পরিসংখ্যানের সবচেয়ে বেশি উচ্চারিত এবং সবচেয়ে বেশি ভুল বোঝা শব্দ। গবেষণাপত্র, সংবাদ, এমনকি আদালতে P-মানের কথা আসে। এটা সঠিকভাবে বোঝা অত্যন্ত জরুরি।
P-মান আসলে কী?
P-মান হলো: যদি শূন্য প্রকল্প সত্যি হয়, তাহলে আপনি যে ফলাফল পেয়েছেন সেটা (বা তার চেয়ে চরম কিছু) পাওয়ার সম্ভাব্যতা কত?
সহজ ভাষায়: "কিছুই ঘটছে না" পৃথিবীতে এই ফলাফল কতটা আশ্চর্যজনক?
ধরুন আপনার বন্ধু দাবি করছে তার একটা মুদ্রা ন্যায্য (হেড আর টেইলের সম্ভাবনা সমান)। আপনি ২০ বার নিক্ষেপ করলেন, ১৬ বার হেড আসলো।
H₀: মুদ্রা ন্যায্য (P(হেড) = ০.৫)
ন্যায্য মুদ্রায় ২০ বারের মধ্যে ১৬ বা তার বেশি হেড আসার সম্ভাব্যতা (P-মান) ≈ ০.০০৬ বা ০.৬%।
মানে ন্যায্য মুদ্রায় এমন হওয়ার সম্ভাবনা হাজারে ৬। এটা এত কম যে আপনি সন্দেহ করবেন - মুদ্রাটা সম্ভবত ন্যায্য নয়।
০.০৫ এর তাৎপর্য
পরিসংখ্যানে সাধারণত একটা সীমারেখা নির্ধারণ করা হয় - "তাৎপর্য স্তর" (significance level), সাধারণত ০.০৫ বা ৫%। এটাকে α (আলফা) বলা হয়।
- P-মান ≤ ০.০৫: ফলাফল "পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" - H₀ বাতিল করুন
- P-মান > ০.০৫: ফলাফল তাৎপর্যপূর্ণ নয় - H₀ বাতিল করার যথেষ্ট প্রমাণ নেই
০.০৫ কোনো জাদু সংখ্যা নয় - এটা একটা রীতি। কিছু ক্ষেত্রে ০.০১ বা ০.১০ ব্যবহার করা হয়। ওষুধের পরীক্ষায় কঠোরতর মানদণ্ড (০.০১) ব্যবহৃত হয় কারণ ভুলের পরিণাম মারাত্মক।
একটা গবেষণায় দেখা হচ্ছে নতুন শিক্ষাপদ্ধতি কি SSC ফলাফল উন্নত করে। দুটো স্কুলে পরীক্ষা চালানো হলো - একটায় নতুন পদ্ধতি, অন্যটায় পুরনো।
- নতুন পদ্ধতির স্কুল: গড় নম্বর ৭২
- পুরনো পদ্ধতির স্কুল: গড় নম্বর ৬৮
- P-মান = ০.০৩
P-মান ০.০৩ < ০.০৫, তাই ফলাফল তাৎপর্যপূর্ণ। গবেষক বলবেন: "শূন্য প্রকল্প বাতিল - নতুন পদ্ধতি আসলেই ফলাফল উন্নত করেছে এমন প্রমাণ পাওয়া গেছে।"
P-মান কী বলে না - সবচেয়ে গুরুত্বপূর্ণ অংশ
অনেকে P-মান ভুল বোঝে। পরিষ্কার করি:
- P-মান H₀ সত্যি হওয়ার সম্ভাব্যতা নয়। P = ০.০৩ মানে "H₀ সত্যি হওয়ার ৩% সম্ভাবনা" নয়। মানে হলো "H₀ সত্যি হলে এই ফলাফল পাওয়ার ৩% সম্ভাবনা।"
- P-মান প্রভাবের আকার বলে না। P = ০.০০১ মানে বিশাল প্রভাব নয় - শুধু মানে শক্তিশালী প্রমাণ। প্রভাব ক্ষুদ্র কিন্তু নমুনা বিশাল হলেও P-মান খুব ছোট হতে পারে।
- P > ০.০৫ মানে "প্রভাব নেই" নয়। মানে "প্রভাব আছে বলার যথেষ্ট প্রমাণ নেই।" হয়তো নমুনা ছোট ছিল।
ধরুন দুটো গবেষণা:
গবেষণা ক: নতুন সার ফলন বাড়ায় ০.৫ মণ/একর। নমুনা ১০,০০০ জমি। P = ০.০০১।
গবেষণা খ: নতুন সার ফলন বাড়ায় ৫ মণ/একর। নমুনা ২০ জমি। P = ০.০৮।
গবেষণা ক-এর P-মান ছোট, কিন্তু ০.৫ মণ বাড়তি ফলন কি সারের অতিরিক্ত দামের তুলনায় কাজের? গবেষণা খ-এর প্রভাব অনেক বড় (৫ মণ!) কিন্তু ছোট নমুনায় P-মান ০.০৫ পার হয়নি। বড় নমুনায় আবার পরীক্ষা করলে হয়তো তাৎপর্যপূর্ণ হবে।
শুধু P-মান দেখলে ভুল সিদ্ধান্ত নেবেন - প্রভাবের আকারও দেখতে হবে।
P-মান নিয়ে বিতর্ক
সাম্প্রতিক বছরে P-মানের অতিনির্ভরতা নিয়ে বিজ্ঞানী সমাজে তীব্র বিতর্ক হয়েছে। অনেক গবেষক শুধু P ≤ ০.০৫ পেতে ডেটা নিয়ে নানা কৌশল অবলম্বন করেন ("P-hacking")। তাই আধুনিক পরিসংখ্যানে শুধু P-মান না দেখে প্রভাবের আকার, আস্থা ব্যবধান এবং গবেষণার পুনরাবৃত্তি - সবকিছু মিলিয়ে দেখার কথা বলা হয়।
P-মান বলে শূন্য প্রকল্প সত্যি হলে আপনার ফলাফল কতটা আশ্চর্যজনক। P ≤ ০.০৫ হলে সাধারণত "তাৎপর্যপূর্ণ" বলা হয়। কিন্তু P-মান প্রভাবের আকার বলে না, H₀ সত্যি হওয়ার সম্ভাব্যতাও নয়। শুধু P-মানের উপর নির্ভর না করে প্রভাবের আকার এবং বাস্তব তাৎপর্যও বিবেচনা করুন।