সবাই এই ভুলগুলো করে
পরিসংখ্যান নিয়ে কাজ করতে গেলে কিছু ভুল বারবার হয় - শিক্ষার্থী, সাংবাদিক, এমনকি গবেষকদেরও। এই ভুলগুলো চিনতে পারলে আপনি নিজে এড়াতে পারবেন এবং অন্যদের ভুলও ধরতে পারবেন।
ভুল ১: সম্পর্ককে কার্যকারণ মনে করা
সবচেয়ে সাধারণ এবং সবচেয়ে বিপজ্জনক ভুল। দুটো জিনিস একসাথে বদলালেই একটা অন্যটার কারণ নয়।
"গবেষণায় দেখা গেছে যারা সকালে নাস্তা করে তাদের ওজন কম।" শিরোনাম: "সকালের নাস্তা ওজন কমায়!" - কিন্তু হয়তো সকালে নাস্তা করা মানুষ স্বাস্থ্যসচেতন, ব্যায়ামও করে, জাঙ্কফুড কম খায়। নাস্তা নয়, সামগ্রিক জীবনধারাই ওজন কমাচ্ছে।
ভুল ২: ছোট নমুনা থেকে বড় সিদ্ধান্ত
"আমার পরিচিত ৩ জন এই ওষুধ খেয়ে সুস্থ হয়েছে, তাই ওষুধটা কাজ করে!" - ৩ জন কোনো প্রমাণ না। দৈবচয়নে ৩ জনের সুস্থ হওয়া স্বাভাবিক।
ঢাকার ৫টা দোকানে চালের দাম দেখে "সারা দেশে চালের দাম বেড়েছে" বলা ভুল। ঢাকার ৫টা দোকান ৬৪ জেলার হাজার হাজার দোকানের প্রতিনিধি নয়।
ভুল ৩: পরম আর আপেক্ষিক সংখ্যা মেশানো
"নতুন ওষুধ হার্ট অ্যাটাকের ঝুঁকি ৫০% কমায়!" - চমৎকার শোনাচ্ছে। কিন্তু যদি আগে ১০০০ জনে ২ জনের হতো এবং এখন ১ জনের হয়? ২ থেকে ১ = ৫০% কম (আপেক্ষিক)। কিন্তু পরম কমানো মাত্র ০.১% (১০০০ জনে ১ জন কম)। ওষুধের পার্শ্বপ্রতিক্রিয়া বিবেচনা করলে হয়তো এত সামান্য সুবিধা কাজের না।
ভুল ৪: চেরি-পিকিং
শুধু নিজের দাবি সমর্থনকারী তথ্য দেখানো, বিপরীত তথ্য উপেক্ষা করা।
একটা কোম্পানি বলছে "আমাদের পণ্যের বিক্রি ২০১৯ থেকে ২০২১-এ ২০০% বেড়েছে!" - চমৎকার! কিন্তু ২০১৮ থেকে ২০১৯-এ বিক্রি ৬০% কমেছিল (কোভিড)। ২০১৭-এর তুলনায় মাত্র ২০% বেড়েছে। তারা শুরুর বছর বেছে নিয়ে বড় সংখ্যা দেখাচ্ছে।
ভুল ৫: জুয়াড়ির ভ্রান্তি
মনে করা যে অতীতের দৈব ঘটনা ভবিষ্যতকে প্রভাবিত করে।
"পরপর ৫ বার হেড এসেছে, এবার নিশ্চয়ই টেইল আসবে!" - না। মুদ্রার কোনো স্মৃতি নেই। প্রতিবার ৫০/৫০। ১০০ বার নিক্ষেপে হয়তো সমান হবে, কিন্তু পরবর্তী নিক্ষেপে আগেরগুলো কোনো প্রভাব ফেলে না।
ভুল ৬: গড়ের উপর অতিনির্ভরতা
শুধু গড় দেখে ছড়ানো উপেক্ষা করা।
একটা পুকুরের গড় গভীরতা ৩ ফুট। তাই সাঁতার না জানা মানুষ নিরাপদে পার হতে পারবে? না! পুকুরের মাঝখানে গভীরতা ১০ ফুট হতে পারে। গড় দিয়ে নির্দিষ্ট জায়গার কথা বলা যায় না।
ভুল ৭: P-মানের ভুল ব্যাখ্যা
- P = ০.০৩ মানে "৩% সম্ভাবনা H₀ সত্যি" - ভুল!
- P > ০.০৫ মানে "কোনো প্রভাব নেই" - ভুল!
- P = ০.০৪৯ "তাৎপর্যপূর্ণ" কিন্তু P = ০.০৫১ "তাৎপর্যপূর্ণ নয়" - এত ছোট পার্থক্যে সিদ্ধান্ত বদলানো যুক্তিসঙ্গত নয়।
ভুল ৮: ভিত্তি হারের উপেক্ষা
"৯৯% নির্ভুল পরীক্ষা পজিটিভ এসেছে!" - কিন্তু রোগ যদি ১০,০০০ জনে ১ জনের হয়, তাহলে পজিটিভ ফলাফল পেলেও আসলে রোগ থাকার সম্ভাবনা মাত্র ১% (বেইজের উপপাদ্য)। ভিত্তি হার (রোগ কতটা সাধারণ) না জানলে পরীক্ষার ফলাফল সঠিকভাবে ব্যাখ্যা করা যায় না।
সবচেয়ে সাধারণ ভুলগুলো হলো: সম্পর্ককে কার্যকারণ ভাবা, ছোট নমুনা থেকে বড় সিদ্ধান্ত, আপেক্ষিক আর পরম সংখ্যা মেশানো, চেরি-পিকিং, জুয়াড়ির ভ্রান্তি, শুধু গড় দেখা, P-মানের ভুল ব্যাখ্যা, এবং ভিত্তি হার উপেক্ষা করা। এই ভুলগুলো চিনতে পারলে আপনি পরিসংখ্যান আরো সঠিকভাবে বুঝবেন এবং ব্যবহার করবেন।