পরিসংখ্যানগত বনাম ব্যবহারিক তাৎপর্য

কঠিনতা: প্রাথমিক পড়ার সময়: 10 মিনিট

"তাৎপর্যপূর্ণ" আসলে কী বোঝায়?

যখন একজন গবেষক বলেন একটি ফলাফল "পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ," তার মানে পর্যবেক্ষিত প্রভাবটি শুধু দৈবের কারণে ঘটার সম্ভাবনা খুবই কম। বিশেষত, যদি সত্যিই কোনো প্রভাব না থাকত তাহলে এমন ফলাফল দেখার সম্ভাবনা খুব কম, সাধারণত ৫% এর কম।

কিন্তু সমস্যা হলো: পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ মানে গুরুত্বপূর্ণ, অর্থবহ বা কার্যকর নয়। একটি ফলাফল পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হতে পারে অথচ এত ছোট যে বাস্তবে কারো কিছু যায় আসে না।

যখন ক্ষুদ্র প্রভাব চিত্তাকর্ষক দেখায়

কল্পনা করুন একটি কোম্পানি একটি নতুন ওয়েবসাইট লেআউট পরীক্ষা করে এবং দেখে যে ব্যবহারকারীরা সাইটে গড়ে ০.৮ সেকেন্ড বেশি সময় কাটায়। ৫,০০,০০০ দর্শকের নমুনায় এই পার্থক্য ০.০০১ এর p-মান দেয়, যা অত্যন্ত পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ। কিন্তু অতিরিক্ত ০.৮ সেকেন্ড ব্রাউজিং কি ব্যবসার জন্য গুরুত্বপূর্ণ? সম্ভবত না।

47.2 পুরনো লেআউট 48 নতুন লেআউট

এটি ঘটে কারণ পরিসংখ্যানগত তাৎপর্য নমুনার আকারের উপর ব্যাপকভাবে নির্ভর করে। যথেষ্ট বড় নমুনায়, এমনকি ক্ষুদ্রতম পার্থক্যও একটি ছোট p-মান দেবে।

উদাহরণ

একটি ফার্মাসিউটিক্যাল কোম্পানি ৫০,০০০ রোগীর উপর একটি নতুন রক্তচাপের ওষুধ পরীক্ষা করে। ওষুধটি প্লাসিবোর তুলনায় সিস্টোলিক রক্তচাপ ১.২ mmHg কমায় এবং ফলাফল পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ (p = 0.003)। তবে, ডাক্তাররা অন্তত ৫-১০ mmHg হ্রাসকে চিকিৎসাগতভাবে অর্থবহ মনে করেন। ১.২ mmHg হ্রাস কোনো চিকিৎসা সিদ্ধান্ত পরিবর্তন করবে না। ওষুধটি পরিসংখ্যানগতভাবে "কাজ করে," কিন্তু ব্যবহারিকভাবে অকার্যকর।

ব্যবহারিক তাৎপর্য: এটি কি আসলে গুরুত্বপূর্ণ?

ব্যবহারিক তাৎপর্য একটি ভিন্ন প্রশ্ন জিজ্ঞাসা করে: বাস্তব জগতে প্রভাবটি কি যথেষ্ট বড় যে গুরুত্বপূর্ণ? এটি প্রসঙ্গের উপর নির্ভর করে, শুধু গণিতের উপর নয়। জ্বালানি দক্ষতায় ২% উন্নতি একটি এয়ারলাইনের জন্য ব্যবহারিকভাবে তাৎপর্যপূর্ণ হতে পারে যা বছরে কোটি কোটি লিটার পোড়ায়, কিন্তু সপ্তাহে একবার মুদি দোকানে যাওয়া কারো জন্য অর্থহীন।

ওষুধের প্রভাব (mmHg) 0.4 2
চিকিৎসাগতভাবে অর্থবহ 6.1 10.9

উপরের আত্মবিশ্বাস ব্যবধানগুলো লক্ষ্য করুন: ওষুধের প্রভাব এবং এর সম্ভাব্য মানের সম্পূর্ণ পরিসর ডাক্তাররা যা অর্থবহ পরিবর্তন মনে করেন তার অনেক নিচে। প্রভাবটি শূন্য নয় বলে আমরা নিশ্চিত হলেও, এটি এখনও গুরুত্বপূর্ণ হওয়ার জন্য খুব ছোট।

নমুনার আকার কীভাবে বিভ্রান্তি তৈরি করে

ছোট নমুনার বিপরীত সমস্যা আছে। খুব কম অংশগ্রহণকারী থাকলে, একটি গবেষণা একটি বাস্তব এবং গুরুত্বপূর্ণ প্রভাব সনাক্ত করতে ব্যর্থ হতে পারে কেবল নমুনা যথেষ্ট বড় না হওয়ায়। এটাকে কম পরিসংখ্যানগত শক্তি বলে।

এর মানে আপনি উভয় দিকে বিভ্রান্ত হতে পারেন। বড় নমুনা তুচ্ছ প্রভাবকে তাৎপর্যপূর্ণ দেখাতে পারে, এবং ছোট নমুনা গুরুত্বপূর্ণ প্রভাবকে অতাৎপর্যপূর্ণ দেখাতে পারে।

যখন পরিসংখ্যান বিভ্রান্ত করে: বাস্তব-জগতের ফাঁদ

শিরোনামে প্রায়ই প্রভাবের আকার উল্লেখ না করে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ ফলাফল রিপোর্ট করা হয়। নিজেকে রক্ষা করতে, সবসময় জিজ্ঞাসা করুন: প্রভাবটি কত বড়? আপনি বুঝতে পারেন এমন একক-এ প্রকাশ করা হয়েছে কি? এই পার্থক্য কি আপনার আচরণ বা সিদ্ধান্ত পরিবর্তন করবে?

মূল শিক্ষা

পরিসংখ্যানগত তাৎপর্য আপনাকে বলে একটি প্রভাব সম্ভবত বাস্তব কিনা। ব্যবহারিক তাৎপর্য আপনাকে বলে এটি আসলে গুরুত্বপূর্ণ কিনা। একটি ফলাফল পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ কিন্তু চিন্তা করার মতো ছোট হতে পারে, বিশেষত বড় নমুনায়। সবসময় প্রভাবের আকার দেখুন, শুধু p-মান নয়, এবং নিজেকে জিজ্ঞাসা করুন পার্থক্যটি কোনো বাস্তব-জগতের সিদ্ধান্ত পরিবর্তন করবে কিনা।