দুটো দলের তুলনা
ধরুন আপনি জানতে চান নতুন শিক্ষাপদ্ধতি কি পুরনোটার চেয়ে ভালো। দুটো ক্লাসে আলাদা পদ্ধতি ব্যবহার করলেন, পরীক্ষার পর নম্বর তুলনা করবেন। এক ক্লাসের গড় ৭২, অন্যটার ৬৮। পার্থক্য ৪ নম্বর - কিন্তু এটা কি আসলে পদ্ধতির কারণে, নাকি দৈবচয়নে এমন হতে পারতো?
t-পরীক্ষা ঠিক এই প্রশ্নের উত্তর দেয়: দুটো দলের গড়ের পার্থক্য কি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ?
t-পরীক্ষার মূল ধারণা
t-পরীক্ষা একটা অনুপাত হিসাব করে:
t = গড়ের পার্থক্য ÷ পার্থক্যের আদর্শ ত্রুটি
সহজ ভাষায়: সংকেত (পার্থক্য) কি গোলমালের (র্যান্ডম ওঠানামা) চেয়ে বড়? t-মান বড় হলে পার্থক্য সত্যিকারের হওয়ার সম্ভাবনা বেশি।
তিন ধরনের t-পরীক্ষা
১. এক-নমুনা t-পরীক্ষা
একটা নমুনার গড় কি একটা নির্দিষ্ট মানের চেয়ে আলাদা?
একটা বিস্কুট কোম্পানি দাবি করে তাদের প্যাকেটে ২০০ গ্রাম বিস্কুট থাকে। ভোক্তা অধিকার সংস্থা ৩০টা প্যাকেট কিনে ওজন করলো - গড় ১৯৫ গ্রাম, আদর্শ বিচ্যুতি ৮ গ্রাম।
H₀: গড় ওজন = ২০০ গ্রাম (কোম্পানির দাবি সঠিক)
H₁: গড় ওজন ≠ ২০০ গ্রাম
t = (১৯৫ - ২০০) ÷ (৮ ÷ √৩০) = -৫ ÷ ১.৪৬ ≈ -৩.৪২
এই t-মান থেকে P-মান ≈ ০.০০২ - অনেক ছোট! মানে কোম্পানির দাবি সন্দেহজনক, গড় ওজন ২০০ গ্রামের চেয়ে কম।
২. স্বাধীন দুই-নমুনা t-পরীক্ষা
দুটো আলাদা দলের গড় কি আলাদা?
দুটো ধানের জাতের ফলন তুলনা করা হচ্ছে। ২০টা জমিতে জাত ক, ২০টায় জাত খ:
- জাত ক: গড় ফলন ৪৫ মণ/একর, আদর্শ বিচ্যুতি ৫
- জাত খ: গড় ফলন ৪২ মণ/একর, আদর্শ বিচ্যুতি ৬
H₀: দুই জাতের গড় ফলন সমান
H₁: দুই জাতের গড় ফলন আলাদা
t-পরীক্ষা হিসাব করে P-মান দেবে - যদি ০.০৫-এর কম হয়, তাহলে বলা যাবে জাত ক আসলেই বেশি ফলন দেয়।
৩. জোড়া t-পরীক্ষা (Paired t-test)
একই দলকে দুবার মাপলে - আগে ও পরে।
১৫ জন ডায়াবেটিস রোগীকে ৩ মাস নতুন ওষুধ দেওয়া হলো। প্রত্যেকের রক্তে শর্করার মাত্রা ওষুধ শুরুর আগে ও পরে মাপা হলো।
- আগে: গড় ৯.২ mmol/L
- পরে: গড় ৭.৮ mmol/L
- প্রতিটা রোগীর পার্থক্য হিসাব করে জোড়া t-পরীক্ষা চালানো হবে
এখানে প্রতিটা রোগী নিজের নিয়ন্ত্রণ গ্রুপ - আগের ও পরের তুলনা, তাই জোড়া t-পরীক্ষা সবচেয়ে উপযুক্ত।
t-পরীক্ষার শর্ত
t-পরীক্ষা সঠিক ফলাফল দিতে কিছু শর্ত পূরণ হওয়া দরকার:
- ডেটা সংখ্যাসূচক হতে হবে: গড় বের করার মতো ডেটা।
- নমুনা দৈবভাবে নেওয়া: পক্ষপাতহীন নমুনা।
- ডেটা প্রায় স্বাভাবিক বিন্যাসে: ছোট নমুনায় (< ৩০) এটা গুরুত্বপূর্ণ। বড় নমুনায় CLT সামলে দেয়।
- স্বাধীন দুই-নমুনায়: দুই দলের ভেদাঙ্ক প্রায় সমান হওয়া ভালো (যদিও বিকল্প আছে)।
t-পরীক্ষা বনাম z-পরীক্ষা
z-পরীক্ষা ব্যবহার হয় যখন জনসংখ্যার আদর্শ বিচ্যুতি জানা এবং নমুনা বড়। বাস্তবে জনসংখ্যার আদর্শ বিচ্যুতি প্রায়ই জানা থাকে না - তাই t-পরীক্ষাই বেশি ব্যবহৃত। নমুনা বড় হলে দুটো প্রায় একই ফলাফল দেয়।
t-পরীক্ষা দুটো গড়ের পার্থক্য তাৎপর্যপূর্ণ কি না বলে। তিন ধরন: এক-নমুনা (একটা মানের সাথে তুলনা), স্বাধীন দুই-নমুনা (দুটো আলাদা দল), এবং জোড়া (আগে-পরে)। t-পরীক্ষা একটা t-মান দেয় যা থেকে P-মান পাওয়া যায় এবং সিদ্ধান্ত নেওয়া হয়। এটা পরিসংখ্যানে সবচেয়ে বেশি ব্যবহৃত পরীক্ষাগুলোর একটা।