t-পরীক্ষা

কঠিনতা: মধ্যবর্তী পড়ার সময়: 15 মিনিট

দুটো দলের তুলনা

ধরুন আপনি জানতে চান নতুন শিক্ষাপদ্ধতি কি পুরনোটার চেয়ে ভালো। দুটো ক্লাসে আলাদা পদ্ধতি ব্যবহার করলেন, পরীক্ষার পর নম্বর তুলনা করবেন। এক ক্লাসের গড় ৭২, অন্যটার ৬৮। পার্থক্য ৪ নম্বর - কিন্তু এটা কি আসলে পদ্ধতির কারণে, নাকি দৈবচয়নে এমন হতে পারতো?

পার্থক্য 2.1 5.2 8.3 0

t-পরীক্ষা ঠিক এই প্রশ্নের উত্তর দেয়: দুটো দলের গড়ের পার্থক্য কি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ?

t-পরীক্ষার মূল ধারণা

t-পরীক্ষা একটা অনুপাত হিসাব করে:

t = গড়ের পার্থক্য ÷ পার্থক্যের আদর্শ ত্রুটি

সহজ ভাষায়: সংকেত (পার্থক্য) কি গোলমালের (র‍্যান্ডম ওঠানামা) চেয়ে বড়? t-মান বড় হলে পার্থক্য সত্যিকারের হওয়ার সম্ভাবনা বেশি।

তিন ধরনের t-পরীক্ষা

১. এক-নমুনা t-পরীক্ষা

একটা নমুনার গড় কি একটা নির্দিষ্ট মানের চেয়ে আলাদা?

উদাহরণ

একটা বিস্কুট কোম্পানি দাবি করে তাদের প্যাকেটে ২০০ গ্রাম বিস্কুট থাকে। ভোক্তা অধিকার সংস্থা ৩০টা প্যাকেট কিনে ওজন করলো - গড় ১৯৫ গ্রাম, আদর্শ বিচ্যুতি ৮ গ্রাম।

H₀: গড় ওজন = ২০০ গ্রাম (কোম্পানির দাবি সঠিক)

H₁: গড় ওজন ≠ ২০০ গ্রাম

t = (১৯৫ - ২০০) ÷ (৮ ÷ √৩০) = -৫ ÷ ১.৪৬ ≈ -৩.৪২

এই t-মান থেকে P-মান ≈ ০.০০২ - অনেক ছোট! মানে কোম্পানির দাবি সন্দেহজনক, গড় ওজন ২০০ গ্রামের চেয়ে কম।

২. স্বাধীন দুই-নমুনা t-পরীক্ষা

দুটো আলাদা দলের গড় কি আলাদা?

উদাহরণ

দুটো ধানের জাতের ফলন তুলনা করা হচ্ছে। ২০টা জমিতে জাত ক, ২০টায় জাত খ:

  • জাত ক: গড় ফলন ৪৫ মণ/একর, আদর্শ বিচ্যুতি ৫
  • জাত খ: গড় ফলন ৪২ মণ/একর, আদর্শ বিচ্যুতি ৬

H₀: দুই জাতের গড় ফলন সমান

H₁: দুই জাতের গড় ফলন আলাদা

t-পরীক্ষা হিসাব করে P-মান দেবে - যদি ০.০৫-এর কম হয়, তাহলে বলা যাবে জাত ক আসলেই বেশি ফলন দেয়।

৩. জোড়া t-পরীক্ষা (Paired t-test)

একই দলকে দুবার মাপলে - আগে ও পরে।

উদাহরণ

১৫ জন ডায়াবেটিস রোগীকে ৩ মাস নতুন ওষুধ দেওয়া হলো। প্রত্যেকের রক্তে শর্করার মাত্রা ওষুধ শুরুর আগে ও পরে মাপা হলো।

  • আগে: গড় ৯.২ mmol/L
  • পরে: গড় ৭.৮ mmol/L
  • প্রতিটা রোগীর পার্থক্য হিসাব করে জোড়া t-পরীক্ষা চালানো হবে

এখানে প্রতিটা রোগী নিজের নিয়ন্ত্রণ গ্রুপ - আগের ও পরের তুলনা, তাই জোড়া t-পরীক্ষা সবচেয়ে উপযুক্ত।

t-পরীক্ষার শর্ত

t-পরীক্ষা সঠিক ফলাফল দিতে কিছু শর্ত পূরণ হওয়া দরকার:

  • ডেটা সংখ্যাসূচক হতে হবে: গড় বের করার মতো ডেটা।
  • নমুনা দৈবভাবে নেওয়া: পক্ষপাতহীন নমুনা।
  • ডেটা প্রায় স্বাভাবিক বিন্যাসে: ছোট নমুনায় (< ৩০) এটা গুরুত্বপূর্ণ। বড় নমুনায় CLT সামলে দেয়।
  • স্বাধীন দুই-নমুনায়: দুই দলের ভেদাঙ্ক প্রায় সমান হওয়া ভালো (যদিও বিকল্প আছে)।

t-পরীক্ষা বনাম z-পরীক্ষা

z-পরীক্ষা ব্যবহার হয় যখন জনসংখ্যার আদর্শ বিচ্যুতি জানা এবং নমুনা বড়। বাস্তবে জনসংখ্যার আদর্শ বিচ্যুতি প্রায়ই জানা থাকে না - তাই t-পরীক্ষাই বেশি ব্যবহৃত। নমুনা বড় হলে দুটো প্রায় একই ফলাফল দেয়।

-3 -2 -1 0 1 2 3
মূল বিষয়

t-পরীক্ষা দুটো গড়ের পার্থক্য তাৎপর্যপূর্ণ কি না বলে। তিন ধরন: এক-নমুনা (একটা মানের সাথে তুলনা), স্বাধীন দুই-নমুনা (দুটো আলাদা দল), এবং জোড়া (আগে-পরে)। t-পরীক্ষা একটা t-মান দেয় যা থেকে P-মান পাওয়া যায় এবং সিদ্ধান্ত নেওয়া হয়। এটা পরিসংখ্যানে সবচেয়ে বেশি ব্যবহৃত পরীক্ষাগুলোর একটা।