কাই-বর্গ পরীক্ষা

কঠিনতা: মধ্যবর্তী পড়ার সময়: 12 মিনিট

যখন ডেটা সংখ্যা নয়, শ্রেণি

t-পরীক্ষা গড়ের তুলনা করে - কিন্তু যদি ডেটা সংখ্যা না হয়ে শ্রেণি হয়? যেমন পুরুষ/নারী, ঢাকা/চট্টগ্রাম/রাজশাহী, পাস/ফেল? তখন কাই-বর্গ (chi-square বা χ²) পরীক্ষা ব্যবহার করবেন।

30 A 25 B 28 C 17 D

কাই-বর্গ পরীক্ষা দেখে: পর্যবেক্ষিত গণনা (আমরা যা দেখেছি) আর প্রত্যাশিত গণনা (কিছুই না ঘটলে যা দেখার কথা) এর মধ্যে পার্থক্য কি দৈবচয়নে হতে পারে, নাকি আসলে কিছু ঘটছে?

কাই-বর্গ পরীক্ষার দুই ধরন

১. উপযুক্ততা পরীক্ষা (Goodness of Fit)

একটা শ্রেণি চলকের বিন্যাস কি প্রত্যাশিত বিন্যাসের সাথে মেলে?

উদাহরণ

একটা ছক্কা ন্যায্য কি না পরীক্ষা করতে চান। ৬০ বার গড়ালে প্রত্যাশিত: প্রতিটা সংখ্যা ১০ বার। আপনি পেলেন:

  • ১ → ৮ বার, ২ → ১২ বার, ৩ → ৯ বার, ৪ → ১১ বার, ৫ → ৭ বার, ৬ → ১৩ বার

এই পার্থক্য কি স্বাভাবিক ওঠানামা, নাকি ছক্কা ভারসাম্যহীন? কাই-বর্গ পরীক্ষা উত্তর দেবে।

χ² = Σ [(পর্যবেক্ষিত - প্রত্যাশিত)² ÷ প্রত্যাশিত]

= (৮-১০)²/১০ + (১২-১০)²/১০ + (৯-১০)²/১০ + (১১-১০)²/১০ + (৭-১০)²/১০ + (১৩-১০)²/১০

= ০.৪ + ০.৪ + ০.১ + ০.১ + ০.৯ + ০.৯ = ২.৮

এই χ² মান ছোট - P-মান ০.০৫ এর অনেক বেশি হবে। ছক্কা ন্যায্য মনে হচ্ছে।

২. স্বাধীনতা পরীক্ষা (Test of Independence)

দুটো শ্রেণি চলক কি একে অপরের সাথে সম্পর্কিত?

উদাহরণ

একটা জরিপে ৪০০ জন SSC পরীক্ষার্থীকে জিজ্ঞেস করা হলো: কোচিং করেছেন কি না, এবং A+ পেয়েছেন কি না।

A+ পেয়েছেA+ পায়নিমোট
কোচিং করেছে১২০৮০২০০
কোচিং করেনি৮০১২০২০০
মোট২০০২০০৪০০

H₀: কোচিং করা আর A+ পাওয়া স্বাধীন - কোনো সম্পর্ক নেই।

যদি সত্যিই স্বাধীন হতো, তাহলে প্রত্যাশিত: ৪০০ জনের ৫০% A+ (২০০), ৫০% কোচিং (২০০)। প্রতিটা ঘরে ১০০ জন থাকার কথা।

পর্যবেক্ষিত (১২০) আর প্রত্যাশিত (১০০) এর পার্থক্য কি তাৎপর্যপূর্ণ? কাই-বর্গ পরীক্ষা বলবে।

χ² = (১২০-১০০)²/১০০ + (৮০-১০০)²/১০০ + (৮০-১০০)²/১০০ + (১২০-১০০)²/১০০ = ৪+৪+৪+৪ = ১৬

χ² = ১৬ বেশ বড়! P-মান অত্যন্ত ছোট হবে। মানে কোচিং আর A+ পাওয়ার মধ্যে সম্পর্ক আছে বলে প্রমাণ পাওয়া গেছে।

কিন্তু সাবধান: সম্পর্ক মানে কার্যকারণ নয়! হয়তো যারা কোচিং করে তারা আগে থেকেই বেশি অনুপ্রাণিত।

কাই-বর্গ পরীক্ষার শর্ত

  • ডেটা শ্রেণিভিত্তিক হতে হবে: সংখ্যাসূচক ডেটায় t-পরীক্ষা ব্যবহার করুন।
  • প্রতিটা ঘরে প্রত্যাশিত গণনা কমপক্ষে ৫: খুব ছোট সংখ্যায় কাই-বর্গ নির্ভুল নয়।
  • পর্যবেক্ষণ স্বাধীন: প্রতিটা ব্যক্তি/বস্তু একবারই গোনা হয়।

কোথায় ব্যবহার হয়?

  • বাজার গবেষণা: পণ্যের পছন্দ কি বয়সের সাথে সম্পর্কিত?
  • জনস্বাস্থ্য: টিকা নেওয়া কি অসুস্থতার হার কমানোর সাথে সম্পর্কিত?
  • শিক্ষা: গ্রামীণ/শহুরে ছাত্রদের পাসের হারে কি পার্থক্য আছে?
  • সমাজবিজ্ঞান: লিঙ্গ কি পেশা পছন্দের সাথে সম্পর্কিত?
মূল বিষয়

কাই-বর্গ পরীক্ষা শ্রেণিভিত্তিক ডেটার জন্য - পর্যবেক্ষিত আর প্রত্যাশিত গণনার পার্থক্য দৈবচয়নে হতে পারে কি না দেখে। উপযুক্ততা পরীক্ষা একটা চলকের বিন্যাস যাচাই করে, স্বাধীনতা পরীক্ষা দুটো চলকের মধ্যে সম্পর্ক খোঁজে। এটা গড়ের তুলনা করে না - শ্রেণি গোনায়।

30 পর্যবে A 25 প্রত্যা A 15 পর্যবে B 25 প্রত্যা B 35 পর্যবে C 25 প্রত্যা C 20 পর্যবে D 25 প্রত্যা D