যখন ডেটা সংখ্যা নয়, শ্রেণি
t-পরীক্ষা গড়ের তুলনা করে - কিন্তু যদি ডেটা সংখ্যা না হয়ে শ্রেণি হয়? যেমন পুরুষ/নারী, ঢাকা/চট্টগ্রাম/রাজশাহী, পাস/ফেল? তখন কাই-বর্গ (chi-square বা χ²) পরীক্ষা ব্যবহার করবেন।
কাই-বর্গ পরীক্ষা দেখে: পর্যবেক্ষিত গণনা (আমরা যা দেখেছি) আর প্রত্যাশিত গণনা (কিছুই না ঘটলে যা দেখার কথা) এর মধ্যে পার্থক্য কি দৈবচয়নে হতে পারে, নাকি আসলে কিছু ঘটছে?
কাই-বর্গ পরীক্ষার দুই ধরন
১. উপযুক্ততা পরীক্ষা (Goodness of Fit)
একটা শ্রেণি চলকের বিন্যাস কি প্রত্যাশিত বিন্যাসের সাথে মেলে?
একটা ছক্কা ন্যায্য কি না পরীক্ষা করতে চান। ৬০ বার গড়ালে প্রত্যাশিত: প্রতিটা সংখ্যা ১০ বার। আপনি পেলেন:
- ১ → ৮ বার, ২ → ১২ বার, ৩ → ৯ বার, ৪ → ১১ বার, ৫ → ৭ বার, ৬ → ১৩ বার
এই পার্থক্য কি স্বাভাবিক ওঠানামা, নাকি ছক্কা ভারসাম্যহীন? কাই-বর্গ পরীক্ষা উত্তর দেবে।
χ² = Σ [(পর্যবেক্ষিত - প্রত্যাশিত)² ÷ প্রত্যাশিত]
= (৮-১০)²/১০ + (১২-১০)²/১০ + (৯-১০)²/১০ + (১১-১০)²/১০ + (৭-১০)²/১০ + (১৩-১০)²/১০
= ০.৪ + ০.৪ + ০.১ + ০.১ + ০.৯ + ০.৯ = ২.৮
এই χ² মান ছোট - P-মান ০.০৫ এর অনেক বেশি হবে। ছক্কা ন্যায্য মনে হচ্ছে।
২. স্বাধীনতা পরীক্ষা (Test of Independence)
দুটো শ্রেণি চলক কি একে অপরের সাথে সম্পর্কিত?
একটা জরিপে ৪০০ জন SSC পরীক্ষার্থীকে জিজ্ঞেস করা হলো: কোচিং করেছেন কি না, এবং A+ পেয়েছেন কি না।
| A+ পেয়েছে | A+ পায়নি | মোট | |
| কোচিং করেছে | ১২০ | ৮০ | ২০০ |
| কোচিং করেনি | ৮০ | ১২০ | ২০০ |
| মোট | ২০০ | ২০০ | ৪০০ |
H₀: কোচিং করা আর A+ পাওয়া স্বাধীন - কোনো সম্পর্ক নেই।
যদি সত্যিই স্বাধীন হতো, তাহলে প্রত্যাশিত: ৪০০ জনের ৫০% A+ (২০০), ৫০% কোচিং (২০০)। প্রতিটা ঘরে ১০০ জন থাকার কথা।
পর্যবেক্ষিত (১২০) আর প্রত্যাশিত (১০০) এর পার্থক্য কি তাৎপর্যপূর্ণ? কাই-বর্গ পরীক্ষা বলবে।
χ² = (১২০-১০০)²/১০০ + (৮০-১০০)²/১০০ + (৮০-১০০)²/১০০ + (১২০-১০০)²/১০০ = ৪+৪+৪+৪ = ১৬
χ² = ১৬ বেশ বড়! P-মান অত্যন্ত ছোট হবে। মানে কোচিং আর A+ পাওয়ার মধ্যে সম্পর্ক আছে বলে প্রমাণ পাওয়া গেছে।
কিন্তু সাবধান: সম্পর্ক মানে কার্যকারণ নয়! হয়তো যারা কোচিং করে তারা আগে থেকেই বেশি অনুপ্রাণিত।
কাই-বর্গ পরীক্ষার শর্ত
- ডেটা শ্রেণিভিত্তিক হতে হবে: সংখ্যাসূচক ডেটায় t-পরীক্ষা ব্যবহার করুন।
- প্রতিটা ঘরে প্রত্যাশিত গণনা কমপক্ষে ৫: খুব ছোট সংখ্যায় কাই-বর্গ নির্ভুল নয়।
- পর্যবেক্ষণ স্বাধীন: প্রতিটা ব্যক্তি/বস্তু একবারই গোনা হয়।
কোথায় ব্যবহার হয়?
- বাজার গবেষণা: পণ্যের পছন্দ কি বয়সের সাথে সম্পর্কিত?
- জনস্বাস্থ্য: টিকা নেওয়া কি অসুস্থতার হার কমানোর সাথে সম্পর্কিত?
- শিক্ষা: গ্রামীণ/শহুরে ছাত্রদের পাসের হারে কি পার্থক্য আছে?
- সমাজবিজ্ঞান: লিঙ্গ কি পেশা পছন্দের সাথে সম্পর্কিত?
কাই-বর্গ পরীক্ষা শ্রেণিভিত্তিক ডেটার জন্য - পর্যবেক্ষিত আর প্রত্যাশিত গণনার পার্থক্য দৈবচয়নে হতে পারে কি না দেখে। উপযুক্ততা পরীক্ষা একটা চলকের বিন্যাস যাচাই করে, স্বাধীনতা পরীক্ষা দুটো চলকের মধ্যে সম্পর্ক খোঁজে। এটা গড়ের তুলনা করে না - শ্রেণি গোনায়।