দুটি গোষ্ঠীর বাইরে
t-পরীক্ষা দুটি গোষ্ঠীর তুলনা করার জন্য একটি নির্ভরযোগ্য হাতিয়ার। কিন্তু যখন আপনার তিন, চার বা দশটি গোষ্ঠী থাকে তখন কী হবে? ধরুন একটি কোম্পানি তিনটি ভিন্ন ওয়েবসাইট ডিজাইন পরীক্ষা করে এবং প্রতিটির জন্য রূপান্তর হার পরিমাপ করে। অথবা একজন কৃষক চার ধরনের সার চেষ্টা করে এবং ফসলের ফলন পরিমাপ করে। আপনি প্রতিটি সম্ভাব্য জোড়ায় t-পরীক্ষা চালাতে পারেন না -- এই পদ্ধতি গুরুতর সমস্যা তৈরি করে।
আপনি যখন অনেক t-পরীক্ষা চালান, প্রতিটিতে একটি ছোট মিথ্যা ধনাত্মক সম্ভাবনা থাকে (সাধারণত ৫%)। যথেষ্ট পরীক্ষা চালালে, অন্তত একটি পরীক্ষা ভুল ফলাফল দেওয়ার সম্ভাবনা দ্রুত বাড়ে। তিনটি গোষ্ঠীতে তিনটি জোড়া তুলনা লাগবে। পাঁচটি গোষ্ঠীতে দশটি। দশটি গোষ্ঠীতে পঁয়তাল্লিশটি। এই সমস্যাকে বলা হয় বহু তুলনা স্ফীতি।
ANOVA -- ভ্যারিয়েন্সের বিশ্লেষণ-এর সংক্ষিপ্ত রূপ -- একটি একক পরীক্ষায় সমস্ত গোষ্ঠী একসাথে পরীক্ষা করে এই সমস্যা সমাধান করে। "গোষ্ঠী A কি গোষ্ঠী B থেকে ভিন্ন?" জিজ্ঞাসা করার বদলে এটি একটি বৃহত্তর প্রশ্ন জিজ্ঞাসা করে: "এই সমস্ত গোষ্ঠীর মধ্যে কোনো উল্লেখযোগ্য পার্থক্য আছে কি?" উত্তর হ্যাঁ হলে, আপনি তারপর গভীরে গিয়ে খুঁজে বের করতে পারেন কোন নির্দিষ্ট গোষ্ঠী ভিন্ন।
মূল ধারণা: দুই ধরনের ভ্যারিয়েন্স
নাম সত্ত্বেও, ANOVA মূলত গড় তুলনা করে, ভ্যারিয়েন্স নয়। তবে এটি ভ্যারিয়েন্সকে হাতিয়ার হিসাবে ব্যবহার করে। যুক্তিটি এরকম: আপনি যদি তথ্যকে গোষ্ঠীতে ভাগ করেন, তথ্যের মোট পরিবর্তনশীলতা দুটি উৎস থেকে আসে।
গোষ্ঠী-মধ্য ভ্যারিয়েন্স পরিমাপ করে গোষ্ঠী গড়গুলো একে অপর থেকে কতটা ভিন্ন। গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্স পরিমাপ করে প্রতিটি গোষ্ঠীর ভেতরে পৃথক মানগুলো কতটা পরিবর্তিত হয়।
যদি গোষ্ঠী-মধ্য ভ্যারিয়েন্স গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের তুলনায় বড় হয়, তাহলে মনে হয় গোষ্ঠীগুলো সত্যিই ভিন্ন। যদি গোষ্ঠী-মধ্য ভ্যারিয়েন্স গোষ্ঠীর ভেতরের গোলমালের তুলনায় ছোট হয়, তাহলে গড়ের পার্থক্য সহজেই দৈবের কারণে হতে পারে।
F-পরিসংখ্যান
ANOVA একটি সংখ্যা তৈরি করে যাকে F-পরিসংখ্যান বলে (পরিসংখ্যানবিদ রোনাল্ড ফিশারের নামে)। এটি কেবল গোষ্ঠী-মধ্য ভ্যারিয়েন্স এবং গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের অনুপাত।
১ এর কাছাকাছি F-পরিসংখ্যান মানে গোষ্ঠীগুলো একই রকম দেখায়। ১ এর চেয়ে অনেক বড় F-পরিসংখ্যান ইঙ্গিত করে যে অন্তত একটি গোষ্ঠী সত্যিই ভিন্ন।
উপরের চার্টে, গোষ্ঠী-মধ্য ভ্যারিয়েন্স গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের দ্বিগুণেরও বেশি, যা ১ এর অনেক উপরে F-পরিসংখ্যান তৈরি করে। এটি সম্ভবত একটি ছোট p-মান দেবে, যা গোষ্ঠীগুলোর মধ্যে একটি প্রকৃত পার্থক্য নির্দেশ করে।
একটি স্কুল জেলা ৯০ জন ছাত্রের (প্রতি প্রোগ্রামে ৩০) উপর তিনটি পড়ার প্রোগ্রাম পরীক্ষা করে। গড় নম্বর হলো ৭২, ৭৮ এবং ৮১। ANOVA গণনা করে যে গোষ্ঠী-মধ্য ভ্যারিয়েন্স গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের ৪.৬ গুণ। এই ৪.৬ এর F-পরিসংখ্যান ০.০১৩ এর p-মান দেয় -- ০.০৫ সীমার নিচে -- তাই জেলা সিদ্ধান্তে আসে যে অন্তত একটি প্রোগ্রাম অর্থপূর্ণভাবে ভিন্ন ফলাফল দেয়।
ANOVA-এর অনুমান
t-পরীক্ষার মতো, ANOVA-তেও কিছু অনুমান আছে যা ফলাফলে বিশ্বাস করার আগে পরীক্ষা করা উচিত:
- স্বাধীনতা: গোষ্ঠীর মধ্যে এবং গোষ্ঠী জুড়ে পর্যবেক্ষণ অবশ্যই স্বাধীন হতে হবে।
- স্বাভাবিকতা: প্রতিটি গোষ্ঠীর তথ্য প্রায় স্বাভাবিকভাবে বন্টিত হওয়া উচিত। প্রতি গোষ্ঠীতে ৩০ বা তার বেশি পর্যবেক্ষণ থাকলে এটি কম গুরুত্বপূর্ণ হয়ে যায়।
- সমান ভ্যারিয়েন্স (সমসত্ত্বতা): প্রতিটি গোষ্ঠীর মধ্যে তথ্যের বিস্তার মোটামুটি একই রকম হওয়া উচিত। লেভেনের পরীক্ষা এই অনুমান পরীক্ষা করতে পারে, এবং ওয়েলচের ANOVA অসমান ভ্যারিয়েন্সের জন্য একটি শক্তিশালী বিকল্প।
ANOVA-এর পর: পোস্ট-হক পরীক্ষা
ANOVA আপনাকে বলে যে অন্তত একটি গোষ্ঠী ভিন্ন, কিন্তু কোন গোষ্ঠী কোনটি থেকে ভিন্ন তা বলে না। জানতে হলে, আপনি পোস্ট-হক পরীক্ষা চালান -- ফলো-আপ তুলনা যা বহু তুলনা সমস্যা নিয়ন্ত্রণ করে।
সবচেয়ে সাধারণ পোস্ট-হক পরীক্ষা হলো টুকির HSD (সৎভাবে উল্লেখযোগ্য পার্থক্য)। এটি প্রতিটি জোড়া গোষ্ঠীর তুলনা করে এবং তাৎপর্য সীমা সামঞ্জস্য করে যাতে সামগ্রিক মিথ্যা-ধনাত্মক হার ৫% এ থাকে। অন্যান্য বিকল্পের মধ্যে রয়েছে বনফেরোনি সংশোধন (সরল কিন্তু বেশি রক্ষণশীল) এবং শেফের পরীক্ষা (বেশি নমনীয় কিন্তু কম শক্তিশালী)।
ANOVA-এর বিভিন্ন রূপ
উপরে বর্ণিত সংস্করণটি একমুখী ANOVA, যা একটি একক কারণের প্রভাব পরীক্ষা করে। আরও জটিল নকশার জন্য উন্নত সংস্করণ আছে। দ্বিমুখী ANOVA একসাথে দুটি কারণ পরীক্ষা করে -- উদাহরণস্বরূপ, সারের ধরন এবং সেচের পরিমাণ উভয়ই -- এবং দুটি কারণ পরস্পর প্রভাবিত করে কিনা তা সনাক্ত করতে পারে। পুনরাবৃত্ত পরিমাপ ANOVA ব্যবহৃত হয় যখন একই বিষয়গুলো একাধিকবার পরিমাপ করা হয়।
বৈচিত্র্য যাই হোক, মৌলিক যুক্তি একই থাকে: গোষ্ঠী সদস্যতা দ্বারা ব্যাখ্যাকৃত ভ্যারিয়েন্সকে গোষ্ঠীর মধ্যে অব্যাখ্যাত ভ্যারিয়েন্সের সাথে তুলনা করুন এবং সিদ্ধান্ত নিন গোষ্ঠীর পার্থক্যগুলো দৈবের জন্য দায়ী করা যায় কিনা।
ANOVA আপনাকে একটি একক পরীক্ষায় তিন বা তার বেশি গোষ্ঠীর গড় তুলনা করতে দেয়, একাধিক t-পরীক্ষা চালানো থেকে আসা স্ফীত মিথ্যা-ধনাত্মক ঝুঁকি এড়িয়ে। এটি F-পরিসংখ্যানের মাধ্যমে গোষ্ঠী-মধ্য ভ্যারিয়েন্সকে গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের সাথে তুলনা করে কাজ করে। একটি বড় F-পরিসংখ্যান ইঙ্গিত করে যে অন্তত একটি গোষ্ঠী ভিন্ন। কোন নির্দিষ্ট গোষ্ঠী ভিন্ন তা চিহ্নিত করতে পরে টুকির HSD-এর মতো পোস্ট-হক পরীক্ষা ব্যবহার করুন। ফলাফল ব্যাখ্যা করার আগে সর্বদা স্বাধীনতা, স্বাভাবিকতা এবং সমান ভ্যারিয়েন্সের অনুমান পরীক্ষা করুন।