What is ANOVA in statistics?

ANOVA (Analysis of Variance) tests whether the means of three or more groups are significantly different from each other.

When should I use ANOVA instead of multiple t-tests?

Use ANOVA when comparing three or more groups. Running multiple t-tests increases the risk of false positives.

What is the difference between one-way and two-way ANOVA?

One-way ANOVA tests one factor with three or more groups. Two-way ANOVA tests two factors and can detect interaction effects between them.

What is a post hoc test after ANOVA?

A post hoc test (like Tukey HSD) identifies which specific group means differ after ANOVA finds a significant overall difference.

ANOVA: একাধিক গোষ্ঠীর তুলনা

দুটি গোষ্ঠীর বাইরে

t-পরীক্ষা দুটি গোষ্ঠীর তুলনা করার জন্য একটি নির্ভরযোগ্য হাতিয়ার। কিন্তু যখন আপনার তিন, চার বা দশটি গোষ্ঠী থাকে তখন কী হবে? ধরুন একটি কোম্পানি তিনটি ভিন্ন ওয়েবসাইট ডিজাইন পরীক্ষা করে এবং প্রতিটির জন্য রূপান্তর হার পরিমাপ করে। অথবা একজন কৃষক চার ধরনের সার চেষ্টা করে এবং ফসলের ফলন পরিমাপ করে। আপনি প্রতিটি সম্ভাব্য জোড়ায় t-পরীক্ষা চালাতে পারেন না -- এই পদ্ধতি গুরুতর সমস্যা তৈরি করে।

আপনি যখন অনেক t-পরীক্ষা চালান, প্রতিটিতে একটি ছোট মিথ্যা ধনাত্মক সম্ভাবনা থাকে (সাধারণত ৫%)। যথেষ্ট পরীক্ষা চালালে, অন্তত একটি পরীক্ষা ভুল ফলাফল দেওয়ার সম্ভাবনা দ্রুত বাড়ে। তিনটি গোষ্ঠীতে তিনটি জোড়া তুলনা লাগবে। পাঁচটি গোষ্ঠীতে দশটি। দশটি গোষ্ঠীতে পঁয়তাল্লিশটি। এই সমস্যাকে বলা হয় বহু তুলনা স্ফীতি।

ANOVA -- ভ্যারিয়েন্সের বিশ্লেষণ-এর সংক্ষিপ্ত রূপ -- একটি একক পরীক্ষায় সমস্ত গোষ্ঠী একসাথে পরীক্ষা করে এই সমস্যা সমাধান করে। "গোষ্ঠী A কি গোষ্ঠী B থেকে ভিন্ন?" জিজ্ঞাসা করার বদলে এটি একটি বৃহত্তর প্রশ্ন জিজ্ঞাসা করে: "এই সমস্ত গোষ্ঠীর মধ্যে কোনো উল্লেখযোগ্য পার্থক্য আছে কি?" উত্তর হ্যাঁ হলে, আপনি তারপর গভীরে গিয়ে খুঁজে বের করতে পারেন কোন নির্দিষ্ট গোষ্ঠী ভিন্ন।

মূল ধারণা: দুই ধরনের ভ্যারিয়েন্স

নাম সত্ত্বেও, ANOVA মূলত গড় তুলনা করে, ভ্যারিয়েন্স নয়। তবে এটি ভ্যারিয়েন্সকে হাতিয়ার হিসাবে ব্যবহার করে। যুক্তিটি এরকম: আপনি যদি তথ্যকে গোষ্ঠীতে ভাগ করেন, তথ্যের মোট পরিবর্তনশীলতা দুটি উৎস থেকে আসে।

গোষ্ঠী-মধ্য ভ্যারিয়েন্স পরিমাপ করে গোষ্ঠী গড়গুলো একে অপর থেকে কতটা ভিন্ন। গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্স পরিমাপ করে প্রতিটি গোষ্ঠীর ভেতরে পৃথক মানগুলো কতটা পরিবর্তিত হয়।

যদি গোষ্ঠী-মধ্য ভ্যারিয়েন্স গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের তুলনায় বড় হয়, তাহলে মনে হয় গোষ্ঠীগুলো সত্যিই ভিন্ন। যদি গোষ্ঠী-মধ্য ভ্যারিয়েন্স গোষ্ঠীর ভেতরের গোলমালের তুলনায় ছোট হয়, তাহলে গড়ের পার্থক্য সহজেই দৈবের কারণে হতে পারে।

F-পরিসংখ্যান

ANOVA একটি সংখ্যা তৈরি করে যাকে F-পরিসংখ্যান বলে (পরিসংখ্যানবিদ রোনাল্ড ফিশারের নামে)। এটি কেবল গোষ্ঠী-মধ্য ভ্যারিয়েন্স এবং গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের অনুপাত।

১ এর কাছাকাছি F-পরিসংখ্যান মানে গোষ্ঠীগুলো একই রকম দেখায়। ১ এর চেয়ে অনেক বড় F-পরিসংখ্যান ইঙ্গিত করে যে অন্তত একটি গোষ্ঠী সত্যিই ভিন্ন।

উপরের চার্টে, গোষ্ঠী-মধ্য ভ্যারিয়েন্স গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের দ্বিগুণেরও বেশি, যা ১ এর অনেক উপরে F-পরিসংখ্যান তৈরি করে। এটি সম্ভবত একটি ছোট p-মান দেবে, যা গোষ্ঠীগুলোর মধ্যে একটি প্রকৃত পার্থক্য নির্দেশ করে।

উদাহরণ

একটি স্কুল জেলা ৯০ জন ছাত্রের (প্রতি প্রোগ্রামে ৩০) উপর তিনটি পড়ার প্রোগ্রাম পরীক্ষা করে। গড় নম্বর হলো ৭২, ৭৮ এবং ৮১। ANOVA গণনা করে যে গোষ্ঠী-মধ্য ভ্যারিয়েন্স গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের ৪.৬ গুণ। এই ৪.৬ এর F-পরিসংখ্যান ০.০১৩ এর p-মান দেয় -- ০.০৫ সীমার নিচে -- তাই জেলা সিদ্ধান্তে আসে যে অন্তত একটি প্রোগ্রাম অর্থপূর্ণভাবে ভিন্ন ফলাফল দেয়।

ANOVA-এর অনুমান

t-পরীক্ষার মতো, ANOVA-তেও কিছু অনুমান আছে যা ফলাফলে বিশ্বাস করার আগে পরীক্ষা করা উচিত:

স্বাধীনতা: গোষ্ঠীর মধ্যে এবং গোষ্ঠী জুড়ে পর্যবেক্ষণ অবশ্যই স্বাধীন হতে হবে।
স্বাভাবিকতা: প্রতিটি গোষ্ঠীর তথ্য প্রায় স্বাভাবিকভাবে বন্টিত হওয়া উচিত। প্রতি গোষ্ঠীতে ৩০ বা তার বেশি পর্যবেক্ষণ থাকলে এটি কম গুরুত্বপূর্ণ হয়ে যায়।
সমান ভ্যারিয়েন্স (সমসত্ত্বতা): প্রতিটি গোষ্ঠীর মধ্যে তথ্যের বিস্তার মোটামুটি একই রকম হওয়া উচিত। লেভেনের পরীক্ষা এই অনুমান পরীক্ষা করতে পারে, এবং ওয়েলচের ANOVA অসমান ভ্যারিয়েন্সের জন্য একটি শক্তিশালী বিকল্প।

ANOVA-এর পর: পোস্ট-হক পরীক্ষা

ANOVA আপনাকে বলে যে অন্তত একটি গোষ্ঠী ভিন্ন, কিন্তু কোন গোষ্ঠী কোনটি থেকে ভিন্ন তা বলে না। জানতে হলে, আপনি পোস্ট-হক পরীক্ষা চালান -- ফলো-আপ তুলনা যা বহু তুলনা সমস্যা নিয়ন্ত্রণ করে।

সবচেয়ে সাধারণ পোস্ট-হক পরীক্ষা হলো টুকির HSD (সৎভাবে উল্লেখযোগ্য পার্থক্য)। এটি প্রতিটি জোড়া গোষ্ঠীর তুলনা করে এবং তাৎপর্য সীমা সামঞ্জস্য করে যাতে সামগ্রিক মিথ্যা-ধনাত্মক হার ৫% এ থাকে। অন্যান্য বিকল্পের মধ্যে রয়েছে বনফেরোনি সংশোধন (সরল কিন্তু বেশি রক্ষণশীল) এবং শেফের পরীক্ষা (বেশি নমনীয় কিন্তু কম শক্তিশালী)।

ANOVA-এর বিভিন্ন রূপ

উপরে বর্ণিত সংস্করণটি একমুখী ANOVA, যা একটি একক কারণের প্রভাব পরীক্ষা করে। আরও জটিল নকশার জন্য উন্নত সংস্করণ আছে। দ্বিমুখী ANOVA একসাথে দুটি কারণ পরীক্ষা করে -- উদাহরণস্বরূপ, সারের ধরন এবং সেচের পরিমাণ উভয়ই -- এবং দুটি কারণ পরস্পর প্রভাবিত করে কিনা তা সনাক্ত করতে পারে। পুনরাবৃত্ত পরিমাপ ANOVA ব্যবহৃত হয় যখন একই বিষয়গুলো একাধিকবার পরিমাপ করা হয়।

বৈচিত্র্য যাই হোক, মৌলিক যুক্তি একই থাকে: গোষ্ঠী সদস্যতা দ্বারা ব্যাখ্যাকৃত ভ্যারিয়েন্সকে গোষ্ঠীর মধ্যে অব্যাখ্যাত ভ্যারিয়েন্সের সাথে তুলনা করুন এবং সিদ্ধান্ত নিন গোষ্ঠীর পার্থক্যগুলো দৈবের জন্য দায়ী করা যায় কিনা।

মূল শিক্ষা

ANOVA আপনাকে একটি একক পরীক্ষায় তিন বা তার বেশি গোষ্ঠীর গড় তুলনা করতে দেয়, একাধিক t-পরীক্ষা চালানো থেকে আসা স্ফীত মিথ্যা-ধনাত্মক ঝুঁকি এড়িয়ে। এটি F-পরিসংখ্যানের মাধ্যমে গোষ্ঠী-মধ্য ভ্যারিয়েন্সকে গোষ্ঠী-অন্তর্বর্তী ভ্যারিয়েন্সের সাথে তুলনা করে কাজ করে। একটি বড় F-পরিসংখ্যান ইঙ্গিত করে যে অন্তত একটি গোষ্ঠী ভিন্ন। কোন নির্দিষ্ট গোষ্ঠী ভিন্ন তা চিহ্নিত করতে পরে টুকির HSD-এর মতো পোস্ট-হক পরীক্ষা ব্যবহার করুন। ফলাফল ব্যাখ্যা করার আগে সর্বদা স্বাধীনতা, স্বাভাবিকতা এবং সমান ভ্যারিয়েন্সের অনুমান পরীক্ষা করুন।