ANOVA: متعدد گروہوں کا موازنہ

مشکل: درمیانی پڑھنے کا وقت: 15 منٹ

دو گروہوں سے آگے

t-ٹیسٹ دو گروہوں کے موازنے کا ایک قابل اعتماد ذریعہ ہے۔ لیکن جب آپ کے پاس تین، چار یا دس گروہ ہوں تو کیا ہوگا؟ فرض کریں ایک کمپنی تین مختلف ویب سائٹ ڈیزائن آزماتی ہے اور ہر ایک کے تبادلے کی شرح ناپتی ہے۔ آپ ہر ممکنہ جوڑے پر t-ٹیسٹ نہیں چلا سکتے -- اس طریقے سے سنگین مسائل پیدا ہوتے ہیں۔

جب آپ بہت سے t-ٹیسٹ چلاتے ہیں تو ہر ایک میں غلط مثبت کا تھوڑا سا امکان ہوتا ہے (عام طور پر 5%)۔ کافی ٹیسٹ چلائیں اور کم از کم ایک ٹیسٹ گمراہ کن نتیجہ دینے کا امکان تیزی سے بڑھتا ہے۔ اس مسئلے کو متعدد موازنوں کی افراط کہتے ہیں۔

4.2 ڈیزائن A 5.8 ڈیزائن B 5.1 ڈیزائن C

ANOVA -- تغیر کا تجزیہ -- ایک ہی ٹیسٹ میں تمام گروہوں کو ایک ساتھ آزما کر یہ مسئلہ حل کرتا ہے۔ یہ ایک وسیع تر سوال پوچھتا ہے: "ان تمام گروہوں میں کوئی معتد بہ فرق ہے؟" اگر جواب ہاں ہے تو آپ مزید گہرائی میں جا کر دیکھ سکتے ہیں کہ کون سے مخصوص گروہ مختلف ہیں۔

بنیادی خیال: دو قسم کا تغیر

نام کے باوجود، ANOVA بنیادی طور پر اوسط کا موازنہ کرتا ہے، تغیر کا نہیں۔ لیکن یہ تغیر کو اپنے آلے کے طور پر استعمال کرتا ہے۔ بین گروہی تغیر ناپتا ہے کہ گروہ اوسط ایک دوسرے سے کتنے مختلف ہیں۔ اندرونِ گروہی تغیر ناپتا ہے کہ ہر گروہ کے اندر انفرادی اقدار کتنی مختلف ہیں۔

اگر بین گروہی تغیر اندرونِ گروہی تغیر کے مقابلے بڑا ہے تو اس سے پتا چلتا ہے کہ گروہ واقعی مختلف ہیں۔

F-شماریت

ANOVA ایک عدد بناتا ہے جسے F-شماریت کہتے ہیں (شماریت دان رونالڈ فشر کے نام پر)۔ یہ بین گروہی تغیر اور اندرونِ گروہی تغیر کا تناسب ہے۔ 1 کے قریب F-شماریت کا مطلب ہے گروہ ایک جیسے لگتے ہیں۔ 1 سے بہت بڑی F-شماریت بتاتی ہے کہ کم از کم ایک گروہ واقعی مختلف ہے۔

42 بین گروہی 18 اندرونِ گروہی
مثال

ایک اسکول ضلع 90 طلباء (ہر پروگرام میں 30) پر تین ریڈنگ پروگرام آزماتا ہے۔ اوسط نمبر 72، 78 اور 81 ہیں۔ ANOVA حساب لگاتا ہے کہ بین گروہی تغیر اندرونِ گروہی تغیر کا 4.6 گنا ہے۔ یہ 4.6 کی F-شماریت 0.013 کی p-قدر دیتی ہے -- 0.05 کی حد سے نیچے -- تو ضلع نتیجہ نکالتا ہے کہ کم از کم ایک پروگرام بامعنی مختلف نتائج دیتا ہے۔

ANOVA کے مفروضات

  • آزادی: گروہوں کے اندر اور گروہوں میں مشاہدات آزاد ہونے چاہییں۔
  • نارملیت: ہر گروہ میں ڈیٹا تقریباً نارمل تقسیم والا ہونا چاہیے۔
  • برابر تغیر (یکسانیت): ہر گروہ میں ڈیٹا کا پھیلاؤ تقریباً ایک جیسا ہونا چاہیے۔

ANOVA کے بعد: پوسٹ ہاک ٹیسٹ

ANOVA بتاتا ہے کہ کم از کم ایک گروہ مختلف ہے لیکن یہ نہیں بتاتا کون سے گروہ مختلف ہیں۔ جاننے کے لیے آپ پوسٹ ہاک ٹیسٹ چلاتے ہیں۔ سب سے عام ٹیوکی کا HSD ہے۔

34 کھاد A 41 کھاد B 38 کھاد C 45 کھاد D

ANOVA کی اقسام

اوپر بیان کیا گیا نسخہ ایک طرفہ ANOVA ہے۔ دو طرفہ ANOVA بیک وقت دو عوامل جانچتا ہے۔ بار بار ناپ ANOVA استعمال ہوتا ہے جب ایک ہی مضامین کو کئی بار ناپا جائے۔

کلیدی نکتہ

ANOVA آپ کو ایک ٹیسٹ میں تین یا اس سے زیادہ گروہوں کی اوسط کا موازنہ کرنے دیتا ہے، متعدد t-ٹیسٹ چلانے سے پیدا ہونے والے بڑھے ہوئے غلط مثبت خطرے سے بچاتا ہے۔ یہ F-شماریت کے ذریعے بین گروہی تغیر کا اندرونِ گروہی تغیر سے موازنہ کر کے کام کرتا ہے۔ بڑی F-شماریت بتاتی ہے کہ کم از کم ایک گروہ مختلف ہے۔ مخصوص فرق معلوم کرنے کے لیے ٹیوکی کے HSD جیسے پوسٹ ہاک ٹیسٹ استعمال کریں۔