Zaidi ya Vikundi Viwili
Jaribio la t ni chombo kwa kulinganisha vikundi viwili. Lakini nini kinatokea ukiwa na vikundi vitatu, vinne, au kumi? Tuseme kampuni inajaribu miundo mitatu tofauti ya tovuti na kupima viwango vya ubadilishaji kwa kila moja. Au mkulima anajaribu aina nne za mbolea na kupima mavuno. Huwezi tu kuendesha majaribio ya t kwa kila jozi ya vikundi -- njia hiyo inaleta matatizo makubwa.
Unapoendesha majaribio mengi ya t, kila moja ina nafasi ndogo ya kutoa chanya ya uongo (kawaida 5%). Endesha ya kutosha, na uwezekano wa angalau moja kutoa matokeo ya kupotosha unakua haraka. Na vikundi vitatu, unahitaji ulinganisho wa jozi tatu. Na vikundi vitano, unahitaji kumi. Na vikundi kumi, arobaini na tano. Kadri unavyoendesha majaribio zaidi, ndivyo uwezekano wa "kupata" tofauti isiyo ya kweli unavyoongezeka. Tatizo hili linaitwa mfumuko wa ulinganisho wa mengi.
ANOVA -- kifupi cha Uchambuzi wa Tofauti -- inatatua hili kwa kujaribu vikundi vyote mara moja kwa jaribio moja. Badala ya kuuliza "je kikundi A kinatofautiana na kikundi B?" inauliza swali pana zaidi: "je kuna tofauti yoyote muhimu kati ya vikundi hivi vyote?" Ikiwa jibu ni ndiyo, basi unaweza kuchimba zaidi kupata vikundi vipi hasa vinatofautiana.
Wazo Kuu: Aina Mbili za Tofauti
Licha ya jina lake, ANOVA kimsingi ni kuhusu kulinganisha wastani, si tofauti. Lakini inatumia tofauti kama chombo chake. Mantiki ni hivi: ukigawa data katika vikundi, jumla ya utofauti katika data inatoka vyanzo viwili.
Tofauti ya kati ya vikundi inapima jinsi wastani wa vikundi unavyotofautiana kutoka kwa kila moja. Ikiwa miundo mitatu ya tovuti ina viwango tofauti sana vya ubadilishaji, tofauti ya kati ya vikundi itakuwa kubwa. Tofauti ya ndani ya vikundi inapima jinsi thamani za mtu binafsi zinavyotofautiana ndani ya kila kikundi. Hata ndani ya muundo mmoja, watumiaji tofauti watabadilisha kwa viwango tofauti -- mwenendo huo wa asili ni tofauti ya ndani ya vikundi.
Ikiwa tofauti ya kati ya vikundi ni kubwa kulingana na tofauti ya ndani ya vikundi, inaonyesha vikundi kweli vinatofautiana. Ikiwa tofauti ya kati ya vikundi ni ndogo kulinganisha na kelele ndani ya vikundi, tofauti katika wastani zinaweza kuwa kwa bahati tu.
Takwimu ya F
ANOVA inazalisha nambari inayoitwa takwimu ya F (iliyopewa jina la mtakwimu Ronald Fisher). Ni uwiano tu wa tofauti ya kati ya vikundi kwa tofauti ya ndani ya vikundi.
Takwimu ya F karibu na 1 ina maana vikundi vinaonekana sawa -- utofauti kati yao ni sawa na utofauti ndani yao. Takwimu ya F kubwa zaidi kuliko 1 inaonyesha kuwa angalau kikundi kimoja kinatofautiana kweli. Kadri takwimu ya F inavyokuwa mbali na 1, ndivyo ushahidi unavyokuwa na nguvu zaidi.
Katika chati hapo juu, tofauti ya kati ya vikundi ni zaidi ya mara mbili ya tofauti ya ndani ya vikundi, ikizalisha takwimu ya F juu ya 1 kwa kiasi kikubwa. Hii pengine ingesababisha thamani ndogo ya p, ikionyesha tofauti ya kweli kati ya vikundi.
Wilaya ya shule inajaribu programu tatu za kusoma kwa wanafunzi 90 (30 kwa kila programu). Wastani wa alama ni 72, 78, na 81. ANOVA inahesabu kuwa tofauti ya kati ya vikundi (inayosababishwa na tofauti kati ya 72, 78, na 81) ni mara 4.6 ya tofauti ya ndani ya vikundi (inayosababishwa na tofauti za wanafunzi mmoja mmoja ndani ya kila programu). Takwimu hii ya F ya 4.6 inazalisha thamani ya p ya 0.013 -- chini ya kizingiti cha 0.05 -- hivyo wilaya inahitimisha kuwa angalau programu moja inazalisha matokeo tofauti kwa maana.
Madhania ya ANOVA
Kama jaribio la t, ANOVA ina madhania unayopaswa kuangalia kabla ya kuamini matokeo:
- Uhuru: Uchunguzi ndani na kati ya vikundi lazima uwe huru. Matokeo ya mtu mmoja hayapaswi kuathiri ya mwingine.
- Ukawaida: Data ndani ya kila kikundi inapaswa kuwa na usambazaji wa kawaida takriban. Na uchunguzi 30 au zaidi kwa kikundi, hii inakuwa muhimu kidogo.
- Tofauti sawa (usawa): Mwenendo wa data ndani ya kila kikundi unapaswa kuwa sawa takriban. Ikiwa kikundi kimoja kina kupotoka kwa kawaida kwa 5 na kingine 20, ANOVA ya kawaida inaweza kupotosha. Jaribio la Levene linaweza kuangalia dhana hii, na ANOVA ya Welch ni mbadala imara wakati tofauti si sawa.
Kuvunja madhania haya hakubatilishi matokeo yako kiotomatiki, hasa na sampuli kubwa, lakini ni mazoezi mazuri kuyathibitisha.
Baada ya ANOVA: Majaribio ya Baadaye
ANOVA inakuambia kuwa angalau kikundi kimoja kinatofautiana, lakini haikuambii vikundi vipi vinatofautiana na vipi. Ili kugundua, unafanya majaribio ya baadaye -- ulinganisho wa ufuatiliaji unaodhibiti tatizo la ulinganisho wa mengi.
Jaribio la baadaye la kawaida zaidi ni HSD ya Tukey (Tofauti ya Kweli ya Muhimu). Linalinganisha kila jozi ya vikundi huku likirekebishe kizingiti cha umuhimu ili kiwango cha jumla cha chanya ya uongo kibaki 5%. Chaguzi nyingine ni pamoja na marekebisho ya Bonferroni (rahisi lakini ya kihafidhina zaidi) na jaribio la Scheffé (la kubadilika zaidi lakini lisilo na nguvu sana).
Fikiria ANOVA kama jaribio la uchunguzi na majaribio ya baadaye kama ufuatiliaji wa kina. Unafanya ufuatiliaji tu ikiwa jaribio la uchunguzi ni muhimu. Njia hii ya hatua mbili inadhibiti kiwango cha chanya ya uongo huku bado ikikuruhusu kubainisha tofauti maalum.
Aina za ANOVA
Toleo lililoelezwa hapo juu ni ANOVA ya njia moja, ambayo inachunguza athari ya sababu moja (kama mbinu ya kufundisha au aina ya mbolea). Kuna toleo za hali ya juu zaidi kwa miundo ngumu zaidi. ANOVA ya njia mbili inachunguza sababu mbili kwa wakati mmoja -- kwa mfano, aina ya mbolea na marudio ya kumwagilia -- na inaweza kugundua kama sababu hizo mbili zinaingiliana. ANOVA ya vipimo vinavyorudiwa inatumika masomo yale yale yanapopimwa mara nyingi, kama kupima wagonjwa kabla ya matibabu, wakati wa matibabu, na baada ya matibabu.
Bila kujali aina, mantiki ya msingi inabaki sawa: linganisha tofauti inayoelezwa na uanachama wa kikundi na tofauti isiyoelezwa ndani ya vikundi, na uamue kama tofauti za vikundi ni kubwa mno kuhusishwa na bahati.
ANOVA inakuruhusu kulinganisha wastani wa vikundi vitatu au zaidi katika jaribio moja, kuepuka hatari iliyoongezeka ya chanya ya uongo inayotoka kwa kuendesha majaribio mengi ya t. Inafanya kazi kwa kulinganisha tofauti ya kati ya vikundi na tofauti ya ndani ya vikundi kupitia takwimu ya F. Takwimu kubwa ya F inaonyesha angalau kikundi kimoja kinatofautiana. Tumia majaribio ya baadaye kama HSD ya Tukey baadaye kubainisha vikundi vipi hasa vinatofautiana. Daima angalia madhania ya uhuru, ukawaida, na tofauti sawa kabla ya kutafsiri matokeo.