ANOVA: берничә төркемне чагыштыру

Катлаулылык: Уртача Уку вакыты: 15 минут

Ике төркемнән артык

T-тест ике төркемне чагыштыру өчен нигезле корал. Ләкин өч, дүрт яки ун төркем булганда нәрсә була? Компания өч төрле веб-сайт дизайнын тестлый һәм һәрберсе өчен конверсия дәрәҗәсен үлчи дип фараз итик. Яки фермер дүрт төр ашлама сынап карый һәм уңыш күләмен үлчи. Сез төркемнәрнең һәр мөмкин парын t-тест белән тикшерә алмыйсыз - бу ысул җитди проблемалар тудыра.

Күп t-тестлар үткәргәндә, һәрберсенең ялган уңай нәтиҗә бирү мөмкинлеге кечкенә (гадәттә 5%). Аларны җитәрлек күп үткәрсәгез, кимендә бер тестның ялган нәтиҗә бирү ихтималлыгы тиз үсә. Өч төркем белән - өч парлы чагыштыру кирәк. Биш төркем белән - ун. Ун төркем белән - кырык биш. Тестлар күбәйгән саен, чыннан да булмаган аермалык "табу" мөмкинлеге артык. Бу проблема күп чагыштырулар инфляциясе дип атала.

4.2 Design A 5.8 Design B 5.1 Design C

ANOVA - Дисперсия анализы - бу проблеманы барлык төркемнәрне бер тест белән тикшереп чишә. "А төркеме Б төркеменнән аерыламы?" дип сорау урынына, ул киңрәк сорау куя: "бу төркемнәр арасында теләсә нинди мөһим аерма бармы?" Әгәр җавап әйе булса, аннары конкрет нинди төркемнәр аерылуын табарга мөмкин.

Төп идея: ике төр дисперсия

Исеменә карамастан, ANOVA нигездә уртачаларны чагыштыра, дисперсияне түгел. Ләкин ул дисперсияне корал итеп куллана. Логика болай: мәгълүматларны төркемнәргә бүлсәгез, мәгълүматлардагы гомуми вариациялелек ике чыганактан килә.

Төркемара дисперсия төркем уртачаларының бер-берсеннән ни тиклем аерылуын үлчи. Өч веб-сайт дизайнының конверсия дәрәҗәләре бик аерыла торган булса, төркемара дисперсия зур булыр. Төркемэче дисперсия аерым кыйммәтләрнең һәр төркем эчендә ни тиклем аерылуын үлчи. Бер дизайн эчендә дә төрле кулланучылар төрле дәрәҗәдә конверсия ясыйлар - бу табигый таралу төркемэче дисперсия.

Әгәр төркемара дисперсия төркемэче дисперсиягә карата зур булса, бу төркемнәрнең чыннан да аерылуын күрсәтә. Әгәр төркемара дисперсия төркемнәр эчендәге шауга карата кечкенә булса, уртачалардагы аермалыклар очраклылык аркасында булырга мөмкин.

F-статистикасы

ANOVA F-статистикасы дигән сан чыгара (статистик Рональд Фишер исеменнән). Бу гади генә төркемара дисперсиянең төркемэче дисперсиягә нисбәте.

F-статистикасы 1 гә якын булса - төркемнәр охшаш, алар арасындагы вариация алар эчендәге вариация белән тигез. F-статистикасы 1 дән нык зур булса - кимендә бер төркем чыннан да аерыла. F-статистикасы 1 дән ни тиклем ерак булса, дәлилләр шул тиклем көчле.

42 Between Groups 18 Within Groups

Өстәге диаграммада төркемара дисперсия төркемэче дисперсиядән ике тапкырдан артык, бу 1 дән нык зур F-статистикасы бирә. Бу, мөгаен, кечкенә p-кыйммәткә китерер, төркемнәр арасында чын аерма бар икәнен күрсәтеп.

Мисал

Мәктәп районы 90 укучыда (программа саен 30) өч укыту программасын тестлый. Уртача баллар 72, 78 һәм 81. ANOVA исәплый: төркемара дисперсия (72, 78 һәм 81 арасындагы аермаларга нигезләнгән) төркемэче дисперсиядән (һәр программа эчендәге аерым укучы аермаларына нигезләнгән) 4.6 тапкыр зур. Бу F-статистикасы 4.6 p-кыйммәт 0.013 бирә - 0.05 чигеннән түбән - шуңа күрә район кимендә бер программа мөһим аерымлы нәтиҗәләр бирә дигән нәтиҗәгә килә.

ANOVA фаразлары

T-тест кебек, ANOVA да нәтиҗәләргә ышанганчы тикшерергә кирәк булган фаразлар белән килә:

  • Мөстәкыйльлек: Төркемнәр эчендә һәм арасындагы күзәтүләр мөстәкыйль булырга тиеш. Бер кешенең нәтиҗәсе башкасына йогынты ясамаска тиеш.
  • Нормальлек: Һәр төркем эчендәге мәгълүматлар якынча нормаль таралган булырга тиеш. Төркемгә 30 яки артык күзәтү белән бу шарт кимрәк мөһим була.
  • Тигез дисперсияләр (гомогенлек): Һәр төркем эчендәге мәгълүмат таралуы якынча охшаш булырга тиеш. Әгәр бер төркемнең стандарт тайпылуы 5, ә икенченеке 20 булса, стандарт ANOVA ялгыш юнәлтергә мөмкин. Левене тесты бу фаразны тикшерә ала, ә дисперсияләр тигез булмаганда Уэлч ANOVA ышанычлы альтернатива.

Бу фаразларны бозу нәтиҗәләрегезне автоматик рәвештә гамәлсез итми, аеруча зуррак сайламалар белән, ләкин аларны тикшерү яхшы практика.

ANOVA дан соң: Post-Hoc тестлар

ANOVA сезгә кимендә бер төркем аерыла дип әйтә, ләкин нинди төркемнәр аерылуын әйтми. Белү өчен, post-hoc тестлар үткәрәсез - күп чагыштырулар проблемасын контрольдә тотып, парлы чагыштырулар.

Иң популяр post-hoc тест - Тьюкинең HSD (Honestly Significant Difference). Ул һәр төркем парын чагыштыра, мөһимлек чиген төзәтеп, гомуми ялган уңай дәрәҗәсен 5% та тота. Башка вариантлар Бонферрони төзәтмәсе (гадирәк, ләкин консервативрак) һәм Шеффе тесты (ирекле, ләкин көче камрәк).

ANOVA ны скрининг тесты, ә post-hoc тестларны детальле тикшерү дип уйлагыз. Тикшерүне бары тик скрининг тесты мөһим булганда гына үткәрәсез. Бу ике баскычлы ысул ялган уңай дәрәҗәне контрольдә тотып, конкрет аермаларны ачыкларга мөмкинлек бирә.

34 Fertilizer A 41 Fertilizer B 38 Fertilizer C 45 Fertilizer D

ANOVA вариацияләре

Өстә тасвирланган версия - бер факторлы ANOVA, ул бер факторның (укыту ысулы яки ашлама төре кебек) йогынтысын тикшерә. Катлаулырак дизайннар өчен алдынгырак версияләр бар. Ике факторлы ANOVA ике факторны бер үк вакытта тикшерә - мәсәлән, ашлама төрен дә, суару ешлыгын да - һәм ике фактор үзара йогынты ясыйме икәнен ачыклый ала. Кабатлы үлчәүле ANOVA шул ук субъектлар берничә тапкыр үлчәнгәндә кулланыла, мәсәлән, пациентларны дәвалау алдыннан, дәвалау вакытында һәм дәвалаудан соң тикшерү.

Вариациягә карамастан, нигезге логика шул ук кала: төркемгә карашлылык аркасында аңлатылган дисперсияне төркемнәр эчендәге аңлатылмаган дисперсия белән чагыштыру һәм төркем аермаларын очраклылыкка гына сылтау мөмкинме икәнен билгеләү.

Төп нәтиҗә

ANOVA сезгә өч яки артык төркемнең уртачаларын бер тестта чагыштырырга мөмкинлек бирә, берничә t-тест үткәрүнең артык ялган уңай рискыннан саклый. Ул F-статистикасы аша төркемара дисперсияне төркемэче дисперсия белән чагыштырып эшли. Зур F-статистикасы кимендә бер төркемнең аерылуын күрсәтә. Конкрет нинди төркемнәр аерылуын белү өчен Тьюкинең HSD кебек post-hoc тестлар кулланыгыз. Нәтиҗәләрне аңлатканчы мөстәкыйльлек, нормальлек һәм тигез дисперсия фаразларын тикшерегез.