Tatizo la Thamani za P Peke Yake
Unafanya utafiti, unapata thamani ya p ya 0.03, na kutangaza matokeo yako "yana umuhimu wa kitakwimu." Lakini hilo linakuambia nini kweli? Thamani ya p inakuambia jinsi matokeo yako yangevyokuwa ya kushangaza ikiwa hakuna athari yoyote ya kweli. Haikuambii jinsi athari ilivyo kubwa au muhimu.
Tatizo hapa ni hili: na sampuli kubwa ya kutosha, karibu tofauti yoyote -- haijalishi ni ndogo kiasi gani -- itakuwa na umuhimu wa kitakwimu. Ukilinganisha wastani wa urefu wa watu 100,000 wanaokunywa kahawa na watu 100,000 wasiokunywa, unaweza kupata tofauti yenye umuhimu wa kitakwimu ya sentimeta 0.2. Thamani ya p inaweza kuwa ndogo sana (p = 0.001), lakini tofauti haina maana kwa vitendo. Hakuna anayejali kuhusu sehemu ya tano ya sentimeta.
Hapa ndipo ukubwa wa athari unapoingia. Ukubwa wa athari unapima ukubwa wa tofauti au uhusiano, bila kutegemea ukubwa wa sampuli. Unajibu swali ambalo kweli lina umuhimu: athari hii ni kubwa kiasi gani, na je ina umuhimu katika ulimwengu halisi?
Cohen's d: Kupima Tofauti
Kipimo cha ukubwa wa athari kinachotumika zaidi kwa kulinganisha vikundi viwili ni Cohen's d. Kinaelezea tofauti kati ya wastani wa vikundi viwili kwa vitengo vya kupotoka kwa kawaida. Fomula ni rahisi: chukua tofauti kati ya wastani wawili na ugawanye kwa kupotoka kwa kawaida kilichounganishwa.
Kwa mfano, ikiwa Kikundi A kina wastani wa 75 na Kikundi B kina wastani wa 80, na kupotoka kwa kawaida kilichounganishwa ni 10, basi Cohen's d = (80 - 75) / 10 = 0.5. Hii ina maana vikundi viwili vimetengana kwa nusu ya kupotoka kwa kawaida.
Picha hapo juu inaonyesha mkunjo wa kawaida wa kiwango. Eneo lenye kivuli katikati linawakilisha eneo la kuingiliana kati ya vikundi viwili vilivyotengwa na athari ndogo-hadi-kati. Kadri mikunjo inavyoingiliana zaidi, ndivyo tofauti ya vitendo kati ya vikundi inavyokuwa ndogo.
Athari Ndogo, za Kati, na Kubwa
Jacob Cohen, mwanasaikolojia aliyetangazisha kipimo hiki, alipendekeza vigezo vya takriban vya kutafsiri ukubwa wa athari:
- Athari ndogo (d = 0.2): Tofauti ni ya kweli lakini vigumu kuiona kwa jicho la kawaida. Vikundi viwili vinaingiliana karibu kabisa. Mfano: tofauti ya urefu kati ya wasichana wa miaka 15 na 16.
- Athari ya kati (d = 0.5): Tofauti inaonekana kwa waangalizi makini. Kuna utengano wa maana kati ya vikundi, ingawa kuingiliana bado kuko. Mfano: tofauti ya urefu kati ya wasichana wa miaka 14 na 18.
- Athari kubwa (d = 0.8): Tofauti ni wazi na ina umuhimu wa vitendo. Vikundi vinatofautiana wazi, ingawa kuingiliana bado kuko. Mfano: tofauti ya urefu kati ya wasichana wa miaka 13 na 18.
Vigezo hivi ni miongozo, si sheria za kudumu. Katika nyanja fulani, ukubwa wa athari "ndogo" ni muhimu sana. Dawa inayopunguza hatari ya mshtuko wa moyo kwa kiasi kidogo (d = 0.2) inaweza kuokoa maelfu ya maisha inapotumika kwa mamilioni ya watu. Muktadha unaamua kama athari ina umuhimu wa vitendo.
Kwa Nini Ukubwa wa Athari Una Umuhimu kwa Kufanya Maamuzi
Fikiria hali mbili. Utafiti A unajaribu programu mpya ya mafunzo ya wafanyakazi kwa watu 20 na kupata uboreshaji wa alama 10 katika alama za utendaji (p = 0.08, d = 0.9). Utafiti B unajaribu programu hiyo hiyo kwa watu 5,000 na kupata uboreshaji wa alama 1 (p = 0.001, d = 0.05). Utafiti upi unatoa ushahidi wenye nguvu zaidi kuwa programu inastahili kupitishwa?
Ukiangalia thamani za p tu, Utafiti B "unashinda" -- matokeo yake yana umuhimu mkubwa wa kitakwimu. Lakini ukubwa wa athari unasimulia hadithi tofauti. Utafiti A ulipata uboreshaji mkubwa, wa maana. Utafiti B ulipata uboreshaji mdogo sana ambao tu ulifikia umuhimu kwa sababu ya ukubwa mkubwa wa sampuli. Mfanya maamuzi mwenye busara angezingatia matokeo ya Utafiti A kwa uzito zaidi, huku akitambua inahitaji kurudiwa na sampuli kubwa.
Hii ndiyo sababu majarida mengi ya kisayansi sasa yanahitaji ukubwa wa athari kuripotiwa pamoja na thamani za p. Chama cha Kisaikolojia cha Amerika kimependekeza kuripoti ukubwa wa athari tangu 1994. Picha kamili ya ugunduzi inahitaji zote mbili: thamani ya p inakuambia kama athari labda ni ya kweli, na ukubwa wa athari unakuambia kama inastahili kujali.
Vipimo Vingine vya Ukubwa wa Athari
Cohen's d si kipimo pekee cha ukubwa wa athari. Hali tofauti zinahitaji vipimo tofauti. Pearson's r (mgawo wa uwiano) yenyewe ni ukubwa wa athari kwa nguvu ya uhusiano kati ya vigezo viwili, na vigezo vya 0.1 (ndogo), 0.3 (kati), na 0.5 (kubwa). Eta-mraba na eta-mraba ya sehemu zinatumika na ANOVA kuelezea ni kiasi gani cha jumla ya tofauti kinachoelezwa na uanachama wa kikundi. Uwiano wa nafasi ni wa kawaida katika utafiti wa matibabu kwa kulinganisha uwezekano wa matokeo kati ya vikundi.
Chaguo la kipimo linategemea aina yako ya uchambuzi. Kwa kulinganisha wastani wawili, tumia Cohen's d. Kwa uwiano, tumia r. Kwa ANOVA, tumia eta-mraba. Kwa matokeo ya binary, tumia uwiano wa nafasi. Kinachohusika ni kwamba daima uripoti kipimo fulani cha ukubwa wa athari, si tu thamani ya p.
Matumizi ya Vitendo
Ukubwa wa athari ni muhimu kwa uchambuzi wa nguvu -- kuamua washiriki wangapi unahitaji kabla ya kuendesha utafiti. Ukitarajia athari ndogo, unahitaji sampuli kubwa zaidi kugundua kwa uhakika kuliko ukitarajia athari kubwa. Kupanga ukubwa wa sampuli bila kuzingatia ukubwa wa athari ni kama kupakia mfuko kwa safari bila kujua unapoenda.
Ukubwa wa athari pia unafanya uchambuzi wa meta uwezekane. Watafiti wanapounganisha matokeo kutoka masomo mengi kuhusu mada sawa, wanabadilisha matokeo ya kila utafiti kuwa kipimo cha kawaida cha ukubwa wa athari. Hii inawakuruhusu kuchanganya ushahidi kati ya masomo yaliyotumia ukubwa wa sampuli tofauti, vipimo tofauti, na idadi tofauti ya watu. Utafiti mmoja unaweza kuwa usio na hitimisho, lakini ukubwa wa athari uliounganishwa kati ya masomo 50 unaweza kuwa na taarifa sana.
Chati hapo juu inalinganisha ukubwa wa athari wa dawa tatu za kutibu hali sawa. Zote tatu zinaweza kuwa na thamani za p zenye umuhimu wa kitakwimu, lakini tofauti za vitendo ni kubwa. Dawa B ina athari mara mbili ya Dawa A na mara sita ya Dawa C. Daktari anayechagua kati yao anapaswa kuzingatia ukubwa wa athari, si tu umuhimu.
Umuhimu wa kitakwimu unakuambia kama athari labda ni ya kweli, lakini ukubwa wa athari unakuambia kama ina umuhimu. Cohen's d ni kipimo cha kawaida kwa kulinganisha vikundi viwili, na vigezo vya 0.2 (ndogo), 0.5 (kati), na 0.8 (kubwa). Daima ripoti ukubwa wa athari pamoja na thamani za p. Na sampuli kubwa, hata tofauti ndogo zinakuwa "zenye umuhimu," hivyo ukubwa wa athari ni muhimu kwa kufanya maamuzi ya busara, uchambuzi wa nguvu, na kulinganisha matokeo kati ya masomo.