Jaribio la Chi-Square

Kiwango cha Ugumu: Kati Muda wa Kusoma: 12 dakika

Kulinganisha Kategoria

T-test inalinganisha wastani wa nambari. Lakini vipi unapotaka kulinganisha kategoria? Je, jinsia inaathiri chaguo la mtandao wa simu? Je, mkoa unaathiri chama cha siasa mtu anachokipendelea? Jaribio la Chi-Square (χ²) linakusaidia kujibu maswali haya kwa kulinganisha masafa uliyoyaona na masafa unayoyatarajia.

30 A 25 B 28 C 17 D

Wazo la Msingi

Fikiria hivi: kama jinsia na chaguo la mtandao wa simu havihusiani kabisa, basi asilimia ya wanaume wanaochagua Vodacom inapaswa kuwa sawa na asilimia ya wanawake wanaochagua Vodacom. Jaribio la Chi-Square linaangalia kama tofauti kati ya unachokiona kweli na unachotarajia ni kubwa ya kutosha kuwa ya maana au ni bahati tu.

Mfano: Mtandao wa Simu na Jinsia

Mfano

Utafiti wa wateja 400 unaonyesha:

VodacomAirtelTigoJumla
Wanaume906050200
Wanawake708050200
Jumla160140100400

Kama hakuna uhusiano kati ya jinsia na mtandao, tunatarajia kila jinsia ichague mitandao kwa uwiano sawa na asilimia ya jumla. Mfano: tunatarajia wanaume 80 kuchagua Vodacom (200 × 160/400 = 80), lakini tuliona 90. Tofauti hii ni kubwa ya kutosha?

Baada ya mahesabu ya Chi-Square, χ² = 5.36, na p-value ≈ 0.069. Kwa α = 0.05, hii si ya maana - hatuna ushahidi wa kutosha kusema jinsia inaathiri chaguo la mtandao.

Jinsi ya Kuhesabu

Fomyula ya Chi-Square ni:

χ² = ∑ [(Iliyoonekana - Iliyotarajiwa)² ÷ Iliyotarajiwa]

Kwa kila seli katika jedwali, unahesabu tofauti kati ya idadi iliyoonekana na iliyotarajiwa, unapiga mraba, na kugawanya kwa iliyotarajiwa. Kisha unajumlisha yote.

Kuhesabu Masafa Yanayotarajiwa

Kwa kila seli: Iliyotarajiwa = (Jumla ya safu × Jumla ya safu wima) ÷ Jumla kuu

Aina Mbili za Chi-Square

1. Jaribio la Kufaa (Goodness of Fit)

Linaangalia kama usambazaji wa kategoria moja unafaa mfumo uliotarajiwa.

30 Uchg A 25 Taraj A 15 Uchg B 25 Taraj B 35 Uchg C 25 Taraj C 20 Uchg D 25 Taraj D
Mfano

Kete inapaswa kutoa kila nambari (1-6) kwa uwezekano sawa. Unageuza mara 120 na kuona:

  • 1: mara 25, 2: mara 18, 3: mara 22, 4: mara 15, 5: mara 20, 6: mara 20

Tunatarajia kila nambari mara 20 (120 ÷ 6). Chi-Square inakuambia kama tofauti hizi ni ndogo za kutosha kuwa bahati au ni kubwa kiasi cha kuonyesha kete si safi.

2. Jaribio la Uhuru (Test of Independence)

Linaangalia kama vigezo viwili vya kimaelezo vinahusiana - kama mfano wa mtandao na jinsia hapo juu.

Mfano

NBS inataka kujua kama kiwango cha elimu (msingi, sekondari, chuo) kinahusiana na aina ya ajira (kilimo, biashara, ofisi). Wanakusanya data kutoka kaya 600 na kuunda jedwali la kategoria mbili. Jaribio la Chi-Square linaonyesha χ² = 45.2 na p-value < 0.001 - uhusiano wa nguvu kati ya elimu na aina ya ajira.

Masharti ya Chi-Square

  • Data ya kimaelezo: Chi-Square ni kwa kategoria (jinsia, mkoa, aina ya zao), si nambari endelevu.
  • Masafa yanayotarajiwa ya kutosha: Kila seli inapaswa kuwa na masafa yanayotarajiwa ya angalau 5. Kama seli ina chini ya 5, matokeo yanaweza kuwa si ya kuaminika.
  • Uhuru wa vipimo: Kila mtu au kipimo kinapaswa kuhesabiwa mara moja tu.

Mfano wa Vitendo: Elimu na Matumizi ya M-Pesa

Mfano

Utafiti wa watu 500 kuhusu matumizi ya M-Pesa na kiwango cha elimu:

HutumiiMara chacheKila sikuJumla
Msingi608040180
Sekondari207090180
Chuo535100140
Jumla85185230500

χ² = 89.7, p-value < 0.001. Kuna uhusiano wa nguvu sana kati ya elimu na matumizi ya M-Pesa. Watu wenye elimu ya juu wana uwezekano mkubwa zaidi wa kutumia M-Pesa kila siku.

Jambo Muhimu

Jaribio la Chi-Square linalinganisha masafa yaliyoonekana na yanayotarajiwa kuamua kama kategoria zinahusiana. Jaribio la kufaa linaangalia usambazaji wa kategoria moja; jaribio la uhuru linaangalia uhusiano kati ya kategoria mbili. Masharti muhimu ni data ya kimaelezo na masafa yanayotarajiwa ya angalau 5 kwa kila seli. Kama t-test ni kwa nambari, Chi-Square ni kwa kategoria.