Wastani Peke Yake Haitoshi
Fikiria shule mbili za sekondari. Zote mbili zina wastani wa alama za Hisabati ya 60 kati ya 100. Je, shule hizi zinafanana? Si lazima. Katika shule ya kwanza, alama zinaweza kuwa 58, 59, 60, 61, 62 - zote karibu na wastani. Katika shule ya pili, alama zinaweza kuwa 20, 40, 60, 80, 100 - zilienea sana. Wastani ni sawa, lakini hadithi ni tofauti kabisa.
Ndipo tunahitaji vipimo vya usambazaji - jinsi data inavyoenea au kusambaa. Vipimo viwili vya msingi ni masafa (range) na tofauti (variance).
Masafa (Range)
Masafa ni kipimo rahisi zaidi cha usambazaji. Ni tofauti kati ya thamani kubwa zaidi na ndogo zaidi katika data.
Masafa = Thamani kubwa zaidi - Thamani ndogo zaidi
Bei ya kilo moja ya sukari katika maduka 7 ya Dar es Salaam: Tsh 2,800, 3,000, 3,100, 3,200, 3,300, 3,400, 3,800.
Masafa = 3,800 - 2,800 = Tsh 1,000
Hii inakuambia bei inasambaa kwa shilingi 1,000 kutoka duka la bei ya chini hadi duka la bei ya juu.
Masafa ni rahisi kuhesabu na kuelewa, lakini ina udhaifu mkubwa: inatumia thamani mbili tu - kubwa na ndogo. Thamani moja isiyo ya kawaida inaweza kuipotosha kabisa.
Alama za wanafunzi 10 katika mtihani: 55, 58, 60, 61, 62, 63, 64, 65, 67, 95.
Masafa = 95 - 55 = 40
Lakini alama 9 kati ya 10 ziko kati ya 55 na 67, masafa ya 12 tu. Mwanafunzi mmoja (95) ameongeza masafa kwa kiasi kikubwa. Masafa haikusemi kwamba thamani nyingi ziko karibu sana.
Tofauti (Variance)
Tofauti inashughulikia udhaifu wa masafa kwa kutumia thamani zote katika data. Inapima jinsi kila thamani inavyotofautiana kutoka wastani, kwa wastani.
Hatua za Kuhesabu Tofauti
- Hesabu wastani (mean) wa data
- Kwa kila thamani, hesabu tofauti yake kutoka wastani
- Piga kila tofauti mraba (ili kuondoa hasi)
- Hesabu wastani wa tofauti zilizopigwa mraba
Mavuno ya kahawa (kilo) kutoka mashamba 5 Kilimanjaro: 200, 250, 300, 350, 400.
Hatua ya 1: Wastani = (200+250+300+350+400) ÷ 5 = 300
Hatua ya 2 na 3: Tofauti kutoka wastani na mraba:
- 200 - 300 = -100, mraba = 10,000
- 250 - 300 = -50, mraba = 2,500
- 300 - 300 = 0, mraba = 0
- 350 - 300 = 50, mraba = 2,500
- 400 - 300 = 100, mraba = 10,000
Hatua ya 4: Wastani wa miraba = (10,000 + 2,500 + 0 + 2,500 + 10,000) ÷ 5 = 25,000 ÷ 5 = 5,000
Tofauti ni 5,000. Lakini nambari hii iko katika "kilo mraba" - ambayo si rahisi kuelewa. Ndiyo maana mara nyingi tunatumia kupotoka kwa kawaida (standard deviation), ambayo ni mzizi wa mraba wa tofauti.
Kwa Nini Tunapiga Mraba?
Jibu ni rahisi: tofauti kutoka wastani zinaweza kuwa chanya au hasi, na tukizijumlisha tu, zitafutana na jumla itakuwa sifuri daima. Kupiga mraba kunafanya thamani zote kuwa chanya, na pia kunazidisha uzito wa tofauti kubwa - tofauti ya 100 ina mraba wa 10,000, lakini tofauti ya 10 ina mraba wa 100 tu.
Tofauti ya Idadi ya Watu na Tofauti ya Sampuli
Kuna tofauti ndogo lakini muhimu:
- Tofauti ya idadi ya watu: Gawanya kwa N (idadi ya thamani). Inatumika ukiwa na data ya kundi zima.
- Tofauti ya sampuli: Gawanya kwa N-1 (idadi ya thamani minus 1). Inatumika ukiwa na sampuli tu na unataka kukadiria tofauti ya idadi nzima ya watu. Kugawanya kwa N-1 kunasahihisha upendeleo mdogo.
Katika mfano wa kahawa hapo juu, kama mashamba 5 ni sampuli kutoka mashamba yote ya Kilimanjaro (si yote):
Tofauti ya sampuli = 25,000 ÷ (5-1) = 25,000 ÷ 4 = 6,250
Tofauti ya sampuli ni kubwa kidogo kuliko tofauti ya idadi ya watu (5,000). Hii ni makusudi - inasaidia kukadiria kwa usahihi zaidi.
Kulinganisha Masafa na Tofauti
- Masafa ni rahisi na haraka, lakini inatumia thamani mbili tu na inaathiriwa sana na thamani kali.
- Tofauti inatumia thamani zote na inatoa picha kamili zaidi, lakini ni ngumu zaidi kuhesabu na matokeo yake (thamani za mraba) si rahisi kutafsiri moja kwa moja.
Mfano wa Vitendo: Bei za Mchele Sokoni
Bei ya kilo ya mchele katika masoko 5 ya Dodoma (Tsh): 2,500, 2,600, 2,700, 2,600, 2,800.
Masafa = 2,800 - 2,500 = 300 - usambazaji mdogo.
Bei ya kilo ya mchele katika masoko 5 ya Dar es Salaam: 2,200, 2,500, 3,000, 3,500, 4,000.
Masafa = 4,000 - 2,200 = 1,800 - usambazaji mkubwa zaidi.
Hata kama wastani wa bei katika miji yote miwili ni sawa, usambazaji unatofautiana sana. Dodoma ina bei thabiti zaidi; Dar es Salaam ina tofauti kubwa kulingana na soko.
Masafa ni tofauti kati ya thamani kubwa na ndogo - ni rahisi lakini inaathiriwa na thamani kali. Tofauti inapima jinsi kila thamani inavyotofautiana kutoka wastani kwa wastani, kwa kutumia thamani zote. Pamoja, wastani na kipimo cha usambazaji vinakupa picha kamili zaidi ya data yako kuliko wastani peke yake.