Idadi ya Watu ni Nini?
Katika takwimu, "idadi ya watu" (population) haimaanishi tu watu. Inamaanisha kundi zima la vitu unavyovipendezwa navyo. Inaweza kuwa watu wote wa Tanzania, magari yote yaliyosajiliwa Nairobi, mashamba yote ya chai katika mkoa wa Tanga, au miamala yote ya M-Pesa iliyofanywa juzi.
Tatizo ni kwamba mara nyingi ni vigumu au haiwezekani kukusanya data kutoka kwa kila kitu katika idadi ya watu. Tanzania ina zaidi ya watu milioni 65. Huwezi kuwafikia wote.
Sampuli ni Nini?
Sampuli ni sehemu ndogo ya idadi ya watu inayochaguliwa kuiwakilisha. Badala ya kuuliza Watanzania wote milioni 65 kuhusu mapato yao, unachagua kaya 5,000 na kuuliza wao. Kisha unatumia matokeo ya kaya hizo 5,000 kukadiria hali ya nchi nzima.
Taasisi ya Taifa ya Takwimu (NBS) inataka kujua kiwango cha umaskini Tanzania. Kufanya sensa kamili ingehitaji miaka na fedha nyingi sana. Badala yake, NBS inachagua kaya 10,000 kutoka mikoa yote na kukusanya data yao. Kaya hizo 10,000 ni sampuli. Watanzania wote ndio idadi ya watu.
Kwa Nini Sampuli Zinafanya Kazi?
Inaweza kuonekana ya ajabu kwamba kuuliza watu 5,000 kunaweza kukuambia kuhusu watu milioni 65. Lakini fikiria hivi: unapojaribu supu, huhitaji kunywa sufuria nzima. Kijiko kimoja kinatosha kukupa wazo la ladha, mradi supu imekanga vizuri. Kwa njia hiyo hiyo, sampuli iliyochaguliwa vizuri inaweza kukupa picha sahihi ya idadi nzima ya watu.
Siri ni katika jinsi unavyochagua sampuli yako. Sampuli nzuri inawakilisha idadi ya watu kwa usahihi. Sampuli mbaya inaweza kupotosha matokeo yako kabisa.
Sampuli ya Nasibu Rahisi
Njia bora zaidi ni kuhakikisha kila mtu katika idadi ya watu ana nafasi sawa ya kuchaguliwa. Hii inaitwa sampuli ya nasibu rahisi (simple random sample). Ni kama kuweka majina ya watu wote kwenye kofia na kuchagua bila kuangalia.
Mkurugenzi wa shule ya sekondari ya Mzumbe anataka kujua jinsi wanafunzi 800 wanavyojisikia kuhusu chakula cha shuleni. Hawezi kuwahojiwa wote. Anaweka nambari za wanafunzi wote kwenye kompyuta na kuchagua 80 kwa nasibu. Kila mwanafunzi ana nafasi sawa ya kuchaguliwa - 1 kati ya 10. Hiyo ni sampuli ya nasibu rahisi.
Sampuli ya Tabaka
Wakati mwingine unataka kuhakikisha makundi mbalimbali yanawakilishwa. Unagawanya idadi ya watu katika makundi (tabaka) na kuchagua sampuli kutoka kila kundi.
Kenya National Bureau of Statistics (KNBS) inataka kujua kiwango cha ajira. Wanagawanya nchi katika mikoa 47, kisha wanachagua kaya kutoka kila mkoa kulingana na ukubwa wake. Hii inahakikisha mkoa wa Nairobi wenye watu wengi na mkoa mdogo wa Lamu wote wanawakilishwa.
Tatizo la Sampuli Mbaya
Ukichagua sampuli vibaya, matokeo yako yatakuwa potovu. Hii inaitwa "upendeleo wa sampuli" (sampling bias).
Mfanyabiashara wa Kariakoo anataka kujua kama wateja wanaridhika na huduma yake. Anawauliza wateja 20 walioko dukani siku ya Jumamosi. Tatizo? Wateja wa Jumamosi huenda ni tofauti na wateja wa siku nyingine. Labda Jumamosi watu wa vijijini wanakuja jijini na wana mahitaji tofauti. Sampuli yake haijumuishi wateja wa siku za kawaida, kwa hivyo matokeo yanaweza kupotosha.
Parameter na Statistic
Maneno mawili muhimu ya kujua:
- Parameter: Nambari inayoelezea idadi nzima ya watu. Mfano: wastani wa mapato wa Watanzania wote. Kawaida haijulikani na ndiyo tunayojaribu kukadiria.
- Statistic: Nambari inayoelezea sampuli. Mfano: wastani wa mapato wa kaya 5,000 tulizozichunguza. Hii inajulikana na tunatumia kukadiria parameter.
NBS inachunguza kaya 10,000 na kupata wastani wa mapato ni Tsh 850,000 kwa mwezi. Hiyo ni statistic. Wastani wa kweli wa mapato ya Watanzania wote (parameter) haujulikani - lakini Tsh 850,000 ni makadirio bora zaidi tuliyonayo.
Ukubwa wa Sampuli Unaleta Tofauti
Sampuli kubwa zaidi kwa kawaida inatoa makadirio sahihi zaidi, lakini kuna mpaka. Kuongeza sampuli kutoka 100 hadi 1,000 kunaleta tofauti kubwa. Lakini kuongeza kutoka 10,000 hadi 100,000 kunaleta tofauti ndogo tu. Kuna hatua ambayo gharama ya kukusanya data zaidi haifai tena.
Kura za maoni za uchaguzi wa Tanzania mara nyingi zinahoji watu 2,000 hadi 5,000 tu, lakini bado zinaweza kutabiri matokeo kwa usahihi mkubwa - mradi sampuli imechaguliwa vizuri.
Idadi ya watu ni kundi zima unavyolipendezwa nalo. Sampuli ni sehemu ndogo inayochaguliwa kuliwakilisha. Sampuli nzuri ni ile inayochaguliwa kwa nasibu na kuwakilisha makundi yote muhimu. Parameter inaelezea idadi ya watu (kawaida haijulikani), na statistic inaelezea sampuli (inajulikana). Ubora wa sampuli ni muhimu zaidi kuliko ukubwa wake - sampuli ndogo iliyochaguliwa vizuri ni bora kuliko sampuli kubwa yenye upendeleo.