Aina za Data

Kiwango cha Ugumu: Mwanzo Muda wa Kusoma: 10 dakika

Data ni Nini Hasa?

Data ni taarifa zinazokusanywa ili kujibu swali au kuelewa hali fulani. Inaweza kuwa nambari kama vile bei ya mchele sokoni, au maneno kama vile rangi ya gari. Kabla ya kuanza kuchambua data yoyote, ni muhimu kuelewa aina gani ya data unayo, kwa sababu aina tofauti zinahitaji mbinu tofauti za uchambuzi.

25 A 40 B 15 C 30 D 10 F

Aina Mbili Kuu: Data ya Kiidadi na Data ya Kimaelezo

Data yote inaweza kugawanywa katika makundi mawili makuu: data ya kiidadi (quantitative) na data ya kimaelezo (qualitative). Tofauti ni rahisi: Je, data yako ni nambari unayoweza kuhesabu, au ni maelezo yanayoweka vitu katika makundi?

Data ya Kimaelezo (Qualitative)

Data ya kimaelezo inaelezea sifa au kategoria. Huwezi kufanya hesabu za hisabati nayo kwa njia yenye maana. Mfano ni jinsia, mkoa wa nyumbani, aina ya mazao unayolima, au timu ya mpira unayoipenda.

Mfano

Utafiti wa Ofisi ya Taifa ya Takwimu (NBS) unauliza wakulima katika mkoa wa Iringa: "Unalima zao gani kuu?" Majibu ni: chai, mahindi, maharage, kahawa. Hizi ni kategoria, si nambari. Huwezi kusema kahawa ni "kubwa" kuliko mahindi kwa njia ya kihesabu. Hii ni data ya kimaelezo.

Data ya kimaelezo inagawanywa katika aina mbili ndogo:

  • Nominal (Majina): Kategoria zisizo na mpangilio wowote. Mfano: timu za BPL (Simba, Yanga, Azam), aina za mazao (kahawa, chai, pamba), au mitandao ya simu (Vodacom, Airtel, Tigo).
  • Ordinal (Mpangilio): Kategoria zenye mpangilio wa asili, lakini tofauti kati yazo haijulikani kwa usahihi. Mfano: daraja la mtihani wa Form 4 (Division I, II, III, IV), au kiwango cha kuridhika (sana, kiasi, kidogo).
Mfano

Mwanafunzi wa Form 4 anapata Division II katika mtihani wa kitaifa. Mwenzake anapata Division III. Tunajua Division II ni bora kuliko Division III (kuna mpangilio), lakini hatuwezi kusema tofauti kati ya Division II na III ni sawa na tofauti kati ya Division I na II. Hii ni data ya ordinal.

Data ya Kiidadi (Quantitative)

Data ya kiidadi ni nambari zinazoweza kupimwa au kuhesabiwa. Unaweza kufanya hesabu nayo, kama vile kuhesabu wastani au jumla. Mfano ni umri, mapato ya kila mwezi, uzito, au idadi ya watoto.

Mfano

Ofisa wa kilimo anakusanya data ya mavuno ya kahawa kutoka mashamba 10 katika mkoa wa Kilimanjaro. Matokeo ni: kilo 250, 310, 280, 420, 195, 360, 275, 330, 290, 305. Hizi ni nambari za kweli ambazo unaweza kujumlisha, kuhesabu wastani, na kulinganisha. Hii ni data ya kiidadi.

Data ya kiidadi pia inagawanywa katika aina mbili:

  • Discrete (Hesabika): Nambari nzima ambazo huwezi kugawanya. Mfano: idadi ya watoto katika familia (2, 3, 5 - huwezi kuwa na watoto 2.5), idadi ya magoli katika mechi ya BPL, au idadi ya miamala ya M-Pesa kwa siku.
  • Continuous (Endelevu): Nambari zinazoweza kuwa thamani yoyote ndani ya masafa. Mfano: urefu wa mtu (mita 1.72), joto la hewa (nyuzi joto 28.5), au uzito wa mfuko wa kahawa (kilo 2.3).
Mfano

Fikiria duka la M-Pesa linalofuatilia miamala yake. Idadi ya miamala kwa siku (23, 45, 31) ni data ya discrete - huwezi kuwa na miamala 23.7. Lakini kiasi cha pesa kilichohamishwa (Tsh 1,250,000.50) ni data ya continuous - kinaweza kuwa thamani yoyote.

Kwa Nini Aina ya Data Ni Muhimu?

Aina ya data unayoishughulikia inaamua mbinu gani za kitakwimu unaweza kutumia:

  • Data ya kimaelezo ya nominal inaweza tu kuhesabiwa na kuonyeshwa kwa chati za pai au chati za nguzo. Huwezi kuhesabu wastani wa "timu za BPL."
  • Data ya ordinal inaweza kupangwa na kuonyeshwa kwa chati, lakini kuhesabu wastani kunaweza kupotosha.
  • Data ya kiidadi inakupa uhuru mkubwa zaidi - unaweza kuhesabu wastani, thamani ya kati, kupotoka kwa kawaida, na zaidi.

Mfano wa Vitendo: Sensa ya Kilimo

Hebu tuseme Wizara ya Kilimo inafanya utafiti wa mashamba katika mkoa wa Morogoro. Kila shamba linatoa data kadhaa:

  • Aina ya zao: Mpunga, mahindi, ufuta - hii ni data ya kimaelezo (nominal).
  • Ukubwa wa shamba: Ekari 5.2, 3.8, 12.1 - hii ni data ya kiidadi (continuous).
  • Idadi ya wafanyakazi: 3, 7, 12 - hii ni data ya kiidadi (discrete).
  • Kiwango cha rutuba ya udongo: Juu, kati, chini - hii ni data ya kimaelezo (ordinal).

Kila aina ya data itachambuliwa kwa njia tofauti. Hutaweza kuhesabu "wastani wa aina ya zao," lakini unaweza kuhesabu wastani wa ukubwa wa shamba.

Data ya Msingi na Data ya Pili

Kuna njia nyingine ya kugawanya data: kulingana na jinsi ilivyokusanywa.

  • Data ya msingi (Primary): Data unayokusanya mwenyewe kwa lengo maalum. Mfano: kufanya mahojiano na wakulima 100 kuhusu bei ya kahawa.
  • Data ya pili (Secondary): Data iliyokusanywa na mtu mwingine ambayo unaitumia. Mfano: kutumia data ya NBS au Kenya National Bureau of Statistics (KNBS) iliyochapishwa mtandaoni.
Mfano

Mwanafunzi wa Chuo Kikuu cha Dar es Salaam anataka kujua uhusiano kati ya elimu na mapato. Anaweza kukusanya data ya msingi kwa kufanya utafiti mwenyewe, au kutumia data ya pili kutoka sensa ya NBS ya 2022. Data ya pili ni ya haraka na ya bei nafuu, lakini huenda isishughulikie swali lake halisi kwa usahihi.

Makosa ya Kawaida

Kosa la kawaida ni kutibu data ya kimaelezo kana kwamba ni ya kiidadi. Kwa mfano, utafiti unapouliza watu waweke kiwango cha kuridhika kutoka 1 hadi 5, nambari hizo ni za ordinal, si za kweli za kiidadi. Kusema "wastani wa kuridhika ni 3.7" kunaweza kupotosha kwa sababu tofauti kati ya 1 na 2 huenda si sawa na tofauti kati ya 4 na 5 katika mawazo ya watu.

Jambo Muhimu

Data inagawanywa katika aina mbili kuu: kimaelezo (kategoria) na kiidadi (nambari). Data ya kimaelezo inaweza kuwa nominal (bila mpangilio) au ordinal (na mpangilio). Data ya kiidadi inaweza kuwa discrete (hesabika) au continuous (endelevu). Kujua aina ya data unayoishughulikia ni hatua ya kwanza muhimu kabla ya kuchagua mbinu sahihi ya uchambuzi.