Usambazaji wa Uwezekano

Kiwango cha Ugumu: Kati Muda wa Kusoma: 15 dakika

Usambazaji wa Uwezekano ni Nini?

Usambazaji wa uwezekano ni ramani inayoonyesha matokeo yote yanayowezekana ya kigezo na uwezekano wa kila matokeo. Fikiria kama orodha kamili ya "nini kinaweza kutokea na kwa nafasi gani." Badala ya kuangalia tukio moja, unaona picha nzima ya uwezekano wote.

0 9 18 27 36 45 1 2 3 4 5 6 7 8 9

Usambazaji kwa Vigezo Hesabika (Discrete)

Kwa vigezo vinavyochukua thamani za nambari nzima tu, usambazaji unaonyesha uwezekano wa kila thamani.

Mfano

Fikiria idadi ya magoli katika mechi za BPL. Ukiangalia mechi 200 zilizopita, unaweza kupata usambazaji kama huu:

  • Magoli 0: mechi 20 (uwezekano 0.10)
  • Goli 1: mechi 50 (uwezekano 0.25)
  • Magoli 2: mechi 60 (uwezekano 0.30)
  • Magoli 3: mechi 40 (uwezekano 0.20)
  • Magoli 4: mechi 20 (uwezekano 0.10)
  • Magoli 5+: mechi 10 (uwezekano 0.05)

Jumla ya uwezekano wote = 1.00 (kanuni muhimu - lazima zijumlishe hadi 1). Mechi ya magoli 2 ndiyo inayowezekana zaidi.

Usambazaji wa Binomial

Usambazaji wa binomial unatumika unapokuwa na majaribio kadhaa yanayojitegemea, kila moja na matokeo mawili tu (mafanikio au kushindwa), na uwezekano wa mafanikio unabaki sawa.

Mfano

Duka la M-Pesa Mwanza linajua kwamba asilimia 70 ya wateja wanaofika wanafanya muamala (asilimia 30 wanauliza tu na kuondoka). Siku moja wateja 10 wanaingia. Usambazaji wa binomial unaweza kukuambia uwezekano wa wateja kadhaa kufanya muamala. Mfano: uwezekano wa wateja 7 hasa kufanya muamala, au uwezekano wa wateja 8 au zaidi kufanya muamala.

Usambazaji kwa Vigezo Endelevu (Continuous)

Kwa vigezo vinavyoweza kuchukua thamani yoyote (kama urefu, uzito, au mapato), tunatumia mkunjo wa uwezekano badala ya orodha. Uwezekano unawakilishwa na eneo chini ya mkunjo.

140 150 160 170 180 190 200

Usambazaji wa Kawaida (Normal Distribution)

Usambazaji wa kawaida, unaojulikana pia kama "kengele" (bell curve), ndio usambazaji muhimu zaidi katika takwimu. Unaonekana kama kengele: juu katikati na upande unashuka sawa pande zote mbili.

Sifa zake kuu:

  • Unalingana - upande wa kushoto ni kioo cha upande wa kulia
  • Wastani, thamani ya kati, na modi ni sawa na ziko katikati
  • Thamani nyingi ziko karibu na katikati; chache sana ziko mbali
Mfano

Alama za mtihani wa taifa wa Form 4 kwa wanafunzi 500,000 mara nyingi zinafuata usambazaji wa kawaida. Wanafunzi wengi wanapata alama karibu na wastani (tuseme pointi 250 kati ya 500). Wachache sana wanapata alama za juu sana (450+) au za chini sana (50-). Ukichora grafu, itaonekana kama kengele.

Kanuni ya 68-95-99.7

Kwa usambazaji wa kawaida, kuna kanuni muhimu sana:

  • Asilimia 68 ya data iko ndani ya kupotoka moja kwa kawaida (1 SD) kutoka wastani
  • Asilimia 95 ya data iko ndani ya kupotoka mbili kwa kawaida (2 SD) kutoka wastani
  • Asilimia 99.7 ya data iko ndani ya kupotoka tatu kwa kawaida (3 SD) kutoka wastani
Mfano

Wastani wa mapato ya kaya za Dar es Salaam ni Tsh 800,000 kwa mwezi, na kupotoka kwa kawaida ni Tsh 200,000. Kama mapato yanafuata usambazaji wa kawaida:

  • Asilimia 68 ya kaya zinapata kati ya Tsh 600,000 na Tsh 1,000,000
  • Asilimia 95 zinapata kati ya Tsh 400,000 na Tsh 1,200,000
  • Asilimia 99.7 zinapata kati ya Tsh 200,000 na Tsh 1,400,000

Kaya inayopata zaidi ya Tsh 1,400,000 ni nadra sana - chini ya asilimia 0.15 ya kaya.

Usambazaji Unaopinda (Skewed Distributions)

Sio data yote inafuata usambazaji wa kawaida. Mapato halisi, kwa mfano, mara nyingi yanapinda upande wa kulia - watu wengi wanapata mapato ya chini au kati, na wachache wanapata mapato makubwa sana.

Mfano

Bei ya nyumba katika Dar es Salaam: nyumba nyingi ni kati ya Tsh 50-150 milioni. Lakini kuna nyumba chache za Tsh 500 milioni hadi bilioni 2 katika maeneo kama Masaki na Oyster Bay. Usambazaji unapinda kulia - mkia mrefu upande wa kulia unaonyesha bei za juu zisizo za kawaida.

Usambazaji Mwingine Muhimu

  • Usambazaji wa Poisson: Unatumika kwa matukio adimu katika muda au eneo fulani. Mfano: idadi ya ajali za barabarani kwa siku katika Dar es Salaam.
  • Usambazaji Sawa (Uniform): Kila matokeo yana uwezekano sawa. Mfano: nambari unayopata ukigeuza kete safi.

Kwa Nini Usambazaji Ni Muhimu?

Kuelewa usambazaji wa data yako kunakusaidia:

17 1 16 2 17 3 16 4 17 5 17 6
  • Kuchagua mbinu sahihi ya uchambuzi (mbinu nyingi zinahitaji usambazaji wa kawaida)
  • Kutambua thamani zisizo za kawaida (outliers)
  • Kufanya utabiri - uwezekano wa matokeo fulani kutokea
  • Kuelewa jinsi data yako inavyosambaa na inapokolea
Jambo Muhimu

Usambazaji wa uwezekano unaonyesha matokeo yote yanayowezekana na uwezekano wao. Usambazaji wa kawaida (kengele) ndio muhimu zaidi - unalingana, na data nyingi ziko karibu na wastani. Kanuni ya 68-95-99.7 inakuambia jinsi data inavyosambaa. Sio data yote ni ya kawaida - mapato na bei mara nyingi zinapinda upande mmoja. Kujua umbo la usambazaji wako ni hatua muhimu kabla ya uchambuzi wowote.