Asilimia ni Nini?
Asilimia inakuambia asilimia ngapi ya thamani katika seti ya data zinaanguka chini ya hatua fulani. Ikiwa alama yako ya mtihani iko kwenye asilimia ya 85, ina maana ulipata alama zaidi kuliko 85% ya wafanya mtihani. Haimaanishi ulipata 85% ya maswali kwa usahihi -- asilimia zinaelezea nafasi yako kulingana na kila mtu mwingine, si utendaji wako kamili.
Asilimia zinatumika kila mahali. Madaktari wa watoto wanafuatilia urefu na uzito wa watoto kwa kutumia chati za asilimia. Mitihani iliyosanifishwa kama SAT na GRE inaripoti alama kama asilimia. Uchunguzi wa mishahara unaelezea malipo katika asilimia ili makampuni yaweze kuona wanaposhindana sokoni.
Asilimia zinazorejelewa zaidi ni robo, ambazo zinagawa data katika sehemu nne sawa. Asilimia ya 25 inaitwa Q1 (robo ya kwanza), asilimia ya 50 ni Q2 (kati), na asilimia ya 75 ni Q3 (robo ya tatu). Pamoja na kiwango cha chini na cha juu, thamani hizi tano zinaunda muhtasari wa nambari tano -- picha fupi ya seti nzima ya data.
Katika chati ya nukta hapo juu, unaweza kuona jinsi thamani nyingi zinavyojikusanya katika miaka ya 20 na 30, na thamani chache za chini na thamani moja ya juu inayozidi kwenye 55. Asilimia zinatusaidia kuelezea usambazaji huu kwa ufupi bila kuhitaji kuorodhesha kila hatua ya data.
Muhtasari wa Nambari Tano
Muhtasari wa nambari tano una thamani tano: kiwango cha chini, Q1, kati, Q3, na kiwango cha juu. Nambari hizi tano zinakuambia data inaanzia wapi, asilimia 50 ya katikati inakaa wapi, na data inaishia wapi.
Fikiria mapato ya kila siku ya mhudumu wa mezani kwa zamu 20: $12, $15, $17, $19, $21, $22, $23, $24, $25, $26, $27, $28, $29, $30, $31, $33, $35, $38, $42, $55. Muhtasari wa nambari tano ungekuwa: Kiwango cha chini = $12, Q1 = $20, Kati = $26.50, Q3 = $32, Kiwango cha juu = $55. Kwa mtazamo, unaweza kuona kuwa asilimia 50 ya katikati ya mapato inaanguka kati ya $20 na $32, mapato ya kawaida ni karibu $26-$27, na kuna siku moja isiyo ya kawaida ya mapato makubwa kwenye $55.
Masafa ya Kati ya Robo (IQR)
Masafa ya kati ya robo ni Q3 toa Q1 tu. Inapima mwenendo wa asilimia 50 ya katikati ya data yako, ikipuuza miisho. Katika mfano wa mhudumu, IQR = $32 - $20 = $12.
IQR ni kipimo imara zaidi cha mwenendo kuliko masafa (kiwango cha juu toa kiwango cha chini) kwa sababu haiathiriwi na thamani za kupindukia. Masafa ya mhudumu ni $55 - $12 = $43, ambayo inaathiriwa sana na siku hiyo moja ya mapato makubwa. IQR ya $12 inatoa picha sahihi zaidi ya tofauti ya kila siku.
IQR pia inatumika kutambua thamani za kupindukia. Kanuni ya kawaida inasema kuwa thamani yoyote chini ya Q1 - 1.5 * IQR au juu ya Q3 + 1.5 * IQR ni thamani inayoweza kupindukia. Katika mfano wa mhudumu, ukingo wa juu ungekuwa $32 + 1.5 * $12 = $50. Siku ya mapato ya $55 inazidi kizingiti hiki, ikithibitisha kuwa ni thamani ya kupindukia ya kitakwimu.
Kusoma Chati ya Sanduku
Chati ya sanduku (pia inaitwa chati ya sanduku-na-ndevu) ni uwakilishi wa kuona wa muhtasari wa nambari tano. Sanduku linaenea kutoka Q1 hadi Q3, na mstari ndani ukionyesha kati. "Ndevu" zinaenea kutoka sanduku hadi thamani ndogo na kubwa zaidi zisizo za kupindukia. Thamani zozote za kupindukia zinaonekana kama nukta za mtu binafsi zaidi ya ndevu.
Chati za sanduku ni muhimu hasa kwa kulinganisha vikundi vingi bega kwa bega. Ukitaka kulinganisha mapato katika migahawa mitatu tofauti, chati tatu za sanduku zilizowekwa karibu zingeonyesha mara moja mgahawa upi una mapato ya kawaida ya juu, upi una tofauti zaidi, na upi una thamani za kupindukia zaidi.
Chati ya baa hapo juu inawakilisha thamani za muhtasari wa nambari tano kama baa ili uweze kuona nafasi zao za jamaa. Angalia pengo kati ya Q3 na kiwango cha juu -- kutokuwa na ulinganifu huku kunaonyesha data inaelekea kulia, na mkia mrefu kuelekea thamani za juu.
Chati za Sanduku Zinaonyesha Nini Kuhusu Umbo
Chati za sanduku zinaweza kukuambia kuhusu mwelekeo wa usambazaji. Ikiwa mstari wa kati uko katikati ya sanduku na ndevu ni sawa kwa urefu takriban, data ni sawa. Ikiwa kati iko karibu na Q1 na ndevu ya juu ni ndefu, data inaelekea kulia (mkia mrefu wa thamani za juu). Ikiwa kati iko karibu na Q3 na ndevu ya chini ni ndefu, data inaelekea kushoto.
Kwa mfano, data ya mapato karibu kila wakati inazalisha chati ya sanduku inayoelekea kulia: kati iko chini katika sanduku, ndevu ya juu ni ndefu, na kuna thamani nyingi za kupindukia upande wa juu. Alama za mtihani katika kozi iliyoundwa vizuri mara nyingi zinazalisha chati ya sanduku inayoelekea kushoto: wanafunzi wengi wanafanya vizuri, lakini wachache wanavuta ndevu ya chini chini.
Chati za sanduku zinapoteza baadhi ya maelezo kulinganisha na histogramu -- huwezi kuona umbo halisi la usambazaji au kutambua vilele vingi. Lakini zinafaa sana katika ulinganisho wa kifupi na kugundua thamani za kupindukia, ndiyo maana ni msingi katika uchambuzi wa data wa uchunguzi.
Asilimia zinapanga thamani kulingana na data nyingine, na robo (Q1, kati, Q3) zikiwa alama muhimu zaidi. Muhtasari wa nambari tano na IQR zinatoa picha fupi, isiyoathiriwa na kupindukia ya seti yoyote ya data. Chati za sanduku zinabadilisha muhtasari huu kuwa picha inayoonyesha katikati, mwenendo, mwelekeo, na kupindukia kwa mtazamo -- na kuifanya kuwa bora kwa ulinganisho wa haraka kati ya vikundi vingi.