အပိုင်းအခြားနဲ့ ကွဲပြားမှု

ခက်ခဲမှု: အခြေခံ ဖတ်ရှုချိန်: 10 မိနစ်

ဗဟိုတန်ဖိုးက လုံလောက်ပါသလား?

mean သို့မဟုတ် median သိရုံနဲ့ ဒေတာအကြောင်း ပုံအပြည့်အစုံ မမြင်ရပါဘူး။ မြို့နှစ်မြို့ ပျမ်းမျှ အပူချိန် ၃₀°C တူနိုင်ပေမဲ့ တစ်မြို့က ₂₈-₃₂°C အတွင်း ညီညာပြီး နောက်တစ်မြို့က ₂₀-₄₀°C ကြား ခုန်နေနိုင်ပါတယ်။ ဒီ "ပြန့်ကျဲမှု" ကို တိုင်းတာတဲ့ ကိရိယာတွေက range နဲ့ variance ပါ။

10 12 14 16 18 20 15.0

Range (အပိုင်းအခြား)

Range က အရိုးရှင်းဆုံး ပြန့်ကျဲမှု တိုင်းတာချက်ပါ - အကြီးဆုံး တန်ဖိုးကနေ အငယ်ဆုံး တန်ဖိုးကို နှုတ်ရုံပါ။

Range = အမြင့်ဆုံး - အနိမ့်ဆုံး

ဥပမာ

ဗိုလ်ချုပ်ဈေးမှာ ဆန်တစ်အိတ် (₁ ပိဿာ) ဈေးနှုန်းကို ဆိုင် ₆ ဆိုင်မှာ စစ်ဆေးပါတယ်:

ကျပ် ₂,₂₀₀ · ₂,₃₀₀ · ₂,₃₅₀ · ₂,₄₀₀ · ₂,₄₅₀ · ₂,₈₀₀

Range = ₂,₈₀₀ - ₂,₂₀₀ = ကျပ် ₆₀₀

ဒါက ဈေးအနိမ့်ဆုံးနဲ့ အမြင့်ဆုံးကြား ကွာခြားချက်ကို ပြပါတယ်။

Range ရဲ့ အားနည်းချက်

Range က ကိန်းဂဏန်း နှစ်ခုကိုပဲ ကြည့်ပါတယ် - အကြီးဆုံးနဲ့ အငယ်ဆုံး။ ကျန်တဲ့ ကိန်းဂဏန်းတွေကို လုံးဝ လျစ်လျူရှုပါတယ်။ ခြားနားချက်ကြီးတဲ့ တန်ဖိုး (outlier) တစ်ခုတည်းကြောင့် range အရမ်းကြီးသွားနိုင်ပါတယ်။

Variance (ကွဲပြားမှု)

Variance က ကိန်းဂဏန်းတိုင်း mean ကနေ ဘယ်လောက် ဝေးသလဲဆိုတာ တိုင်းတာပါတယ်။ ကိန်းဂဏန်းတိုင်းကို ထည့်သွင်းစဉ်းစားတဲ့အတွက် range ထက် ပိုပြည့်စုံတဲ့ ပုံရိပ်ပေးပါတယ်။

Variance တွက်ချက်နည်း

  1. Mean ကို တွက်ပါ
  2. ကိန်းဂဏန်းတိုင်းမှာ mean ကို နှုတ်ပါ (ကွာခြားချက်)
  3. ကွာခြားချက်တိုင်းကို နှစ်ထပ်ကိန်း (ထပ်ကိန်း ၂) ယူပါ
  4. နှစ်ထပ်ကိန်းတွေ အကုန် ပေါင်းပါ
  5. အရေအတွက်နဲ့ စားပါ (နမူနာ ဖြစ်ရင် n-₁ နဲ့ စား)
ဥပမာ

MNL ဘောလုံးပွဲ ₅ ပွဲမှာ ပရိသတ် (ရာနဲ့ချီ): ₈₀₀၊ ₁,₂₀₀၊ ₁,₀₀₀၊ ₉₀₀၊ ₁,₁₀₀

အဆင့် ₁: Mean = (₈₀₀ + ₁,₂₀₀ + ₁,₀₀₀ + ₉₀₀ + ₁,₁₀₀) ÷ ₅ = ₁,₀₀₀

အဆင့် ₂-₃: ကွာခြားချက် နဲ့ နှစ်ထပ်ကိန်း:

  • (₈₀₀ - ₁,₀₀₀)² = (-₂₀₀)² = ₄₀,₀₀₀
  • (₁,₂₀₀ - ₁,₀₀₀)² = (₂₀₀)² = ₄₀,₀₀₀
  • (₁,₀₀₀ - ₁,₀₀₀)² = ₀² = ₀
  • (₉₀₀ - ₁,₀₀₀)² = (-₁₀₀)² = ₁₀,₀₀₀
  • (₁,₁₀₀ - ₁,₀₀₀)² = (₁₀₀)² = ₁₀,₀₀₀

အဆင့် ₄-₅: ပေါင်း = ₁₀₀,₀₀₀။ Variance = ₁₀₀,₀₀₀ ÷ ₅ = ₂₀,₀₀₀

ဘာကြောင့် နှစ်ထပ်ကိန်း ယူရသလဲ?

ကွာခြားချက်တွေကို တိုက်ရိုက် ပေါင်းရင် အပြု (+) နဲ့ အနုတ် (-) တွေ ထုတ်ပယ်ပြီး ₀ ရပါတယ်။ နှစ်ထပ်ကိန်းယူခြင်းက အနုတ်ကိန်းတွေကို ဖျက်ပစ်ပြီး ကွာခြားချက် ကြီးတဲ့ တန်ဖိုးတွေကို ပိုအလေးပေးပါတယ်။

နှိုင်းယှဉ်ကြည့်ခြင်း

ဥပမာ

ရန်ကုန် လက်ဖက်ရည်ဆိုင် ₂ ဆိုင်ရဲ့ နေ့စဉ် ဧည့်သည်အရေအတွက် (₅ ရက်):

ဆိုင် A: ₉₈၊ ₁₀₀၊ ₁₀₂၊ ₉₉၊ ₁₀₁ (Mean = ₁₀₀၊ Range = ₄)

ဆိုင် B: ₅₀၊ ₁₅₀၊ ₈₀၊ ₁₃₀၊ ₉₀ (Mean = ₁₀₀၊ Range = ₁₀₀)

Mean တူပေမဲ့ ဆိုင် A က တည်ငြိမ်ပြီး ဆိုင် B က ခန့်မှန်းရ ခက်ပါတယ်။ Range နဲ့ variance က ဒီကွာခြားချက်ကို ဖမ်းယူပေးပါတယ်။ ဆိုင်ပိုင်ရှင်အတွက် ဝန်ထမ်း စီစဉ်ရေးနဲ့ ပစ္စည်း ဝယ်ယူရေးမှာ ဒါက အရေးကြီးပါတယ်။

အဓိကအချက်

Range (အကြီးဆုံး - အငယ်ဆုံး) က ပြန့်ကျဲမှုကို အရိုးရှင်းဆုံး ပြပေမဲ့ ကိန်းဂဏန်း ₂ ခုကိုပဲ ကြည့်ပါတယ်။ Variance က ကိန်းဂဏန်းတိုင်း mean ကနေ ဘယ်လောက် ကွာသလဲ တိုင်းတာပြီး ပိုပြည့်စုံတဲ့ ပုံရိပ်ပေးပါတယ်။ ပျမ်းမျှတန်ဖိုး တစ်ခုတည်းနဲ့ ဒေတာကို ပြည့်စုံစွာ နားလည်လို့ မရပါဘူး - ပြန့်ကျဲမှုကိုလည်း သိရပါတယ်။