ဗဟိုတန်ဖိုးက လုံလောက်ပါသလား?
mean သို့မဟုတ် median သိရုံနဲ့ ဒေတာအကြောင်း ပုံအပြည့်အစုံ မမြင်ရပါဘူး။ မြို့နှစ်မြို့ ပျမ်းမျှ အပူချိန် ၃₀°C တူနိုင်ပေမဲ့ တစ်မြို့က ₂₈-₃₂°C အတွင်း ညီညာပြီး နောက်တစ်မြို့က ₂₀-₄₀°C ကြား ခုန်နေနိုင်ပါတယ်။ ဒီ "ပြန့်ကျဲမှု" ကို တိုင်းတာတဲ့ ကိရိယာတွေက range နဲ့ variance ပါ။
Range (အပိုင်းအခြား)
Range က အရိုးရှင်းဆုံး ပြန့်ကျဲမှု တိုင်းတာချက်ပါ - အကြီးဆုံး တန်ဖိုးကနေ အငယ်ဆုံး တန်ဖိုးကို နှုတ်ရုံပါ။
Range = အမြင့်ဆုံး - အနိမ့်ဆုံး
ဗိုလ်ချုပ်ဈေးမှာ ဆန်တစ်အိတ် (₁ ပိဿာ) ဈေးနှုန်းကို ဆိုင် ₆ ဆိုင်မှာ စစ်ဆေးပါတယ်:
ကျပ် ₂,₂₀₀ · ₂,₃₀₀ · ₂,₃₅₀ · ₂,₄₀₀ · ₂,₄₅₀ · ₂,₈₀₀
Range = ₂,₈₀₀ - ₂,₂₀₀ = ကျပ် ₆₀₀
ဒါက ဈေးအနိမ့်ဆုံးနဲ့ အမြင့်ဆုံးကြား ကွာခြားချက်ကို ပြပါတယ်။
Range ရဲ့ အားနည်းချက်
Range က ကိန်းဂဏန်း နှစ်ခုကိုပဲ ကြည့်ပါတယ် - အကြီးဆုံးနဲ့ အငယ်ဆုံး။ ကျန်တဲ့ ကိန်းဂဏန်းတွေကို လုံးဝ လျစ်လျူရှုပါတယ်။ ခြားနားချက်ကြီးတဲ့ တန်ဖိုး (outlier) တစ်ခုတည်းကြောင့် range အရမ်းကြီးသွားနိုင်ပါတယ်။
Variance (ကွဲပြားမှု)
Variance က ကိန်းဂဏန်းတိုင်း mean ကနေ ဘယ်လောက် ဝေးသလဲဆိုတာ တိုင်းတာပါတယ်။ ကိန်းဂဏန်းတိုင်းကို ထည့်သွင်းစဉ်းစားတဲ့အတွက် range ထက် ပိုပြည့်စုံတဲ့ ပုံရိပ်ပေးပါတယ်။
Variance တွက်ချက်နည်း
- Mean ကို တွက်ပါ
- ကိန်းဂဏန်းတိုင်းမှာ mean ကို နှုတ်ပါ (ကွာခြားချက်)
- ကွာခြားချက်တိုင်းကို နှစ်ထပ်ကိန်း (ထပ်ကိန်း ၂) ယူပါ
- နှစ်ထပ်ကိန်းတွေ အကုန် ပေါင်းပါ
- အရေအတွက်နဲ့ စားပါ (နမူနာ ဖြစ်ရင် n-₁ နဲ့ စား)
MNL ဘောလုံးပွဲ ₅ ပွဲမှာ ပရိသတ် (ရာနဲ့ချီ): ₈₀₀၊ ₁,₂₀₀၊ ₁,₀₀₀၊ ₉₀₀၊ ₁,₁₀₀
အဆင့် ₁: Mean = (₈₀₀ + ₁,₂₀₀ + ₁,₀₀₀ + ₉₀₀ + ₁,₁₀₀) ÷ ₅ = ₁,₀₀₀
အဆင့် ₂-₃: ကွာခြားချက် နဲ့ နှစ်ထပ်ကိန်း:
- (₈₀₀ - ₁,₀₀₀)² = (-₂₀₀)² = ₄₀,₀₀₀
- (₁,₂₀₀ - ₁,₀₀₀)² = (₂₀₀)² = ₄₀,₀₀₀
- (₁,₀₀₀ - ₁,₀₀₀)² = ₀² = ₀
- (₉₀₀ - ₁,₀₀₀)² = (-₁₀₀)² = ₁₀,₀₀₀
- (₁,₁₀₀ - ₁,₀₀₀)² = (₁₀₀)² = ₁₀,₀₀₀
အဆင့် ₄-₅: ပေါင်း = ₁₀₀,₀₀₀။ Variance = ₁₀₀,₀₀₀ ÷ ₅ = ₂₀,₀₀₀
ဘာကြောင့် နှစ်ထပ်ကိန်း ယူရသလဲ?
ကွာခြားချက်တွေကို တိုက်ရိုက် ပေါင်းရင် အပြု (+) နဲ့ အနုတ် (-) တွေ ထုတ်ပယ်ပြီး ₀ ရပါတယ်။ နှစ်ထပ်ကိန်းယူခြင်းက အနုတ်ကိန်းတွေကို ဖျက်ပစ်ပြီး ကွာခြားချက် ကြီးတဲ့ တန်ဖိုးတွေကို ပိုအလေးပေးပါတယ်။
နှိုင်းယှဉ်ကြည့်ခြင်း
ရန်ကုန် လက်ဖက်ရည်ဆိုင် ₂ ဆိုင်ရဲ့ နေ့စဉ် ဧည့်သည်အရေအတွက် (₅ ရက်):
ဆိုင် A: ₉₈၊ ₁₀₀၊ ₁₀₂၊ ₉₉၊ ₁₀₁ (Mean = ₁₀₀၊ Range = ₄)
ဆိုင် B: ₅₀၊ ₁₅₀၊ ₈₀၊ ₁₃₀၊ ₉₀ (Mean = ₁₀₀၊ Range = ₁₀₀)
Mean တူပေမဲ့ ဆိုင် A က တည်ငြိမ်ပြီး ဆိုင် B က ခန့်မှန်းရ ခက်ပါတယ်။ Range နဲ့ variance က ဒီကွာခြားချက်ကို ဖမ်းယူပေးပါတယ်။ ဆိုင်ပိုင်ရှင်အတွက် ဝန်ထမ်း စီစဉ်ရေးနဲ့ ပစ္စည်း ဝယ်ယူရေးမှာ ဒါက အရေးကြီးပါတယ်။
Range (အကြီးဆုံး - အငယ်ဆုံး) က ပြန့်ကျဲမှုကို အရိုးရှင်းဆုံး ပြပေမဲ့ ကိန်းဂဏန်း ₂ ခုကိုပဲ ကြည့်ပါတယ်။ Variance က ကိန်းဂဏန်းတိုင်း mean ကနေ ဘယ်လောက် ကွာသလဲ တိုင်းတာပြီး ပိုပြည့်စုံတဲ့ ပုံရိပ်ပေးပါတယ်။ ပျမ်းမျှတန်ဖိုး တစ်ခုတည်းနဲ့ ဒေတာကို ပြည့်စုံစွာ နားလည်လို့ မရပါဘူး - ပြန့်ကျဲမှုကိုလည်း သိရပါတယ်။