အဖြစ်များတဲ့ စာရင်းအင်း အမှားများ

ခက်ခဲမှု: အခြေခံ ဖတ်ရှုချိန်: 10 မိနစ်

ဘာကြောင့် ဒီအမှားတွေကို သိရမလဲ?

စာရင်းအင်း အမှားတွေက နေရာတိုင်းမှာ ရှိပါတယ် - သတင်းမှာ၊ ကြော်ညာမှာ၊ နိုင်ငံရေး မိန့်ခွန်းတွေမှာ။ ဒီအမှားတွေကို သိရင် လှည့်ဖြားခံရမှာ ကာကွယ်နိုင်ပြီး ကိုယ်တိုင်လည်း မှားမှာ ကာကွယ်နိုင်ပါတယ်။

-3 -2 -1 0 1 2 3

₁။ ဆက်နွယ်မှုကို အကြောင်းဆီလျော်မှုနဲ့ ရောထွေးခြင်း

ကိန်းရှင်နှစ်ခု အတူ ပြောင်းလဲတယ်ဆိုတာ တစ်ခုက နောက်တစ်ခုကို ဖြစ်စေတယ်ဆိုတဲ့ အဓိပ္ပါယ် မဟုတ်ပါ။

ဥပမာ

"ဘုရားကျောင်း အကြိမ်ကြိမ် သွားတဲ့ လူတွေ ပိုရှည်ကြာ အသက်ရှင်တယ်" ဆိုတဲ့ လေ့လာမှု။ ဒါက ဘုရားကျောင်းသွားခြင်းက သက်တမ်းရှည်စေတယ်ဆိုတဲ့ အဓိပ္ပါယ် မဟုတ်ပါ - ကျန်းမာတဲ့ လူတွေ ဘုရားကျောင်း ပိုသွားနိုင်တာ ဖြစ်နိုင်ပါတယ် (ဆက်နွယ်မှု ဦးတည်ချက် ပြောင်းပြန်)။

₂။ ဒေတာ ရွေးကောက်ခြင်း (Cherry-Picking)

ကိုယ်ပြောချင်တဲ့ အချက်ကို ထောက်ခံတဲ့ ဒေတာကိုပဲ ရွေးပြီး ဆန့်ကျင်ဘက် ဒေတာကို ဖုံးအုပ်ခြင်း။

ဥပမာ

ကုမ္ပဏီတစ်ခုက "ရောင်းအား ₅ နှစ်ဆက်တိုက် တိုးတက်" ဆိုပြီး ₂₀₂₁-₂₀₂₅ ပြပါတယ်။ ဒါပေမဲ့ ₂₀၁₈-₂₀₂₀ မှာ ₄₀% ကျဆင်းခဲ့တာ ဖုံးကွယ်ထားပါတယ်။ ပုံအပြည့်အစုံ မြင်ဖို့ အချိန်အတိုင်းအတာ ပိုရှည်ပြီး ရှာသင့်ပါတယ်။

₃။ နမူနာ အရွယ်အစား ငယ်ခြင်း

လူ ₅ ယောက်ရဲ့ ရလဒ်ကနေ မြန်မာနိုင်ငံ လူဦးရေ ₅₅ သန်းအကြောင်း ကောက်ချက် ချလို့ မရပါ။

₄။ ရာခိုင်နှုန်း vs ကိန်းဂဏန်း ရောထွေးခြင်း

ဥပမာ

"ဒေသ A မှာ ရာဇဝတ်မှု ₁₀₀% တိုးတယ်" ဆိုတာ ၁ ခု ကနေ ₂ ခု ဖြစ်တာလား ₁,₀₀₀ ကနေ ₂,₀₀₀ ဖြစ်တာလား? ပထမ ကိစ္စမှာ ၁₀₀% ဆိုတာ ထင်ယောင်ထင်မှား ဖြစ်စေပါတယ်။ ဒုတိယ ကိစ္စက တကယ်ပဲ စိတ်ပူစရာပါ။

₅။ Simpson's Paradox

ဒေတာကို စုစုပေါင်း ကြည့်ရင် တစ်မျိုး အုပ်စုခွဲ ကြည့်ရင် တစ်မျိုး ပုံပေါ်ခြင်း။

ဥပမာ

ဆေးရုံ ₂ ခု နှိုင်းယှဉ်: ဆေးရုံ A ရဲ့ စုစုပေါင်း ကုသအောင်မြင်နှုန်း ₈₅% ပြီး B ရဲ့ ₉₀%။ B ပိုကောင်းပုံရ။ ဒါပေမဲ့ ပြင်းထန်တဲ့ ရောဂါနဲ့ မပြင်းထန်တဲ့ ရောဂါ ခွဲကြည့်ရင် - ₂ မျိုးစလုံးမှာ A က B ထက် ပိုကောင်းပါတယ်! ကွာခြားချက်က A မှာ ပြင်းထန်တဲ့ ရောဂါ ပိုများတာကြောင့်ပါ။

₆။ ပျမ်းမျှဆီ ပြန်သွားခြင်း (Regression to the Mean)

ထူးခြားတဲ့ ရလဒ်ပြီးနောက် ပုံမှန်ဆီ ပြန်သွားတာ သဘာဝပါ - ဒါပေမဲ့ လူတွေ "ကုသမှုကြောင့်" လို့ ထင်တတ်ပါတယ်။

ဥပမာ

MNL ဘောလုံးအသင်း ပွဲ ₅ ပွဲ ဆက်တိုက် ရှုံးပြီး နည်းပြ ပြောင်းပါတယ်။ နောက် ₅ ပွဲ ₃ ပွဲ နိုင်ပါတယ်။ "နည်းပြသစ်ကြောင့်" ဆိုကြပေမဲ့ ₅ ပွဲ ဆက်တိုက် ရှုံးတာ ထူးခြားတဲ့ ရလဒ်ဖြစ်ပြီး ပုံမှန်ဆီ ပြန်သွားတာ ဖြစ်နိုင်ပါတယ်။

အဓိကအချက်

အဖြစ်အများဆုံး စာရင်းအင်း အမှားများ: ဆက်နွယ်မှုကို အကြောင်းဆီလျော်မှုနဲ့ ရောထွေးခြင်း၊ ဒေတာ ရွေးကောက်ခြင်း၊ နမူနာ ငယ်ခြင်း၊ ရာခိုင်နှုန်းနဲ့ ကိန်းဂဏန်း ရောထွေးခြင်း၊ Simpson's Paradox နဲ့ ပျမ်းမျှဆီ ပြန်သွားခြင်း။ ဒီအမှားတွေကို သိထားရုံနဲ့ စာရင်းအင်း လှည့်ဖြားမှုအများစုကို ဖော်ထုတ်နိုင်ပါတယ်။