اعداد ایماندار اور گمراہ کن ایک ساتھ ہو سکتے ہیں
ہر روز آپ پر شماریات کی بارش ہوتی ہے۔ "تحقیق دکھاتی ہے سبز چائے عمر بڑھاتی ہے۔" "جرائم 200 فیصد بڑھ گئے۔" "10 میں سے 9 ڈاکٹر اس دوائی کی سفارش کرتے ہیں۔" یہ بیانات سب حقیقی ڈیٹا پر مبنی ہو سکتے ہیں لیکن ہر ایک آپ کو مسخ شدہ تصویر دے سکتا ہے۔
سوال 1: نمونہ کتنا بڑا ہے؟
"80 فیصد لوگوں نے ہماری نئی چائے پسند کی!" - اگر صرف 5 لوگوں سے پوچھا گیا تو 80 فیصد کا مطلب 4 لوگ ہیں۔ یہ نتیجہ بے معنی ہے۔ 500 لوگوں کا 80 فیصد بہت زیادہ قابل اعتماد ہے۔
سوال 2: نمونہ کس سے لیا گیا؟
کسے پوچھا گیا اتنا ہی اہم ہے جتنا کہ کتنوں سے پوچھا گیا۔
"پاکستانیوں کی اکثریت آن لائن شاپنگ پسند کرتی ہے" - اگر یہ سروے صرف شہری نوجوانوں میں ہوا تو دیہی آبادی کی نمائندگی نہیں ہوتی جو پاکستان کی اکثریت ہے۔
سوال 3: مطلق اعداد ہیں یا نسبتی؟
"دوگنا خطرہ!" خوفناک لگتا ہے۔ لیکن اگر اصل خطرہ 1 لاکھ میں 1 تھا تو دوگنا خطرہ 1 لاکھ میں 2 ہے - ابھی بھی بہت کم!
خبر: "نئی دوائی دل کے دورے کا خطرہ 50 فیصد کم کرتی ہے!" حیرت انگیز لگتا ہے۔ لیکن:
بغیر دوائی: 100 میں سے 2 لوگوں کو دل کا دورہ (2 فیصد)
دوائی کے ساتھ: 100 میں سے 1 کو دل کا دورہ (1 فیصد)
نسبتی فرق: 50 فیصد کمی (بڑا لگتا ہے!)۔ مطلق فرق: 1 فیصد (چھوٹا لگتا ہے)۔ دونوں سچ ہیں لیکن بالکل مختلف تاثر دیتے ہیں۔
سوال 4: موازنہ کس سے ہے؟
"جرائم 200 فیصد بڑھ گئے" - کس مقابلے میں؟ پچھلے سال؟ پچھلے مہینے؟ 50 سال پہلے؟ موازنے کا نقطہ نتیجے کو بالکل بدل سکتا ہے۔
سوال 5: کون سی "اوسط" استعمال ہوئی؟
Mean، Median، یا Mode - تینوں مختلف کہانیاں بتاتے ہیں۔ جب آپ "اوسط" سنیں تو پوچھیں کون سی اوسط۔
"پاکستان میں اوسط ماہانہ آمدنی 60,000 روپے ہے" - اگر یہ Mean ہے تو چند بہت امیر لوگوں نے اسے اوپر کھینچا ہو سکتا ہے۔ Median (درمیانی) شاید 35,000 ہو - جو عام شخص کے تجربے کے زیادہ قریب ہے۔
سوال 6: ہم آہنگی ہے یا سببیت؟
"جو لوگ X کرتے ہیں ان کو Y زیادہ ہوتا ہے" کا مطلب X نے Y کا سبب بنایا ضروری نہیں۔ کوئی تیسرا عنصر دونوں کو چلا رہا ہو سکتا ہے۔
سوال 7: تحقیق کس نے کروائی؟
فنڈنگ کا ذریعہ اہم ہے۔ اگر چینی کمپنی نے تحقیق کروائی جو کہتی ہے "چینی نقصان دہ نہیں" تو ممکنہ مفاد کا ٹکراؤ ہے۔
ایک تمباکو کمپنی کی فنڈ کردہ تحقیق بتاتی ہے "تمباکو نوشی اور پھیپھڑوں کے سرطان کا تعلق واضح نہیں۔" آزاد تحقیق بتاتی ہے مضبوط تعلق ہے۔ فنڈنگ کا ذریعہ نتائج متاثر کر سکتا ہے - ہمیشہ دیکھیں۔
سوال 8: گراف ایماندار ہے؟
- کیا y-محور صفر سے شروع ہوتا ہے؟
- کیا پیمانے برابر ہیں؟
- کیا کوئی ڈیٹا چھپایا گیا ہے؟
ایک فوری چیک لسٹ
- نمونے کا حجم کیا ہے؟
- نمونہ کس آبادی سے لیا گیا؟
- مطلق اعداد کیا ہیں (صرف فیصد نہیں)؟
- موازنہ کس سے ہے؟
- کون سی "اوسط" ہے؟
- ہم آہنگی ہے یا سببیت?
- تحقیق کس نے کروائی اور فنڈ کیا؟
شماریات طاقتور ہیں لیکن آسانی سے گمراہ کن بھی۔ جب آپ خبروں یا اشتہارات میں اعداد دیکھیں تو چند سادہ سوالات پوچھیں: نمونہ کتنا بڑا ہے؟ کس سے لیا گیا؟ مطلق اعداد کیا ہیں؟ کون سی اوسط؟ ہم آہنگی ہے یا سببیت؟ تحقیق کس نے فنڈ کی؟ یہ سوالات آپ کو باخبر صارف بناتے ہیں جو اعداد کے پیچھے حقیقت دیکھ سکتا ہے۔