اوسط کافی نہیں
تصور کریں دو شہروں - لاہور اور اسلام آباد - کا اوسط ماہانہ درجہ حرارت 25 ڈگری سیلسیس ہے۔ لگتا ہے دونوں کا موسم ملتا جلتا ہے؟ لیکن اگر لاہور میں درجہ حرارت 5 ڈگری سے 48 ڈگری تک جائے جبکہ اسلام آباد میں 15 سے 35 تک رہے تو رہنے کا تجربہ بالکل مختلف ہے۔
اسی لیے ہمیں پھیلاؤ ناپنے کی ضرورت ہے - ڈیٹا کی قدریں ایک دوسرے سے کتنی مختلف ہیں۔ پھیلاؤ ناپنے کے دو اہم اوزار رینج اور تغیر (Variance) ہیں۔
رینج: سب سے سادہ پیمائش
رینج سب سے بڑی اور سب سے چھوٹی قدر کا فرق ہے۔ بس۔
رینج = زیادہ سے زیادہ - کم سے کم
PSL میں ایک بلے باز کے پانچ میچوں کے رنز: 12، 45، 78، 23، 95
رینج = 95 - 12 = 83 رنز
ایک بڑی رینج بتاتی ہے کہ بلے باز کی کارکردگی بہت اتار چڑھاؤ والی ہے - کبھی 12 تو کبھی 95۔
رینج کی حدود
رینج صرف دو انتہائی قدریں استعمال کرتی ہے اور درمیان کا سب کچھ نظرانداز کرتی ہے۔ ایک بھی غیر معمولی قدر رینج کو بہت بڑا بنا سکتی ہے۔
10 طلبا کے میٹرک کے نمبر: 65، 68، 70، 71، 72، 73، 74، 75، 76، 98
رینج = 98 - 65 = 33۔ لیکن 9 طلبا 65 سے 76 کے درمیان ہیں (رینج صرف 11)۔ ایک طالب علم (98 نمبر والا) نے رینج کو بہت بڑا بنا دیا۔
تغیر (Variance): بہتر پیمائش
تغیر ہر قدر کا اوسط سے فاصلہ ناپتا ہے، اوسطاً۔ یہ رینج سے بہتر ہے کیونکہ یہ ہر قدر کو مدنظر رکھتا ہے، صرف دو انتہاؤں کو نہیں۔
حساب کا طریقہ
- اوسط نکالیں۔
- ہر قدر سے اوسط منفی کریں (یہ "انحراف" ہیں)۔
- ہر انحراف کو مربع کریں (تاکہ منفی اعداد مثبت ہو جائیں)۔
- مربعوں کی اوسط نکالیں۔
5 دنوں میں فروخت ہونے والے نان: 80، 90، 100، 110، 120
مرحلہ 1: اوسط = (80+90+100+110+120) ÷ 5 = 100
مرحلہ 2: انحراف: -20، -10، 0، +10، +20
مرحلہ 3: مربع: 400، 100، 0، 100، 400
مرحلہ 4: مربعوں کی اوسط = (400+100+0+100+400) ÷ 5 = 200
تغیر 200 ہے۔ یہ "مربع نان" کی اکائی میں ہے جو قدرے عجیب ہے - اسی لیے ہم معیاری انحراف (اگلے سبق میں) استعمال کرتے ہیں۔
نمونے کا تغیر بمقابلہ آبادی کا تغیر
ایک اہم نکتہ: جب آپ نمونے سے تغیر نکالتے ہیں (جو عام صورت ہے) تو آخری مرحلے میں n کی بجائے n-1 سے تقسیم کرتے ہیں۔ اس کی ریاضیاتی وجہ ہے لیکن سادہ طور پر یہ نمونے کو آبادی کا بہتر اندازہ لگانے دیتا ہے۔
اوپر کی مثال اگر نمونہ ہے تو:
نمونے کا تغیر = (400+100+0+100+400) ÷ (5-1) = 1000 ÷ 4 = 250
تغیر کا کیا مطلب ہے؟
- تغیر صفر: تمام قدریں بالکل ایک جیسی ہیں۔ کوئی پھیلاؤ نہیں۔
- چھوٹا تغیر: قدریں اوسط کے قریب ہیں۔ مستقل مزاج ہے۔
- بڑا تغیر: قدریں اوسط سے بہت دور دور ہیں۔ بہت اتار چڑھاؤ ہے۔
دو کسان ہر ایک 30 من فی ایکڑ گندم کی اوسط پیداوار رکھتے ہیں۔
کسان الف کی پانچ سالہ پیداوار: 28، 29، 30، 31، 32 (تغیر = 2.5)
کسان ب کی پانچ سالہ پیداوار: 10، 20، 30، 40، 50 (تغیر = 250)
کسان الف مستقل ہے - آپ اگلے سال 30 کے قریب کی توقع کر سکتے ہیں۔ کسان ب کے ساتھ کچھ بھی ہو سکتا ہے۔ بینک قرضے کے لیے کسان الف کو ترجیح دے گا۔
کیوں پھیلاؤ اہم ہے
- سرمایہ کاری: دو اسٹاکس کی اوسط واپسی 10 فیصد ہے۔ ایک ہر سال 8-12 فیصد دیتا ہے (کم تغیر)، دوسرا -20 سے +40 فیصد تک جاتا ہے (زیادہ تغیر)۔ آپ کون سا چنیں گے؟
- تعلیم: دو سکولوں کی اوسط 70 فیصد ہے۔ ایک میں سب 65-75 کے درمیان ہیں۔ دوسرے میں نصف 90 سے اوپر اور نصف 50 سے نیچے ہیں۔
- کوالٹی کنٹرول: فیکٹری میں پیداواری عمل مستقل ہونا چاہیے - کم تغیر مطلوب ہے۔
رینج سب سے سادہ پھیلاؤ کی پیمائش ہے - بس سب سے بڑی اور چھوٹی قدر کا فرق - لیکن انتہائی قدروں سے متاثر ہوتی ہے اور درمیان کا ڈیٹا نظرانداز کرتی ہے۔ تغیر بہتر ہے کیونکہ یہ ہر قدر کا اوسط سے فاصلہ مدنظر رکھتا ہے۔ چھوٹا تغیر مطلب مستقل مزاج ڈیٹا، بڑا تغیر مطلب اتار چڑھاؤ۔ صرف اوسط جاننا کافی نہیں - آپ کو پھیلاؤ بھی جاننا ضروری ہے تاکہ مکمل تصویر نظر آئے۔