گھنٹی کا منحنی ہر جگہ ہے
اگر آپ کسی بڑے شہر میں ہر بالغ کا قد ناپیں اور چارٹ پر لگائیں تو آپ کو ایک جانی پہچانی شکل نظر آئے گی: ایک ہموار، متوازن پہاڑی جو درمیان میں بلند ہوتی ہے اور دونوں طرف گھٹتی جاتی ہے۔ اس شکل کو نارمل تقسیم کہتے ہیں، اور یہ شماریات میں سب سے اہم تصور ہے۔
نارمل تقسیم حیرت انگیز طور پر بہت سی جگہوں پر نظر آتی ہے۔ امتحان کے نمبر، بلڈ پریشر کی ریڈنگ، دفتر پہنچنے کا وقت، فیکٹری میں تیاری کی درستگی، یہاں تک کہ سائنسی پیمائش میں غلطیاں -- یہ سب گھنٹی کی شکل کا نمونہ دکھاتے ہیں۔ وجہ ریاضیاتی ہے: جب بھی کوئی پیمائش بہت سے چھوٹے، آزاد عوامل سے متاثر ہوتی ہے تو نتیجہ نارمل تقسیم کی طرف مائل ہوتا ہے۔ یہ اصول مرکزی حد نظریے سے گہرا تعلق رکھتا ہے۔
اوپر کے چارٹ میں چوٹی سب سے عام قدر (اوسط) کی نمائندگی کرتی ہے، اور منحنی دونوں طرف یکساں طور پر گھٹتا ہے۔ زیادہ تر اقدار مرکز کے قریب جمع ہوتی ہیں، اور انتہاؤں کی طرف مشاہدات کم ہوتے جاتے ہیں۔
اوسط، معیاری انحراف، اور شکل
نارمل تقسیم صرف دو عدد سے مکمل طور پر بیان ہوتی ہے: اوسط (منحنی کا مرکز) اور معیاری انحراف (اعداد و شمار کا پھیلاؤ)۔ اوسط بتاتا ہے کہ چوٹی عدد کی لکیر پر کہاں ہے۔ معیاری انحراف بتاتا ہے کہ گھنٹی کتنی چوڑی یا تنگ ہے۔
IQ اسکور پر غور کریں جو 100 کی اوسط اور 15 کے معیاری انحراف کے ساتھ نارمل تقسیم پر بنائے گئے ہیں۔ زیادہ تر لوگ 85 اور 115 کے درمیان نمبر حاصل کرتے ہیں۔ کچھ لوگ 70 سے کم یا 130 سے زیادہ حاصل کرتے ہیں۔ بہت کم 55 سے کم یا 145 سے زیادہ حاصل کرتے ہیں۔ معیاری انحراف کو 5 میں بدلیں اور گھنٹی بہت تنگ ہو جائے گی -- تقریباً سب 90 اور 110 کے درمیان جمع ہو جائیں گے۔ 25 میں بدلیں اور گھنٹی چپٹی ہو جائے گی اور نمبر بہت پھیل جائیں گے۔
نارمل تقسیم کی یہی خوبصورتی ہے: ایک بار آپ اوسط اور معیاری انحراف جان لیں تو آپ پوری شکل جان لیتے ہیں اور کسی بھی قدر کے ہونے کا امکان حساب کر سکتے ہیں۔
68-95-99.7 کا اصول
نارمل تقسیم کی سب سے عملی خصوصیت تجرباتی اصول ہے جسے 68-95-99.7 کا اصول بھی کہتے ہیں۔ یہ بتاتا ہے کہ نارمل تقسیم والے کسی بھی ڈیٹا میں:
- تقریباً 68% اقدار اوسط سے 1 معیاری انحراف کے اندر ہوتی ہیں۔
- تقریباً 95% اقدار 2 معیاری انحراف کے اندر ہوتی ہیں۔
- تقریباً 99.7% اقدار 3 معیاری انحراف کے اندر ہوتی ہیں۔
یہ اصول آپ کو فوری اندازہ دیتا ہے کہ کوئی قدر کتنی غیر معمولی ہے۔ اگر آپ کا ڈیٹا نارمل تقسیم رکھتا ہے اور کوئی اوسط سے 3 معیاری انحراف سے زیادہ دور کی قدر رپورٹ کرے تو یہ انتہائی نایاب ہے -- یہ 0.3% سے کم وقت میں ہوتا ہے۔ کوالٹی کنٹرول انجینئر اس خیال کو روزانہ استعمال کرتے ہیں: فیکٹری کا وہ پرزہ جو ہدف سے تین معیاری انحراف سے باہر ہو، خراب قرار دیا جاتا ہے۔
فرض کریں کسی شہر میں روزانہ سفر کا اوسط وقت 35 منٹ ہے اور معیاری انحراف 8 منٹ ہے۔ 68-95-99.7 کے اصول کے مطابق، تقریباً 68% مسافر 27 سے 43 منٹ لیتے ہیں۔ تقریباً 95% 19 سے 51 منٹ لیتے ہیں۔ اور تقریباً سب (99.7%) 11 سے 59 منٹ لیتے ہیں۔ اگر کوئی کہے کہ اس کا سفر 65 منٹ کا ہے تو یہ اوسط سے 3 معیاری انحراف سے زیادہ ہے -- اس شہر کے لیے واقعی غیر معمولی سفر۔
Z-اسکور: عالمی پیمانہ
مختلف نارمل تقسیمیں مختلف اکائیاں اور پیمانے استعمال کرتی ہیں۔ آپ کس طرح 82 کے امتحان نمبر (اوسط 75، معیاری انحراف 5) کا موازنہ SAT کے 720 نمبر (اوسط 500، معیاری انحراف 100) سے کریں گے؟ آپ Z-اسکور استعمال کریں۔
Z-اسکور بتاتا ہے کہ کوئی قدر اوسط سے کتنے معیاری انحراف اوپر یا نیچے ہے۔ فارمولا سیدھا ہے: قدر سے اوسط گھٹائیں، پھر معیاری انحراف سے تقسیم کریں۔ امتحان کے نمبر: (82 - 75) / 5 = 1.4۔ SAT: (720 - 500) / 100 = 2.2۔ SAT کا نمبر اپنی تقسیم کے مقابلے میں زیادہ متاثر کن ہے کیونکہ یہ معیاری انحراف کی اکائیوں میں اوسط سے زیادہ دور ہے۔
Z-اسکور 0 کا مطلب ہے قدر بالکل اوسط ہے۔ مثبت Z-اسکور کا مطلب اوسط سے اوپر ہے۔ منفی کا مطلب اوسط سے نیچے۔ بڑائی بتاتی ہے کہ اوسط سے کتنا دور ہے۔ Z-اسکور 2.0 کا مطلب ہے قدر تقسیم میں تقریباً 97.7% اقدار سے زیادہ ہے۔
Z-اسکور اس لیے طاقتور ہیں کہ وہ کسی بھی نارمل تقسیم کو معیاری نارمل تقسیم میں بدل دیتے ہیں -- 0 اوسط اور 1 معیاری انحراف والا گھنٹی منحنی۔ اس سے آپ ایک ہی حوالہ جات جدول (یا کیلکولیٹر) استعمال کر کے نارمل تقسیم والے کسی بھی متغیر کا امکان معلوم کر سکتے ہیں، اس کے اصل پیمانے سے قطع نظر۔
حقیقی دنیا کے استعمال
نارمل تقسیم اور Z-اسکور صرف کتابی تصورات نہیں ہیں۔ منحنی پر نمبر لگانے کا مطلب ہے طلباء کے نمبروں کو نارمل تقسیم میں فٹ کرنا۔ طبی لیب کے نتائج کو اکثر غیر معمولی نشان لگایا جاتا ہے جب وہ آبادی کی اوسط سے 2 معیاری انحراف سے آگے ہوں۔ مالیاتی تجزیہ کار نارمل تقسیم کا استعمال کرتے ہوئے اسٹاک ریٹرن کے ماڈل بناتے ہیں (حالانکہ حقیقت میں سرے اکثر موٹے ہوتے ہیں جو ایک اہم حد ہے)۔ بیمہ کمپنیاں دعووں کا اندازہ لگانے کے لیے نارمل ماڈل استعمال کرتی ہیں۔
یہ جاننا بھی ضروری ہے کہ نارمل تقسیم کب لاگو نہیں ہوتی۔ آمدنی کی تقسیم شدید دائیں جانب جھکی ہوتی ہے -- چند بہت زیادہ کمانے والے اوسط کو درمیان سے بہت دور کھینچ لیتے ہیں۔ انتظار کے اوقات اور بقا کا ڈیٹا بھی اکثر جھکاؤ رکھتا ہے۔ شمار کا ڈیٹا (جیسے روزانہ حادثات کی تعداد) بالکل مختلف تقسیمات رکھتا ہے۔ ہمیشہ جانچیں کہ گھنٹی منحنی کا مفروضہ معقول ہے یا نہیں ان آلات کو لاگو کرنے سے پہلے۔
نارمل تقسیم ایک متوازن، گھنٹی نما منحنی ہے جو مکمل طور پر اوسط اور معیاری انحراف سے بیان ہوتی ہے۔ 68-95-99.7 کا اصول آپ کو فوری اندازہ دیتا ہے کہ ڈیٹا اوسط کے گرد کیسے پھیلتا ہے۔ Z-اسکور آپ کو کسی بھی قدر کو معیاری انحراف میں ماپے ہوئے عالمی پیمانے میں تبدیل کرنے دیتے ہیں، جس سے بالکل مختلف سیاق و سباق میں نمبروں کا موازنہ ممکن ہوتا ہے۔ ہمیشہ تصدیق کریں کہ آپ کا ڈیٹا تقریباً نارمل ہے ان آلات پر بھروسہ کرنے سے پہلے -- حقیقی دنیا کا ہر ڈیٹا گھنٹی منحنی کی پیروی نہیں کرتا۔