پیمائش کی سطحیں کیوں اہم ہیں
پچھلے سبق میں ہم نے سیکھا کہ ڈیٹا کوالٹیٹو (زمرہ جاتی) یا کوانٹیٹیٹو (عددی) ہو سکتا ہے۔ لیکن اس کی ایک اور گہری تہ ہے۔ تمام زمرے برابر نہیں ہیں اور تمام اعداد ایک جیسے کام نہیں کرتے۔ پیمائش کی سطح آپ کو بتاتی ہے کہ آپ اپنے ڈیٹا کے ساتھ کیا کر سکتے ہیں اور کیا نہیں۔
یہ اس لیے اہم ہے کیونکہ غلط قسم کے ڈیٹا پر غلط حساب لگانا بے معنی نتائج دیتا ہے۔ مثلاً اگر آپ کرکٹ ٹیموں کو نمبر دیں (لاہور قلندرز = 1، کراچی کنگز = 2، اسلام آباد یونائیٹڈ = 3) تو "اوسط ٹیم" 2 نکالنا بے معنی ہے۔
پیمائش کی چار سطحیں ہیں اور ہر ایک پچھلی پر استوار ہوتی ہے۔ آئیے سب سے سادہ سے سب سے زیادہ معلوماتی تک چلتے ہیں۔
سطح 1: اسمی (Nominal)
اسمی ڈیٹا سب سے سادہ سطح ہے۔ یہ ناموں، لیبلز یا زمروں پر مشتمل ہے جن کی کوئی قدرتی ترتیب نہیں۔ "اسمی" لاطینی لفظ "نام" سے آیا ہے اور یہی اس سطح کا کام ہے: چیزوں کو نام دینا۔
- خون کا گروپ: A، B، AB، O۔ A کسی لحاظ سے B سے "زیادہ" نہیں ہے۔
- پسندیدہ کھانا: بریانی، نہاری، کڑاہی، حلیم۔ کوئی درجہ بندی نہیں۔
- آنکھوں کا رنگ: بھورا، سیاہ، سبز۔ صرف لیبل۔
- پوسٹل کوڈز: اگرچہ یہ اعداد جیسے لگتے ہیں، 54000 (لاہور) کسی معنی خیز طریقے سے 75500 (کراچی) سے "بڑا" نہیں۔ یہ مقامات کے لیے لیبل ہیں۔
اسمی ڈیٹا کے ساتھ آپ کیا کر سکتے ہیں: ہر زمرے میں آنے والی چیزوں کی تعداد گنیں (تعدد)۔ سب سے عام زمرہ تلاش کریں (موڈ)۔ بس اتنا ہی۔ اسمی ڈیٹا کی اوسط نکالنا بے معنی ہے۔
سطح 2: ترتیبی (Ordinal)
ترتیبی ڈیٹا میں زمرے ایک قدرتی ترتیب یا درجہ بندی رکھتے ہیں۔ آپ کہہ سکتے ہیں کہ ایک قدر دوسری سے اونچی یا نیچی ہے۔ تاہم قدروں کے درمیان فاصلے لازمی طور پر برابر نہیں ہوتے۔
- قمیض کے سائز: چھوٹا، درمیانہ، بڑا، بہت بڑا۔ واضح ترتیب ہے لیکن چھوٹے اور درمیانے کا فرق لازمی بڑے اور بہت بڑے کے فرق جیسا نہیں۔
- میٹرک کے درجات: A+، A، B، C، D۔ واضح ترتیب ہے لیکن A+ اور A کا فرق B اور C کے فرق سے مختلف ہو سکتا ہے۔
- تعلیمی سطح: میٹرک، انٹرمیڈیٹ (FSc)، بیچلرز، ماسٹرز، پی ایچ ڈی۔ واضح ترقی ہے لیکن ہر قدم کا "فاصلہ" مختلف ہے۔
- دوڑ کی پوزیشنیں: پہلی، دوسری، تیسری جگہ۔ پہلی دوسری سے بہتر ہے لیکن وقت کا فرق ایک سیکنڈ بھی ہو سکتا ہے اور کئی منٹ بھی۔
ترتیبی ڈیٹا کے ساتھ آپ کیا کر سکتے ہیں: وہ سب جو اسمی کے ساتھ ہو سکتا ہے (گنتی، موڈ)، اس کے علاوہ آپ درجہ بندی کر سکتے ہیں اور درمیانی قدر (میڈین) نکال سکتے ہیں۔ لیکن حقیقی اوسط نکالنا مشکل ہے کیونکہ زمروں کے درمیان فاصلے برابر نہیں۔
آپ ایک ریستوران کو 5 میں سے 4 ستارے دیتے ہیں۔ آپ کا دوست اسے 2 ستارے دیتا ہے۔ کیا آپ کا تجربہ واقعی "دوگنا اچھا" تھا؟ شاید نہیں۔ ستاروں کی درجہ بندی میں ترتیب ہے (5 بہتر ہے 4 سے) لیکن 1 ستارے اور 2 ستاروں کے درمیان نفسیاتی فاصلہ 4 اور 5 ستاروں سے بہت مختلف محسوس ہو سکتا ہے۔ یہی ترتیبی ڈیٹا کی خاصیت ہے: ترتیب موجود ہے لیکن برابر وقفے نہیں۔
سطح 3: وقفی (Interval)
وقفی ڈیٹا میں ترتیب ہے اور قدروں کے درمیان برابر فاصلے ہیں۔ 10 اور 20 کا فرق وہی ہے جو 40 اور 50 کا ہے۔ تاہم وقفی ڈیٹا میں حقیقی صفر نقطہ نہیں ہوتا، یعنی تناسب کام نہیں کرتے۔
- درجہ حرارت سیلسیس میں: 30 اور 40 ڈگری کا فرق وہی ہے جو 10 اور 20 کا ہے۔ لیکن 0 ڈگری کا مطلب "کوئی حرارت نہیں" نہیں ہے۔ اور 40 ڈگری "20 ڈگری سے دوگنا گرم" نہیں ہے۔
- تقویمی سال: 1990 اور 2000 کا فرق وہی ہے جو 2010 اور 2020 کا ہے (10 سال)۔ لیکن سال 0 ایک من مانی حوالہ نقطہ ہے۔
- IQ سکور: 100 اور 110 کا فرق وہی ہے جو 120 اور 130 کا۔ لیکن IQ 0 کا مطلب "کوئی ذہانت نہیں" نہیں اور 140 کا سکور 70 سے "دوگنا ذہین" نہیں۔
وقفی ڈیٹا کے ساتھ آپ کیا کر سکتے ہیں: پچھلی سطحوں کا سب کچھ، اس کے ساتھ بامعنی اوسط نکال سکتے ہیں اور قدروں کے درمیان عین فرق ناپ سکتے ہیں۔ لیکن "دوگنا" جیسے تناسبی بیانات نہیں دے سکتے کیونکہ حقیقی صفر نہیں ہے۔
"حقیقی صفر نہیں" کا خیال
یہ وہ حصہ ہے جو زیادہ تر لوگوں کو الجھاتا ہے۔ "حقیقی صفر" کا مطلب ہے ناپی جانے والی چیز کی مکمل غیر موجودگی۔ صفر ڈگری سیلسیس کا مطلب حرارت نہ ہونا نہیں ہے۔ یہ صرف وہ درجہ حرارت ہے جس پر پانی جمتا ہے۔ چونکہ صفر مصنوعی ہے، "40 ڈگری 20 ڈگری سے دوگنا گرم ہے" بات درست نہیں۔
سطح 4: تناسبی (Ratio)
تناسبی ڈیٹا میں وہ سب کچھ ہے جو وقفی میں ہے - ترتیب، برابر فاصلے - اور ساتھ ایک حقیقی صفر نقطہ۔ جب صفر کا مطلب "بالکل نہیں" ہو تو آپ کے پاس تناسبی ڈیٹا ہے۔ یہ سب سے زیادہ معلوماتی سطح ہے۔
- وزن: 0 کلو کا مطلب کوئی وزن نہیں۔ 100 کلو واقعی 50 کلو سے دوگنا بھاری ہے۔
- قد: 0 انچ کا مطلب کوئی قد نہیں۔ 6 فٹ کا شخص 3 فٹ کے بچے سے دوگنا لمبا ہے۔
- بینک اکاؤنٹ میں رقم: 0 روپے کا مطلب کوئی پیسا نہیں۔ 20,000 روپے واقعی 10,000 سے دوگنے ہیں۔
- کھانا پکانے کی پیمائشیں: 0 کپ آٹے کا مطلب بالکل آٹا نہیں۔ 2 کپ والی ترکیب 1 کپ سے عین دوگنا استعمال کرتی ہے۔
- کیلون میں درجہ حرارت: 0 کیلون مکمل صفر ہے، حرارتی توانائی کی مکمل غیر موجودگی۔ اسی لیے کیلون تناسبی پیمانہ ہے۔
تناسبی ڈیٹا کے ساتھ آپ کیا کر سکتے ہیں: سب کچھ۔ گنتی، درجہ بندی، اوسط، فرق کا موازنہ، اور بامعنی تناسبی بیانات ("الف ب سے تین گنا بھاری ہے")۔ یہ سب سے لچکدار سطح ہے۔
ایک بریانی کی ترکیب میں 2 کپ چاول اور 1 کپ مصالحے درکار ہیں۔ آپ کہہ سکتے ہیں کہ چاول مصالحوں سے دوگنے چاہیئں کیونکہ کپ کی پیمائش میں حقیقی صفر ہے (0 کپ = کوئی مصالحہ نہیں)۔ یہ تناسبی موازنہ ہے۔ اب فرض کریں بریانی 180 ڈگری سیلسیس پر پکائی جاتی ہے۔ آپ نہیں کہہ سکتے کہ 180 ڈگری "90 ڈگری سے دوگنا گرم" ہے کیونکہ سیلسیس میں حقیقی صفر نہیں۔ ایک ہی باورچی خانے میں مختلف پیمائش کی سطحیں کام کر رہی ہیں۔
چار سطحیں کیسے یاد رکھیں
سطحوں کو تعمیراتی بلاکس سمجھیں، ہر سطح ایک نئی صلاحیت شامل کرتی ہے:
- اسمی: صرف نام۔ آپ گروپ بنا کر گن سکتے ہیں۔
- ترتیبی: نام + ترتیب۔ آپ درجہ بندی کر سکتے ہیں۔
- وقفی: نام + ترتیب + برابر فاصلے۔ آپ عین فرق ناپ سکتے ہیں۔
- تناسبی: نام + ترتیب + برابر فاصلے + حقیقی صفر۔ آپ تناسب کا موازنہ کر سکتے ہیں۔
یاد رکھنے کا آسان طریقہ: "N-O-I-R" (فرانسیسی میں سیاہ)۔ Nominal، Ordinal، Interval، Ratio۔ ہر حرف ایک سطح ہے، کم سے زیادہ معلوماتی تک۔
عملی طور پر یہ کیوں اہم ہے
اپنی پیمائش کی سطح کے لیے غلط تجزیہ چننا گمراہ کن نتائج دیتا ہے۔ یہاں کچھ عام غلطیاں ہیں:
- پوسٹل کوڈز کی اوسط نکالنا۔ 54000 اور 75500 کی اوسط 64750 بے معنی ہے کیونکہ پوسٹل کوڈز اسمی ہیں۔
- ستاروں کی درجہ بندی کی اوسط بے احتیاطی سے نکالنا۔ "اوسط 3.7 ستارے" عام عمل ہے لیکن تکنیکی طور پر قابل اعتراض ہے کیونکہ ستارے ترتیبی ہیں۔
- "دوگنا گرم" کہنا۔ 40 ڈگری سیلسیس "20 ڈگری سے دوگنا گرم" کہنا غلط ہے کیونکہ سیلسیس وقفی پیمانہ ہے۔
پیمائش کی چار سطحیں - اسمی، ترتیبی، وقفی، اور تناسبی - آپ کو بتاتی ہیں کہ آپ کے ڈیٹا کے ساتھ کون سے موازنے اور حسابات درست ہیں۔ اسمی ڈیٹا صرف لیبل ہے۔ ترتیبی ڈیٹا ترتیب شامل کرتا ہے۔ وقفی ڈیٹا برابر فاصلے شامل کرتا ہے۔ تناسبی ڈیٹا حقیقی صفر شامل کرتا ہے جو تجزیے کی مکمل آزادی دیتا ہے۔ کسی بھی ڈیٹا کا تجزیہ کرنے سے پہلے اس کی پیمائش کی سطح پہچانیں۔ یہ آپ کو غلط نتائج سے بچائے گا۔