ڈیٹا کی اقسام

مشکل: ابتدائی پڑھنے کا وقت: 10 منٹ

تمام ڈیٹا ایک جیسا نہیں ہوتا

کسی بھی چیز کا تجزیہ کرنے سے پہلے آپ کو یہ سمجھنا ہوگا کہ آپ کس قسم کے ڈیٹا کے ساتھ کام کر رہے ہیں۔ جیسے آپ پیچ کسنے کے لیے ہتھوڑا استعمال نہیں کریں گے، ویسے ہی مختلف قسم کے ڈیٹا کے لیے مختلف اوزار اور طریقے درکار ہوتے ہیں۔ غلط طریقہ استعمال کرنا غلطیوں کی طرف لے جاتا ہے۔ صحیح طریقہ آگے سب کچھ آسان بنا دیتا ہے۔

25 A 40 B 15 C 30 D 10 F

اس سبق میں ہم ان اہم اقسام کو سمجھیں گے جو آپ کو روزمرہ زندگی میں ملیں گی۔ ابھی ہر تفصیل یاد کرنے کی فکر نہ کریں۔ مقصد یہ ہے کہ آپ ان اقسام کو پہچاننا شروع کریں۔

کوالٹیٹو ڈیٹا (زمرہ جاتی ڈیٹا)

کوالٹیٹو ڈیٹا خصوصیات یا صفات بیان کرتا ہے۔ یہ ایسے سوالات کا جواب دیتا ہے جیسے "کس قسم کا؟" یا "کون سا زمرہ؟" آپ کوالٹیٹو ڈیٹا پر بامعنی حساب نہیں کر سکتے۔

کوالٹیٹو ڈیٹا کو لیبل سمجھیں۔ یہ آپ کو کسی شخص، جگہ یا چیز کے بارے میں کچھ بتاتے ہیں، لیکن آپ انہیں جمع نہیں کر سکتے یا ان کی اوسط نہیں نکال سکتے۔

مثال
  • پسندیدہ PSL ٹیم: لاہور قلندرز، کراچی کنگز، اسلام آباد یونائیٹڈ، پشاور زلمی۔ آپ گن سکتے ہیں کتنے لوگوں نے کون سی ٹیم چنی، لیکن "قلندرز + کنگز" کا کوئی مطلب نہیں۔
  • صوبہ: پنجاب، سندھ، خیبر پختونخوا، بلوچستان۔ یہ زمرے ہیں، اعداد نہیں۔
  • ٹرانسپورٹ کا ذریعہ: بس، رکشا، موٹر سائیکل، کار۔ یہ وضاحتیں ہیں، پیمائشیں نہیں۔
  • خون کا گروپ: A، B، AB، O۔ صرف لیبل ہیں۔

کوالٹیٹو ڈیٹا کے ساتھ سب سے عام کام یہ ہے کہ ہر زمرے کی تعداد گنیں۔ مثلاً 30 طلبا کی جماعت میں 12 لاہور قلندرز کے پرستار ہیں، 8 کراچی کنگز کے، 6 اسلام آباد یونائیٹڈ کے، اور 4 پشاور زلمی کے۔ یہ شمار مفید ہے، لیکن خود زمرے ایسے اعداد نہیں جن کی اوسط نکالی جا سکے۔

کوانٹیٹیٹو ڈیٹا (عددی ڈیٹا)

کوانٹیٹیٹو ڈیٹا ایسے اعداد پر مشتمل ہوتا ہے جو مقدار یا پیمائش ظاہر کرتے ہیں۔ یہ ایسے سوالات کا جواب دیتا ہے جیسے "کتنے؟" یا "کتنا؟" آپ کوانٹیٹیٹو ڈیٹا کو جمع، تفریق اور اوسط نکال سکتے ہیں۔

مثال
  • قد: 5 فٹ 6 انچ، 170 سینٹی میٹر۔ یہ پیمائشیں ہیں جن کا موازنہ اور اوسط نکالی جا سکتی ہے۔
  • درجہ حرارت: لاہور میں 42 ڈگری، اسلام آباد میں 35 ڈگری۔ یہ ایک پیمانے پر پیمائشیں ہیں۔
  • بہن بھائیوں کی تعداد: 0، 1، 2، 3۔ آپ حساب لگا سکتے ہیں کہ جماعت میں اوسط طالب علم کے 2.5 بہن بھائی ہیں۔
  • ہفتہ وار گھریلو خرچ: 8,500 روپے، 12,000 روپے، 6,700 روپے۔ یہ مقداریں ہیں جن کو جمع اور اوسط نکالا جا سکتا ہے۔

کوانٹیٹیٹو ڈیٹا مزید دو اہم ذیلی اقسام میں تقسیم ہوتا ہے: منقطع اور مسلسل۔

منقطع ڈیٹا (Discrete)

منقطع ڈیٹا صرف مخصوص، الگ الگ قدریں لے سکتا ہے۔ عام طور پر یہ مکمل اعداد ہوتے ہیں جو گنتی سے حاصل ہوتے ہیں۔ آپ کے پاس آدھا بچہ یا 2.7 بچے نہیں ہو سکتے۔

ایک اچھا ٹیسٹ: اگر آپ اسے ایک ایک کر کے گن سکتے ہیں تو یہ غالباً منقطع ہے۔

مثال
  • جماعت میں طلبا کی تعداد: 25، 26، 27، لیکن کبھی 25.5 نہیں۔
  • کرکٹ میچ میں گول (رنز نہیں، وکٹیں): 0، 1، 2، 3۔ ٹیم 1.3 وکٹیں نہیں لے سکتی۔
  • فون پر ایپس کی تعداد: 42، 43، 44۔ صرف مکمل اعداد۔
  • ٹرے میں انڈے: 0 سے 12 تک۔ آپ انہیں انفرادی طور پر گنتے ہیں۔

مسلسل ڈیٹا (Continuous)

مسلسل ڈیٹا ایک حد کے اندر کوئی بھی قدر لے سکتا ہے، بشمول اعشاریے۔ مسلسل ڈیٹا پیمائش سے حاصل ہوتا ہے نہ کہ گنتی سے۔

ایک اچھا ٹیسٹ: اگر آپ کسی بھی دو قدروں کے درمیان ہمیشہ ایک اور قدر تصور کر سکتے ہیں تو یہ مسلسل ہے۔ 5.1 اور 5.2 کے درمیان 5.15 ہے۔ 5.15 اور 5.16 کے درمیان 5.155 ہے۔

مثال
  • وزن: آپ کا وزن 68.3 کلو یا 68.37 کلو ہو سکتا ہے۔ درستگی آپ کے ترازو پر منحصر ہے۔
  • 100 میٹر دوڑ کا وقت: 11.23 سیکنڈ۔ وقت انتہائی باریک بینی سے ناپا جا سکتا ہے۔
  • درجہ حرارت: 38.4 ڈگری، 38.41 ڈگری۔ تھرمامیٹر ہی حد ہے۔
  • گلاس میں پانی کی مقدار: 240 ملی لیٹر، 240.5 ملی لیٹر۔ یہ بہتا ہے، مقررہ ٹکڑوں میں نہیں آتا۔

منقطع بمقابلہ مسلسل کی تمیز کیوں اہم ہے؟

کیونکہ ڈیٹا کی قسم طے کرتی ہے کہ کون سے چارٹ اور حسابات مناسب ہیں۔ بار چارٹ منقطع ڈیٹا کے لیے اچھا کام کرتا ہے۔ ہسٹوگرام اور لائن چارٹ مسلسل ڈیٹا کے لیے بہتر ہیں۔ غلط چارٹ استعمال کرنا آپ کے نتائج کو گمراہ کن بنا سکتا ہے۔

مثال

تصور کریں آپ اپنی بازار کی خریداری ٹریک کر رہے ہیں۔ ہر بار خریدی گئی چیزوں کی تعداد منقطع ہے: 8 چیزیں، 12 چیزیں۔ کل خرچ کی رقم مسلسل ہے: 4,723 روپے، 8,391 روپے۔ دکان کا نام کوالٹیٹو ہے: یوٹیلیٹی اسٹور، کریانہ دکان، امتیاز سپر مارکیٹ۔ تینوں معلومات ایک ہی خریداری سے ہیں، لیکن ہر ایک مختلف قسم کا ڈیٹا ہے جس کا تجزیہ مختلف طریقے سے ہوگا۔

منظم بمقابلہ غیر منظم ڈیٹا

آج کی دنیا میں جہاں ڈیٹا بہت سے ذرائع سے آتا ہے، ایک اور اہم تمیز ہے۔

منظم ڈیٹا

منظم ڈیٹا صاف طریقے سے ترتیب دیا ہوتا ہے، عام طور پر سطروں اور خانوں میں جیسے اسپریڈشیٹ۔ ہر معلومات کی واضح جگہ ہے۔ زیادہ تر روایتی شماریات منظم ڈیٹا کے ساتھ کام کرتی ہے۔

  • ملازمین کے نام، عمر اور تنخواہ کی اسپریڈشیٹ
  • مریضوں کے بلڈ پریشر کی ریکارڈنگز کی جدول
  • مصنوعات کی قیمتوں اور ذخیرے کی تعداد کا ڈیٹا بیس

غیر منظم ڈیٹا

غیر منظم ڈیٹا صاف طریقے سے سطروں اور خانوں میں نہیں آتا۔ یہ بے ترتیب، متنوع ہے اور اکثر خاص اوزاروں کی ضرورت ہوتی ہے۔

  • صارفین کے فری ٹیکسٹ ریویوز ("کھانا بہت اچھا تھا لیکن سروس سست تھی")
  • سوشل میڈیا پر پوسٹ کی گئی تصاویر
  • کال سینٹر کی آواز کی ریکارڈنگز
  • ای میلز، ٹویٹس، اور بلاگ پوسٹس

دنیا کا بہت بڑا حصہ غیر منظم ڈیٹا ہے۔ اس کا تجزیہ کرنے کے لیے اکثر پہلے اسے منظم شکل میں بدلنا ہوتا ہے۔ مثلاً آپ 500 صارفین کے ریویوز پڑھ کر ہر ایک کو "مثبت"، "منفی"، یا "غیر جانبدار" کے زمرے میں رکھ سکتے ہیں۔

مثال

کراچی کے ایک ریستوران کو daraz.pk جیسی سائٹ پر 200 آن لائن ریویوز ملتے ہیں۔ ہر ریویو کا خام متن غیر منظم ڈیٹا ہے۔ لیکن اگر کوئی ہر ریویو پڑھ کر ستاروں کی درجہ بندی (1 سے 5)، کیا ریویو میں کھانے کے معیار کا ذکر تھا (ہاں یا نہیں)، اور ریویو کی تاریخ ریکارڈ کرے تو یہ تفصیلات منظم ڈیٹا ہیں۔ ایک ہی ذریعے سے دونوں قسمیں آ سکتی ہیں۔

سب کو ملا کر سمجھیں

فرض کریں آپ لاہور میں ایک جم کے مینیجر ہیں اور اپنے ممبران کو بہتر سمجھنا چاہتے ہیں۔ آپ یہ معلومات جمع کرتے ہیں:

  • رکنیت کی قسم (بنیادی، پریمیم، VIP) — کوالٹیٹو ڈیٹا
  • عمر (34، 56، 22) — کوانٹیٹیٹو، منقطع
  • وزن (75.4 کلو، 62.8 کلو) — کوانٹیٹیٹو، مسلسل
  • ماہانہ حاضری (8، 12، 4) — کوانٹیٹیٹو، منقطع
  • اطمینان کے تبصرے ("صبح کی کلاسز بہت اچھی ہیں!") — غیر منظم ڈیٹا
  • اطمینان کی درجہ بندی (1 سے 10) — کوانٹیٹیٹو، منقطع

فوری حوالہ

  1. کیا یہ عدد ہے یا لیبل؟ لیبل کوالٹیٹو ہیں۔ اعداد کوانٹیٹیٹو ہیں۔
  2. اگر عدد ہے تو کیا یہ کوئی بھی قدر ہو سکتی ہے یا صرف مخصوص؟ مخصوص مکمل قدریں منقطع ہیں۔ حد میں کوئی بھی قدر مسلسل ہے۔
  3. کیا یہ جدول میں منظم ہے یا بے ترتیب؟ جدولیں منظم ہیں۔ متن، تصاویر اور آواز غیر منظم ہیں۔
اہم نکتہ

ڈیٹا مختلف اقسام میں آتا ہے اور ان اقسام کو پہچاننا کسی بھی تجزیے کا پہلا قدم ہے۔ کوالٹیٹو ڈیٹا زمروں اور لیبلز کی وضاحت کرتا ہے۔ کوانٹیٹیٹو ڈیٹا اعداد اور پیمائشوں کی نمائندگی کرتا ہے اور یہ منقطع (گنتی، الگ قدریں) یا مسلسل (پیمائش، حد میں کوئی بھی قدر) ہو سکتا ہے۔ منظم ڈیٹا جدولوں میں فٹ ہوتا ہے؛ غیر منظم ڈیٹا بے ترتیب ہوتا ہے۔ آپ کے پاس کس قسم کا ڈیٹا ہے یہ جاننا آپ کو بتاتا ہے کہ آگے کون سے اوزار اور طریقے استعمال کرنے ہیں۔