ہم آہنگی

مشکل: درمیانی پڑھنے کا وقت: 12 منٹ

کیا دو چیزیں ساتھ چلتی ہیں؟

روزمرہ زندگی میں ہم مسلسل نمونے نوٹ کرتے ہیں۔ لمبے لوگوں کا وزن زیادہ ہوتا ہے۔ زیادہ پڑھنے والے طلبا بہتر نمبر لاتے ہیں۔ جن شہروں میں زیادہ پولیس ہے وہاں زیادہ جرم ہے۔ (رکیں - کیا اس آخری مثال کا مطلب ہے کہ پولیس جرم کا سبب بنتی ہے؟)

2 4 6 8 10 2 4 6 8 10 12

ہم آہنگی وہ طریقہ ہے جس سے شماریات دان ان تعلقات کو ناپتے اور بیان کرتے ہیں۔ یہ بتاتا ہے کیا دو چیزیں ساتھ چلتی ہیں، اور کتنی مضبوطی سے۔ لیکن جیسا کہ تیسری مثال اشارہ کرتی ہے، یہ نہیں بتاتا کیوں۔

ہم آہنگی گتانک (r)

ہم آہنگی گتانک (جسے پیئرسن کا r بھی کہتے ہیں) ایک عدد ہے -1 اور +1 کے درمیان:

  • r = +1: مکمل مثبت ہم آہنگی۔ ایک بڑھے تو دوسرا بھی بڑھے، ہمیشہ۔
  • r = 0: کوئی خطی تعلق نہیں۔
  • r = -1: مکمل منفی ہم آہنگی۔ ایک بڑھے تو دوسرا گھٹے، ہمیشہ۔
مثال

مثبت ہم آہنگی (r ≈ +0.8): پڑھائی کے گھنٹے اور FSc نمبر۔ زیادہ پڑھائی عموماً زیادہ نمبروں سے منسلک ہے۔

منفی ہم آہنگی (r ≈ -0.6): گرمی کا درجہ حرارت اور چائے کی فروخت۔ جتنی زیادہ گرمی، اتنی کم چائے بکتی ہے (لاہور میں!)۔

قریباً صفر ہم آہنگی (r ≈ 0.05): جوتے کا سائز اور ریاضی کے نمبر۔ کوئی تعلق نہیں۔

ہم آہنگی کی طاقت

  • |r| = 0.0 سے 0.3: کمزور ہم آہنگی
  • |r| = 0.3 سے 0.7: درمیانی ہم آہنگی
  • |r| = 0.7 سے 1.0: مضبوط ہم آہنگی

"|r|" کا مطلب r کی قطعی قدر ہے - نشان (مثبت/منفی) سمت بتاتا ہے، مقدار طاقت بتاتی ہے۔

2 4 6 8 10 5 10

ہم آہنگی سببیت نہیں!

یہ شماریات کی سب سے اہم تنبیہ ہے اور اسے بار بار دہرانے کی ضرورت ہے۔ صرف اس لیے کہ دو چیزیں ایک ساتھ چلتی ہیں اس کا مطلب نہیں کہ ایک دوسری کا سبب ہے۔

مثال

آئس کریم کی فروخت اور ڈوبنے کے واقعات: r ≈ +0.9 (بہت مضبوط مثبت ہم آہنگی)۔ کیا آئس کریم ڈوبنے کا سبب بنتی ہے؟ نہیں! گرم موسم دونوں کو بڑھاتا ہے۔

مسجدوں کی تعداد اور جرائم: بڑے شہروں میں زیادہ مسجدیں بھی ہیں اور زیادہ جرائم بھی۔ تعلق؟ آبادی - بڑے شہر میں سب زیادہ ہے۔

قد اور تنخواہ: تحقیق دکھاتی ہے لمبے لوگ زیادہ کماتے ہیں۔ کیا قد بڑھانے سے تنخواہ بڑھے گی؟ نہیں - شاید خود اعتمادی، سماجی تعصب، اور پرورش جیسے عوامل دونوں کو متاثر کرتے ہیں۔

ہم آہنگی کی حدود

  • صرف خطی تعلق ناپتا ہے۔ اگر تعلق خم دار ہے (جیسے U شکل) تو r صفر کے قریب آ سکتا ہے حالانکہ مضبوط تعلق ہے۔
  • آؤٹ لائرز سے متاثر ہوتا ہے۔ ایک انتہائی نقطہ r کو بہت بدل سکتا ہے۔
  • سببیت نہیں بتاتا۔ ہم یہ پہلے کہہ چکے ہیں لیکن اتنا اہم ہے کہ دوبارہ کہنا ضروری ہے!
مثال

ایک کسان کھاد کی مقدار (0-100 کلو/ایکڑ) اور پیداوار کا تعلق دیکھتا ہے۔ 0 سے 50 کلو تک پیداوار بڑھتی ہے (مثبت تعلق) لیکن 50 سے 100 کلو تک گھٹتی ہے (زیادہ کھاد فصل جلاتی ہے)۔ مجموعی r صفر کے قریب ہو سکتا ہے حالانکہ واضح تعلق ہے - لیکن خم دار ہے، خطی نہیں۔

2 4 6 8 10 2 4 6 8 10

ہمیشہ سکیٹر پلاٹ بنائیں

r نمبر دیکھنے سے پہلے ہمیشہ ڈیٹا کو سکیٹر پلاٹ پر دیکھیں۔ یہ آپ کو بتائے گا کیا تعلق خطی ہے، خم دار ہے، آؤٹ لائرز ہیں، یا کوئی تعلق ہے ہی نہیں۔

اہم نکتہ

ہم آہنگی گتانک (r) ناپتا ہے کہ دو متغیرات کتنی مضبوطی سے خطی طور پر ساتھ چلتے ہیں، -1 (مکمل منفی) سے +1 (مکمل مثبت) تک۔ صفر کے قریب مطلب کوئی خطی تعلق نہیں۔ لیکن سب سے اہم بات: ہم آہنگی سببیت نہیں ہے۔ دو چیزوں کا ساتھ چلنا ثابت نہیں کرتا کہ ایک دوسری کا سبب ہے - الجھانے والے متغیرات، اتفاق، یا الٹی سمت بھی ممکن ہے۔ ہمیشہ سکیٹر پلاٹ دیکھیں اور سببیت کے بارے میں محتاط رہیں۔