পারস্পরিক সম্পর্ক

কঠিনতা: মধ্যবর্তী পড়ার সময়: 12 মিনিট

দুটো জিনিস কি একসাথে বদলায়?

ঢাকায় তাপমাত্রা বাড়লে আইসক্রিম বিক্রি বাড়ে। পড়ার সময় বাড়লে পরীক্ষার নম্বর বাড়ে। পারস্পরিক সম্পর্ক (correlation) বলে দুটো চলক একসাথে বদলায় কি না, এবং কতটা।

2 4 6 8 10 2 4 6 8 10 12

পারস্পরিক সম্পর্ক সহগ (r)

পারস্পরিক সম্পর্কের পরিমাণ মাপা হয় "r" দিয়ে, যাকে পিয়ারসনের সম্পর্ক সহগ বলে। r-এর মান -১ থেকে +১ এর মধ্যে:

  • r = +১: পরিপূর্ণ ধনাত্মক সম্পর্ক - একটা বাড়লে অন্যটাও ঠিক সমানুপাতে বাড়ে
  • r = ০: কোনো রৈখিক সম্পর্ক নেই
  • r = -১: পরিপূর্ণ ঋণাত্মক সম্পর্ক - একটা বাড়লে অন্যটা ঠিক সমানুপাতে কমে
উদাহরণ

বিভিন্ন সম্পর্কের উদাহরণ:

  • r ≈ +০.৮৫: SSC-তে পড়ার ঘণ্টা ও প্রাপ্ত নম্বর - শক্তিশালী ধনাত্মক সম্পর্ক
  • r ≈ +০.৬০: ঢাকায় তাপমাত্রা ও আইসক্রিম বিক্রি - মাঝারি ধনাত্মক
  • r ≈ -০.৭০: সিগারেট খাওয়ার পরিমাণ ও ফুসফুসের ক্ষমতা - শক্তিশালী ঋণাত্মক
  • r ≈ ০.০৫: জুতার সাইজ ও বুদ্ধিমত্তা - কোনো সম্পর্ক নেই

r-এর আকার কী বোঝায়?

  • |r| < ০.৩: দুর্বল সম্পর্ক
  • ০.৩ ≤ |r| < ০.৭: মাঝারি সম্পর্ক
  • |r| ≥ ০.৭: শক্তিশালী সম্পর্ক

সম্পর্ক ≠ কার্যকারণ - সবচেয়ে গুরুত্বপূর্ণ কথা

এটা পরিসংখ্যানের সবচেয়ে গুরুত্বপূর্ণ নিয়ম: পারস্পরিক সম্পর্ক মানে কার্যকারণ নয়! দুটো জিনিস একসাথে বদলালেই একটা অন্যটার কারণ নয়।

2 4 6 8 10 5 10
উদাহরণ

বাংলাদেশের জেলাগুলোতে দেখা গেল - যেসব জেলায় মসজিদ বেশি, সেসব জেলায় অপরাধও বেশি। r বেশ ভালো ধনাত্মক। তাহলে কি মসজিদ অপরাধ বাড়ায়? অবশ্যই না!

বিভ্রান্তিকর চলক হলো জনসংখ্যা - বেশি মানুষ মানে বেশি মসজিদ এবং বেশি অপরাধ। জনসংখ্যা নিয়ন্ত্রণ করলে সম্পর্ক হয়তো উবে যাবে।

উদাহরণ

গবেষণায় দেখা গেছে বাংলাদেশে মোবাইল ফোন ব্যবহারকারীর সংখ্যা বাড়ার সাথে সাথে গড় আয়ুও বেড়েছে। r ≈ +০.৯৫ - অত্যন্ত শক্তিশালী সম্পর্ক! কিন্তু মোবাইল কি মানুষকে বাঁচিয়ে রাখে? না - দুটোই সময়ের সাথে বেড়েছে (অর্থনৈতিক উন্নয়ন, চিকিৎসার উন্নতি ইত্যাদি)।

কার্যকারণ প্রমাণ করতে কী লাগে?

কার্যকারণ প্রমাণ করতে শুধু সম্পর্ক যথেষ্ট নয়। দরকার:

  • নিয়ন্ত্রিত পরীক্ষা: দৈবভাবে দুটো দল করে একটায় চিকিৎসা দেওয়া, অন্যটায় না দেওয়া।
  • সময়ের ক্রম: কারণ অবশ্যই ফলের আগে ঘটতে হবে।
  • বিকল্প ব্যাখ্যা বাদ দেওয়া: বিভ্রান্তিকর চলকগুলো নিয়ন্ত্রণ করা।

সম্পর্কের সীমাবদ্ধতা

  • শুধু রৈখিক সম্পর্ক দেখে: r = ০ মানে "কোনো সম্পর্ক নেই" না - অ-রৈখিক সম্পর্ক থাকতে পারে। যেমন U আকৃতির সম্পর্ক।
  • ব্যতিক্রমী মানে প্রভাবিত: একটা চরম মান r-কে অনেক বদলে দিতে পারে।
  • দল মেশালে ভুল হতে পারে: দুটো আলাদা গ্রুপকে একসাথে দেখলে সম্পর্ক উল্টে যেতে পারে (সিম্পসনের প্যারাডক্স)।
উদাহরণ

একটা চায়ের দোকানের তাপমাত্রা ও বিক্রির সম্পর্ক ভাবুন। খুব ঠান্ডায় (শীতে) চায়ের বিক্রি বেশি। তাপমাত্রা বাড়লে কমে। কিন্তু খুব গরমে মানুষ আইস টি খায় - বিক্রি আবার বাড়ে। সম্পর্ক U আকৃতির - r এটা ধরতে পারবে না।

2 4 6 8 10 2 4 6 8 10
মূল বিষয়

পারস্পরিক সম্পর্ক সহগ (r) দুটো চলকের রৈখিক সম্পর্কের শক্তি ও দিক মাপে, -১ থেকে +১ এর মধ্যে। কিন্তু সবচেয়ে গুরুত্বপূর্ণ কথা: সম্পর্ক মানে কার্যকারণ নয়। বিভ্রান্তিকর চলক লুকিয়ে থাকতে পারে। কার্যকারণ প্রমাণ করতে নিয়ন্ত্রিত পরীক্ষা দরকার। সম্পর্ক দেখলেই "এটা এটার কারণ" বলা পরিসংখ্যানের সবচেয়ে সাধারণ ভুল।