দুটো জিনিস কি একসাথে বদলায়?
ঢাকায় তাপমাত্রা বাড়লে আইসক্রিম বিক্রি বাড়ে। পড়ার সময় বাড়লে পরীক্ষার নম্বর বাড়ে। পারস্পরিক সম্পর্ক (correlation) বলে দুটো চলক একসাথে বদলায় কি না, এবং কতটা।
পারস্পরিক সম্পর্ক সহগ (r)
পারস্পরিক সম্পর্কের পরিমাণ মাপা হয় "r" দিয়ে, যাকে পিয়ারসনের সম্পর্ক সহগ বলে। r-এর মান -১ থেকে +১ এর মধ্যে:
- r = +১: পরিপূর্ণ ধনাত্মক সম্পর্ক - একটা বাড়লে অন্যটাও ঠিক সমানুপাতে বাড়ে
- r = ০: কোনো রৈখিক সম্পর্ক নেই
- r = -১: পরিপূর্ণ ঋণাত্মক সম্পর্ক - একটা বাড়লে অন্যটা ঠিক সমানুপাতে কমে
বিভিন্ন সম্পর্কের উদাহরণ:
- r ≈ +০.৮৫: SSC-তে পড়ার ঘণ্টা ও প্রাপ্ত নম্বর - শক্তিশালী ধনাত্মক সম্পর্ক
- r ≈ +০.৬০: ঢাকায় তাপমাত্রা ও আইসক্রিম বিক্রি - মাঝারি ধনাত্মক
- r ≈ -০.৭০: সিগারেট খাওয়ার পরিমাণ ও ফুসফুসের ক্ষমতা - শক্তিশালী ঋণাত্মক
- r ≈ ০.০৫: জুতার সাইজ ও বুদ্ধিমত্তা - কোনো সম্পর্ক নেই
r-এর আকার কী বোঝায়?
- |r| < ০.৩: দুর্বল সম্পর্ক
- ০.৩ ≤ |r| < ০.৭: মাঝারি সম্পর্ক
- |r| ≥ ০.৭: শক্তিশালী সম্পর্ক
সম্পর্ক ≠ কার্যকারণ - সবচেয়ে গুরুত্বপূর্ণ কথা
এটা পরিসংখ্যানের সবচেয়ে গুরুত্বপূর্ণ নিয়ম: পারস্পরিক সম্পর্ক মানে কার্যকারণ নয়! দুটো জিনিস একসাথে বদলালেই একটা অন্যটার কারণ নয়।
বাংলাদেশের জেলাগুলোতে দেখা গেল - যেসব জেলায় মসজিদ বেশি, সেসব জেলায় অপরাধও বেশি। r বেশ ভালো ধনাত্মক। তাহলে কি মসজিদ অপরাধ বাড়ায়? অবশ্যই না!
বিভ্রান্তিকর চলক হলো জনসংখ্যা - বেশি মানুষ মানে বেশি মসজিদ এবং বেশি অপরাধ। জনসংখ্যা নিয়ন্ত্রণ করলে সম্পর্ক হয়তো উবে যাবে।
গবেষণায় দেখা গেছে বাংলাদেশে মোবাইল ফোন ব্যবহারকারীর সংখ্যা বাড়ার সাথে সাথে গড় আয়ুও বেড়েছে। r ≈ +০.৯৫ - অত্যন্ত শক্তিশালী সম্পর্ক! কিন্তু মোবাইল কি মানুষকে বাঁচিয়ে রাখে? না - দুটোই সময়ের সাথে বেড়েছে (অর্থনৈতিক উন্নয়ন, চিকিৎসার উন্নতি ইত্যাদি)।
কার্যকারণ প্রমাণ করতে কী লাগে?
কার্যকারণ প্রমাণ করতে শুধু সম্পর্ক যথেষ্ট নয়। দরকার:
- নিয়ন্ত্রিত পরীক্ষা: দৈবভাবে দুটো দল করে একটায় চিকিৎসা দেওয়া, অন্যটায় না দেওয়া।
- সময়ের ক্রম: কারণ অবশ্যই ফলের আগে ঘটতে হবে।
- বিকল্প ব্যাখ্যা বাদ দেওয়া: বিভ্রান্তিকর চলকগুলো নিয়ন্ত্রণ করা।
সম্পর্কের সীমাবদ্ধতা
- শুধু রৈখিক সম্পর্ক দেখে: r = ০ মানে "কোনো সম্পর্ক নেই" না - অ-রৈখিক সম্পর্ক থাকতে পারে। যেমন U আকৃতির সম্পর্ক।
- ব্যতিক্রমী মানে প্রভাবিত: একটা চরম মান r-কে অনেক বদলে দিতে পারে।
- দল মেশালে ভুল হতে পারে: দুটো আলাদা গ্রুপকে একসাথে দেখলে সম্পর্ক উল্টে যেতে পারে (সিম্পসনের প্যারাডক্স)।
একটা চায়ের দোকানের তাপমাত্রা ও বিক্রির সম্পর্ক ভাবুন। খুব ঠান্ডায় (শীতে) চায়ের বিক্রি বেশি। তাপমাত্রা বাড়লে কমে। কিন্তু খুব গরমে মানুষ আইস টি খায় - বিক্রি আবার বাড়ে। সম্পর্ক U আকৃতির - r এটা ধরতে পারবে না।
পারস্পরিক সম্পর্ক সহগ (r) দুটো চলকের রৈখিক সম্পর্কের শক্তি ও দিক মাপে, -১ থেকে +১ এর মধ্যে। কিন্তু সবচেয়ে গুরুত্বপূর্ণ কথা: সম্পর্ক মানে কার্যকারণ নয়। বিভ্রান্তিকর চলক লুকিয়ে থাকতে পারে। কার্যকারণ প্রমাণ করতে নিয়ন্ত্রিত পরীক্ষা দরকার। সম্পর্ক দেখলেই "এটা এটার কারণ" বলা পরিসংখ্যানের সবচেয়ে সাধারণ ভুল।