"গড়" বলতে আসলে কী বোঝায়?
"বাংলাদেশে গড় পরিবারের আকার ৪.২ জন।" "SSC-তে গড় পাসের হার ৮৫%।" - আমরা প্রতিদিন "গড়" শব্দটা শুনি। কিন্তু ডেটার কেন্দ্র বোঝার একাধিক উপায় আছে, আর সব পরিস্থিতিতে একই উপায় কাজ করে না। এই পাঠে তিনটি পদ্ধতি শিখবো: গড় (mean), মধ্যমা (median), আর প্রচুরক (mode)।
গড় (Mean): সব যোগ করে ভাগ
গড় হলো সবচেয়ে পরিচিত পদ্ধতি। সব সংখ্যা যোগ করে মোট সংখ্যা দিয়ে ভাগ করলেই গড় পাওয়া যায়।
বিপিএল-এ একজন ব্যাটসম্যান পাঁচ ম্যাচে রান করেছেন: ৩৫, ৪২, ২৮, ৫১, ১৯।
ধাপ ১: যোগ: ৩৫ + ৪২ + ২৮ + ৫১ + ১৯ = ১৭৫
ধাপ ২: ভাগ: ১৭৫ ÷ ৫ = ৩৫
গড় রান ৩৫।
গড় ভালো কাজ করে যখন সংখ্যাগুলো কাছাকাছি থাকে এবং কোনো চরম মান নেই। গড় সব সংখ্যা ব্যবহার করে - এটা যেমন শক্তি, তেমন দুর্বলতাও।
যখন গড় বিভ্রান্তিকর হয়
একটা ছোট কোম্পানিতে ৫ জনের মাসিক বেতন:
১৫,০০০ টাকা · ১৮,০০০ টাকা · ২০,০০০ টাকা · ২২,০০০ টাকা · ৩,০০,০০০ টাকা
গড় বেতন: (১৫,০০০ + ১৮,০০০ + ২০,০০০ + ২২,০০০ + ৩,০০,০০০) ÷ ৫ = ৭৫,০০০ টাকা
৭৫,০০০ টাকা কি একজন সাধারণ কর্মচারীর বেতন? মোটেও না! চারজন এর অনেক কম পায়। মালিকের ৩ লাখ টাকা বেতন গড়কে অনেক টেনে তুলেছে।
মধ্যমা (Median): ঠিক মাঝখানের সংখ্যা
মধ্যমা হলো সব সংখ্যাকে ছোট থেকে বড় সাজালে ঠিক মাঝখানে যে সংখ্যা বসে সেটা। অর্ধেক সংখ্যা এর চেয়ে কম, অর্ধেক বেশি।
একই বেতনগুলো সাজালে: ১৫,০০০ · ১৮,০০০ · ২০,০০০ · ২২,০০০ · ৩,০০,০০০
মধ্যমা = ২০,০০০ টাকা - মাঝখানের মান।
এটা অনেক বেশি বাস্তবসম্মত চিত্র দিচ্ছে একজন সাধারণ কর্মচারীর বেতনের।
জোড় সংখ্যক ডেটা থাকলে?
ছয়টা দোকানে এক কেজি চালের দাম: ৫৫, ৫৮, ৬০, ৬৫, ৬৮, ৭০ টাকা
মাঝখানে দুটো মান: ৬০ আর ৬৫। মধ্যমা = (৬০ + ৬৫) ÷ ২ = ৬২.৫ টাকা
মধ্যমার সবচেয়ে বড় গুণ - চরম মান একে প্রভাবিত করে না। মালিকের বেতন ৩ লাখের বদলে ৩০ লাখ হলেও মধ্যমা ২০,০০০ টাকাই থাকত। এই কারণে আয়ের হিসাবে সবসময় মধ্যমা ব্যবহার করা হয়।
প্রচুরক (Mode): যেটা সবচেয়ে বেশিবার আসে
প্রচুরক হলো সবচেয়ে ঘন ঘন যে মান দেখা যায়। এটা সবচেয়ে সহজ ধারণা এবং যেকোনো ধরনের ডেটায় কাজ করে - সংখ্যা না হলেও।
নিউমার্কেটে একটা জুতার দোকানে এক সপ্তাহে বিক্রি হওয়া সাইজ: ৭, ৮, ৯, ৯, ৯, ৮, ১০, ৯, ৮, ৯
সাইজ ৯ পাঁচবার - সবচেয়ে বেশি। প্রচুরক = সাইজ ৯।
দোকানদারের জন্য কাজের তথ্য - সাইজ ৯-এর স্টক বেশি রাখতে হবে।
প্রচুরক শ্রেণিভিত্তিক ডেটায়ও কাজ করে। যদি জরিপে সবচেয়ে বেশি মানুষ বলে "ইলিশ" তাদের প্রিয় মাছ, তাহলে ইলিশ হলো প্রচুরক।
একাধিক প্রচুরক থাকতে পারে?
হ্যাঁ। দুটো মান সমান বেশিবার এলে দ্বিপ্রচুরক (bimodal), আর সব মান সমানবার এলে কোনো প্রচুরক নেই।
তিনটাকে পাশাপাশি দেখি
নয়জন রিকশাচালকের দৈনিক আয় (টাকায়): ৩০০, ৩৫০, ৪০০, ৪০০, ৪০০, ৪৫০, ৫০০, ৫৫০, ১২০০
গড়: (৩০০+৩৫০+৪০০+৪০০+৪০০+৪৫০+৫০০+৫৫০+১২০০) ÷ ৯ = ৪৫৫০ ÷ ৯ ≈ ৫০৬ টাকা
মধ্যমা: মাঝের মান (৫ম) = ৪০০ টাকা
প্রচুরক: ৪০০ তিনবার = ৪০০ টাকা
এখানে ১২০০ টাকা আয়ের রিকশাচালক (হয়তো অটো-রিকশা চালান) গড়কে টেনে তুলেছে। মধ্যমা আর প্রচুরক বেশি বাস্তবসম্মত চিত্র দিচ্ছে।
কখন কোনটা ব্যবহার করবেন?
গড়: ডেটায় চরম মান নেই এবং সব মান কাছাকাছি। বৈজ্ঞানিক গবেষণায় সবচেয়ে বেশি ব্যবহৃত।
মধ্যমা: ডেটায় চরম মান আছে বা ডেটা একদিকে হেলে আছে। আয়, বাড়ির দাম, জমির দাম - এসবে সবসময় মধ্যমা ভালো।
প্রচুরক: সবচেয়ে জনপ্রিয় বা ঘন ঘন মান জানতে চাইলে। শ্রেণিভিত্তিক ডেটায় (পছন্দের রং, জনপ্রিয় পণ্য) একমাত্র বিকল্প।
সাবধানতা: "গড়" দেখলে প্রশ্ন করুন
সংবাদে বা বিজ্ঞাপনে "গড়" দেখলে ভাবুন - কোন গড়? একটা রিয়েল এস্টেট কোম্পানি বলতে পারে "আমাদের ফ্ল্যাটের গড় দাম ৫০ লাখ টাকা" - গড় ব্যবহার করে যেটা কয়েকটা দামি পেন্টহাউস টেনে তুলেছে। মধ্যমা হয়তো ৩৫ লাখ। দুটো সংখ্যাই সঠিক, কিন্তু গল্প আলাদা।
গড় সব মান যোগ করে ভাগ করে - দরকারি কিন্তু চরম মানে প্রভাবিত। মধ্যমা মাঝের মান - চরম মান থাকলে ভালো কাজ করে। প্রচুরক সবচেয়ে ঘন ঘন মান - যেকোনো ধরনের ডেটায় কাজ করে। কোনটা ব্যবহার হচ্ছে (এবং কেন) সেটা বুঝলেই আপনি পরিসংখ্যানের ফাঁদে পড়বেন না।