গড় মধ্যমা ও প্রচুরক

কঠিনতা: প্রাথমিক পড়ার সময়: 10 মিনিট

"গড়" বলতে আসলে কী বোঝায়?

"বাংলাদেশে গড় পরিবারের আকার ৪.২ জন।" "SSC-তে গড় পাসের হার ৮৫%।" - আমরা প্রতিদিন "গড়" শব্দটা শুনি। কিন্তু ডেটার কেন্দ্র বোঝার একাধিক উপায় আছে, আর সব পরিস্থিতিতে একই উপায় কাজ করে না। এই পাঠে তিনটি পদ্ধতি শিখবো: গড় (mean), মধ্যমা (median), আর প্রচুরক (mode)।

2 5 8 11 14 15 5.5 5.0

গড় (Mean): সব যোগ করে ভাগ

গড় হলো সবচেয়ে পরিচিত পদ্ধতি। সব সংখ্যা যোগ করে মোট সংখ্যা দিয়ে ভাগ করলেই গড় পাওয়া যায়।

উদাহরণ

বিপিএল-এ একজন ব্যাটসম্যান পাঁচ ম্যাচে রান করেছেন: ৩৫, ৪২, ২৮, ৫১, ১৯।

ধাপ ১: যোগ: ৩৫ + ৪২ + ২৮ + ৫১ + ১৯ = ১৭৫

ধাপ ২: ভাগ: ১৭৫ ÷ ৫ = ৩৫

গড় রান ৩৫

গড় ভালো কাজ করে যখন সংখ্যাগুলো কাছাকাছি থাকে এবং কোনো চরম মান নেই। গড় সব সংখ্যা ব্যবহার করে - এটা যেমন শক্তি, তেমন দুর্বলতাও।

যখন গড় বিভ্রান্তিকর হয়

উদাহরণ

একটা ছোট কোম্পানিতে ৫ জনের মাসিক বেতন:

১৫,০০০ টাকা · ১৮,০০০ টাকা · ২০,০০০ টাকা · ২২,০০০ টাকা · ৩,০০,০০০ টাকা

গড় বেতন: (১৫,০০০ + ১৮,০০০ + ২০,০০০ + ২২,০০০ + ৩,০০,০০০) ÷ ৫ = ৭৫,০০০ টাকা

৭৫,০০০ টাকা কি একজন সাধারণ কর্মচারীর বেতন? মোটেও না! চারজন এর অনেক কম পায়। মালিকের ৩ লাখ টাকা বেতন গড়কে অনেক টেনে তুলেছে।

মধ্যমা (Median): ঠিক মাঝখানের সংখ্যা

মধ্যমা হলো সব সংখ্যাকে ছোট থেকে বড় সাজালে ঠিক মাঝখানে যে সংখ্যা বসে সেটা। অর্ধেক সংখ্যা এর চেয়ে কম, অর্ধেক বেশি।

2 1 3 2 5 3 5 4 8 5 3 6 1 7
উদাহরণ

একই বেতনগুলো সাজালে: ১৫,০০০ · ১৮,০০০ · ২০,০০০ · ২২,০০০ · ৩,০০,০০০

মধ্যমা = ২০,০০০ টাকা - মাঝখানের মান।

এটা অনেক বেশি বাস্তবসম্মত চিত্র দিচ্ছে একজন সাধারণ কর্মচারীর বেতনের।

জোড় সংখ্যক ডেটা থাকলে?

উদাহরণ

ছয়টা দোকানে এক কেজি চালের দাম: ৫৫, ৫৮, ৬০, ৬৫, ৬৮, ৭০ টাকা

মাঝখানে দুটো মান: ৬০ আর ৬৫। মধ্যমা = (৬০ + ৬৫) ÷ ২ = ৬২.৫ টাকা

মধ্যমার সবচেয়ে বড় গুণ - চরম মান একে প্রভাবিত করে না। মালিকের বেতন ৩ লাখের বদলে ৩০ লাখ হলেও মধ্যমা ২০,০০০ টাকাই থাকত। এই কারণে আয়ের হিসাবে সবসময় মধ্যমা ব্যবহার করা হয়।

প্রচুরক (Mode): যেটা সবচেয়ে বেশিবার আসে

প্রচুরক হলো সবচেয়ে ঘন ঘন যে মান দেখা যায়। এটা সবচেয়ে সহজ ধারণা এবং যেকোনো ধরনের ডেটায় কাজ করে - সংখ্যা না হলেও।

উদাহরণ

নিউমার্কেটে একটা জুতার দোকানে এক সপ্তাহে বিক্রি হওয়া সাইজ: ৭, ৮, ৯, ৯, ৯, ৮, ১০, ৯, ৮, ৯

সাইজ ৯ পাঁচবার - সবচেয়ে বেশি। প্রচুরক = সাইজ ৯

দোকানদারের জন্য কাজের তথ্য - সাইজ ৯-এর স্টক বেশি রাখতে হবে।

প্রচুরক শ্রেণিভিত্তিক ডেটায়ও কাজ করে। যদি জরিপে সবচেয়ে বেশি মানুষ বলে "ইলিশ" তাদের প্রিয় মাছ, তাহলে ইলিশ হলো প্রচুরক।

একাধিক প্রচুরক থাকতে পারে?

হ্যাঁ। দুটো মান সমান বেশিবার এলে দ্বিপ্রচুরক (bimodal), আর সব মান সমানবার এলে কোনো প্রচুরক নেই।

তিনটাকে পাশাপাশি দেখি

উদাহরণ

নয়জন রিকশাচালকের দৈনিক আয় (টাকায়): ৩০০, ৩৫০, ৪০০, ৪০০, ৪০০, ৪৫০, ৫০০, ৫৫০, ১২০০

20 30 40 50 60 70 80

গড়: (৩০০+৩৫০+৪০০+৪০০+৪০০+৪৫০+৫০০+৫৫০+১২০০) ÷ ৯ = ৪৫৫০ ÷ ৯ ≈ ৫০৬ টাকা

মধ্যমা: মাঝের মান (৫ম) = ৪০০ টাকা

প্রচুরক: ৪০০ তিনবার = ৪০০ টাকা

এখানে ১২০০ টাকা আয়ের রিকশাচালক (হয়তো অটো-রিকশা চালান) গড়কে টেনে তুলেছে। মধ্যমা আর প্রচুরক বেশি বাস্তবসম্মত চিত্র দিচ্ছে।

কখন কোনটা ব্যবহার করবেন?

গড়: ডেটায় চরম মান নেই এবং সব মান কাছাকাছি। বৈজ্ঞানিক গবেষণায় সবচেয়ে বেশি ব্যবহৃত।

মধ্যমা: ডেটায় চরম মান আছে বা ডেটা একদিকে হেলে আছে। আয়, বাড়ির দাম, জমির দাম - এসবে সবসময় মধ্যমা ভালো।

প্রচুরক: সবচেয়ে জনপ্রিয় বা ঘন ঘন মান জানতে চাইলে। শ্রেণিভিত্তিক ডেটায় (পছন্দের রং, জনপ্রিয় পণ্য) একমাত্র বিকল্প।

সাবধানতা: "গড়" দেখলে প্রশ্ন করুন

সংবাদে বা বিজ্ঞাপনে "গড়" দেখলে ভাবুন - কোন গড়? একটা রিয়েল এস্টেট কোম্পানি বলতে পারে "আমাদের ফ্ল্যাটের গড় দাম ৫০ লাখ টাকা" - গড় ব্যবহার করে যেটা কয়েকটা দামি পেন্টহাউস টেনে তুলেছে। মধ্যমা হয়তো ৩৫ লাখ। দুটো সংখ্যাই সঠিক, কিন্তু গল্প আলাদা।

মূল বিষয়

গড় সব মান যোগ করে ভাগ করে - দরকারি কিন্তু চরম মানে প্রভাবিত। মধ্যমা মাঝের মান - চরম মান থাকলে ভালো কাজ করে। প্রচুরক সবচেয়ে ঘন ঘন মান - যেকোনো ধরনের ডেটায় কাজ করে। কোনটা ব্যবহার হচ্ছে (এবং কেন) সেটা বুঝলেই আপনি পরিসংখ্যানের ফাঁদে পড়বেন না।