ব্যতিক্রমী মান

কঠিনতা: প্রাথমিক পড়ার সময়: 8 মিনিট

ব্যতিক্রমী মান কী?

ব্যতিক্রমী মান হলো ডেটায় এমন একটা মান যেটা বাকিদের থেকে অনেক আলাদা - অস্বাভাবিকভাবে বড় বা ছোট। এটাকে ইংরেজিতে outlier বলে। ধরুন আপনার ক্লাসে সবার উচ্চতা ৫ ফুট থেকে ৫ ফুট ১০ ইঞ্চির মধ্যে, কিন্তু একজন ৬ ফুট ৮ ইঞ্চি - সে একটা ব্যতিক্রমী মান।

22 26 30 34 38 42 45 27.8 25.5

ব্যতিক্রমী মান কেন হয়?

ব্যতিক্রমী মান আসতে পারে বিভিন্ন কারণে:

  • পরিমাপ বা তথ্য লেখার ভুল: কারো বয়স ২৫-এর বদলে ২৫০ লেখা হয়ে গেল।
  • স্বাভাবিক বিচিত্রতা: সাকিব আল হাসান ক্রিকেটে ব্যতিক্রম - তার পারফরম্যান্স আসলেই অসাধারণ, ভুল নয়।
  • ভিন্ন জনগোষ্ঠী: ঢাকায় বাড়ি ভাড়ার ডেটায় গুলশানের একটা পেন্টহাউসের ভাড়া - এটা আলাদা বাজার।
  • বিশেষ ঘটনা: ২০২০ সালে পর্যটনের ডেটায় কোভিড-১৯ এর প্রভাব।
উদাহরণ

ঢাকার ১০টা এলাকায় এক বেডরুমের ফ্ল্যাটের মাসিক ভাড়া (হাজার টাকায়):

৮, ৯, ১০, ১০, ১১, ১২, ১১, ১০, ৯, ৪৫

৪৫ হাজার টাকা স্পষ্টতই ব্যতিক্রমী - হয়তো গুলশান বা বনানীর একটা বিলাসবহুল ফ্ল্যাট। বাকি সব ৮-১২ হাজারের মধ্যে।

ব্যতিক্রমী মান কীভাবে প্রভাবিত করে?

গড়কে টেনে নিয়ে যায়

উদাহরণ

উপরের ভাড়ার ডেটায়:

8 20-24 15 25-29 5 30-34 2 35-39 1 40+
  • ব্যতিক্রমী মানসহ গড়: (৮+৯+১০+১০+১১+১২+১১+১০+৯+৪৫) ÷ ১০ = ১৩.৫ হাজার
  • ব্যতিক্রমী মান বাদে গড়: (৮+৯+১০+১০+১১+১২+১১+১০+৯) ÷ ৯ = ১০ হাজার

একটা মান গড়কে ১০ থেকে ১৩.৫ করে দিলো - ৩৫% বেশি!

মধ্যমা কিন্তু অটল: দুই ক্ষেত্রেই মধ্যমা ১০ হাজারের কাছাকাছি। এই কারণে বাড়ি ভাড়ার মতো ডেটায় মধ্যমা ব্যবহার করা উচিত।

আদর্শ বিচ্যুতি ও ভেদাঙ্ককে ফুলিয়ে দেয়

ব্যতিক্রমী মান গড় থেকে অনেক দূরে, তাই তার বর্গ বিচ্যুতি বিশাল হয়। এটা পুরো আদর্শ বিচ্যুতি বাড়িয়ে দেয়, মনে হয় ডেটা যতটা আসলে ছড়িয়ে তার চেয়ে বেশি ছড়িয়ে আছে।

কীভাবে চিনবেন?

পদ্ধতি ১: চোখে দেখা

ডেটা একটা বক্স প্লট বা হিস্টোগ্রামে আঁকলে ব্যতিক্রমী মান সাধারণত আলাদাভাবে দাঁড়িয়ে থাকে - বাকিদের থেকে দূরে।

পদ্ধতি ২: IQR পদ্ধতি

আন্তঃচতুর্থক পরিসর (IQR) ব্যবহার করে: Q1 - ১.৫×IQR-এর নিচে বা Q3 + ১.৫×IQR-এর উপরে থাকলে ব্যতিক্রমী।

পদ্ধতি ৩: আদর্শ বিচ্যুতি পদ্ধতি

গড় থেকে ৩ আদর্শ বিচ্যুতির বেশি দূরে থাকলে সাধারণত ব্যতিক্রমী ধরা হয়।

ব্যতিক্রমী মান পেলে কী করবেন?

গুরুত্বপূর্ণ প্রশ্ন: এটা কি ভুল না বাস্তব?

22 23 24 25 26 27 28 25.0 25.0
  • যদি ভুল হয় (ডেটা এন্ট্রি ভুল, যন্ত্রের ত্রুটি): ঠিক করুন বা বাদ দিন।
  • যদি বাস্তব হয়: বাদ দেওয়ার আগে ভালো করে ভাবুন। সাকিবের পারফরম্যান্স বাদ দিলে বাংলাদেশ ক্রিকেটের চিত্র ভুল হবে।
  • আলাদাভাবে বিশ্লেষণ করুন: ব্যতিক্রমী মানসহ আর ছাড়া দুভাবে দেখুন - দুটোই রিপোর্ট করুন।
  • মধ্যমা ব্যবহার করুন: গড়ের বদলে মধ্যমা ব্যবহার করলে ব্যতিক্রমী মান সমস্যা তৈরি করে না।
উদাহরণ

একটা স্কুলের ১০জন ছাত্রের মাসিক টিফিন খরচ (টাকায়): ২০০, ২৫০, ৩০০, ২৮০, ৩৫০, ২৭০, ৩১০, ২৬০, ২৯০, ৫০০০।

৫০০০ টাকা কি ব্যতিক্রমী? হ্যাঁ। এটা কি ভুল? হতে পারে - হয়তো ৫০০ টাকার বদলে ৫০০০ লেখা হয়েছে। অথবা সত্যিই একজন ছাত্র এত খরচ করে। কারণ না জেনে বাদ দেওয়া ঠিক না - আগে যাচাই করুন।

মূল বিষয়

ব্যতিক্রমী মান হলো ডেটায় অস্বাভাবিকভাবে আলাদা মান যা গড়, আদর্শ বিচ্যুতি এবং অন্যান্য পরিসংখ্যানকে বিকৃত করতে পারে। কখনো এটা ভুল, কখনো বাস্তব তথ্য। ব্যতিক্রমী মান দেখলে প্রথমে কারণ খুঁজুন, তারপর সিদ্ধান্ত নিন। কখনোই চোখ বন্ধ করে বাদ দেবেন না বা রেখে দেবেন না - সচেতন সিদ্ধান্ত নিন।