Читтән чыгучы күрсәткечләр

Катлаулылык: Башлангыч Уку вакыты: 8 минут

Читтән чыгучы нәрсә ул?

Читтән чыгучы (outlier) - калган мәгълүматтан аермалы рәвештә зур яки кечкенә кыйммәт. Ул «аерылып тора», калганнарга охшамый.

22 26 30 34 38 42 45 27.8 25.5

Читтән чыгучылар - проблема да, мөмкинлек тә булырга мөмкин. Кайвакыт алар хата нәтиҗәсе, кайвакыт - мөһим ачыш.

Мисал

Казанда 10 квартираның бәясе (млн сум): 3.5, 4.0, 3.8, 4.2, 3.9, 4.1, 3.7, 4.0, 3.6, 25.0

25 млн сумлык квартира - ачык читтән чыгучы. Калганнары 3.5-4.2 арасында.

Уртача: (барлыгы) ÷ 10 ≈ 5.98 млн. Бу сан типик квартираны чагылдырмый!

Медиана: 3.95 млн. Күпкә яхшырак.

Читтән чыгучылар кайдан килә?

  • Мәгълүмат хатасы: Хезмәткәр 3 500 урынына 35 000 язган. Бу - тикшерелергә тиеш.
  • Үлчәү хатасы: Термометр бозылган, ялгыш температура күрсәткән.
  • Табигый вариация: Кайбер кешеләр чыннан да бик бай, яки бик биек. Бу хата түгел.
  • Башка популяция: Мәгълүматка «ят» объект кергән. Мәсәлән, балалар авырлыгына өлкән кешене кушкансыз.
Мисал

Татарстан авыл хуҗалыгы статистикасында бер районның бодай уңышы 200 центнер/гектар дип язылган, калганнары 25-35. Бу чыннан да рекорд уңышмы, әллә хата? Тикшерергә кирәк. Чыгышы: хезмәткәр децимал нокта ялгыш куйган - чыннан да 20.0 булырга тиеш иде.

Читтән чыгучыларны ничек табарга?

1. Визуаль ысул

Чәчелмә диаграмма яки бокс-плот (ящик диаграммасы) ясагыз - читтән чыгучылар ачык күренәчәк.

8 20-24 15 25-29 5 30-34 2 35-39 1 40+

2. IQR ысулы

IQR (interquartile range) - уртадагы 50% мәгълүматның диапазоны. Формула:

  1. Мәгълүматны тәртипкә куегыз.
  2. Q1 (25-нче процентиль) һәм Q3 (75-нче процентиль) табыгыз.
  3. IQR = Q3 − Q1
  4. Түбән чик: Q1 − 1.5 × IQR
  5. Югары чик: Q3 + 1.5 × IQR
  6. Чиктән тыш - читтән чыгучы.
Мисал

Рубин уеннарында ярдәмчеләр: 3, 4, 4, 5, 5, 5, 6, 6, 7, 20

Q1 = 4, Q3 = 6, IQR = 2

Түбән чик: 4 − 1.5×2 = 1

Югары чик: 6 + 1.5×2 = 9

20 > 9 - читтән чыгучы!

3. Z-балл ысулы

Z-балл 3 тән зур яки −3 тән кечкенә булса - кыйммәт читтән чыгучы дип саналырга мөмкин.

Читтән чыгучылар белән нәрсә эшләргә?

  1. Сәбәбен тикшерегез. Хата? Төзәтегез. Чын кыйммәт? Калдырыгыз.
  2. Анализны икегә ясагыз: читтән чыгучы белән дә, аннан башка да. Нәтиҗәләр бик аерылсалар - бу мөһим.
  3. Медиана кулланыгыз. Медиана читтән чыгучыларга бирешми.
  4. Ялгыш итеп бетерегез дип ашыкмагыз. Кайвакыт читтән чыгучы - иң мөһим ачыш.
Мисал

Медицинада: тикшеренү вакытында бер пациентның кан басымы калганнардан бик аерылып тора. Бу хатамы? Юк - табиблар тикшерсәләр, пациентта сирәк авыру бар икән. Читтән чыгучы - мөһим ачыш булды!

Читтән чыгучылар уртачага тәэсире

Бер генә читтән чыгучы уртачаны бик үзгәртергә мөмкин, ләкин медиана һәм мода дигән кебек күрсәткечләргә аз тәэсир итә. Шуңа читтән чыгучылар булганда медиана файдалырак.

22 23 24 25 26 27 28 25.0 25.0
Төп нәтиҗә

Читтән чыгучы - калган мәгълүматтан аермалы рәвештә аерылган кыйммәт. Алар хата, табигый вариация яки мөһим ачыш булырга мөмкин. IQR ысулы яки Z-балл белән табып була. Читтән чыгучыларны автоматик бетермәгез - сәбәбен тикшерегез. Алар барда медиана уртачадан яхшырак хезмәт итә.