Диапазон һәм дисперсия

Катлаулылык: Башлангыч Уку вакыты: 10 минут

Ни өчен бары тик уртача җитми?

Алдагы дәрестә уртача, медиана, мода турында сөйләдек - алар мәгълүматның «үзәген» күрсәтә. Ләкин ике бөтенләй аерылган мәгълүмат төркеменең уртачасы бер булырга мөмкин. Аерманы аңлау өчен «тарату» күрсәткечләре кирәк.

10 12 14 16 18 20 15.0
Мисал

Ике сыйныфның имтихан баллары:

А сыйныфы: 78, 79, 80, 81, 82. Уртача = 80.

Б сыйныфы: 50, 65, 80, 95, 110. Уртача = 80.

Уртача бер, ләкин мәгълүмат бөтенләй аерылган! А сыйныфында барысы якын, Б да - бик тарала.

Диапазон: иң гади күрсәткеч

Диапазон = Иң зур кыйммәт − Иң кечкенә кыйммәт

Мисал

А сыйныфы диапазоны: 82 − 78 = 4

Б сыйныфы диапазоны: 110 − 50 = 60

Б сыйныфында баллар бик тарала - диапазон 15 тапкыр зуррак.

Диапазон исәпләү бик җиңел, ләкин бер зур кимчелеге бар: ул бары тик ике санга - иң зурга һәм иң кечкенәгә генә карый. Калган саннарны бөтенләй игнорь итә.

Мисал

Рубин уеннарында бер сезон ярдәмчеләр саны: 3, 4, 4, 5, 5, 5, 5, 5, 4, 25

Диапазон: 25 − 3 = 22. Зур кебек, ләкин чынлыкта бер генә уен (25 ярдәмче) бөтен картинаны бозган. Калган уеннарда саннар бик якын.

Дисперсия: тулырак картина

Дисперсия - һәр кыйммәтнең уртачадан ничаклы ераклыгын үлчи. Барлык саннарны исәпкә ала, шуңа диапазоннан яхшырак.

Исәпләү адымнары:

  1. Уртачаны табыгыз.
  2. Һәр саннан уртачаны алыгыз (аерма).
  3. Һәр аерманы квадратка күтәрегез (тискәре саннардан котылу өчен).
  4. Квадратларның уртачасын табыгыз (сайлама өчен n−1 гә бүлегез).
Мисал

Казанда 5 көн температура: 18, 20, 22, 19, 21. Уртача = 20°C.

Аермалар: −2, 0, +2, −1, +1

Квадратлар: 4, 0, 4, 1, 1

Квадратлар суммасы: 10

Дисперсия (сайлама): 10 ÷ (5−1) = 10 ÷ 4 = 2.5

Ни өчен квадратка күтәрәбез?

Уртачадан аермаларны гади итеп кушсагыз - алар һәрвакыт нольгә тигез. Тискәреләр уңайларны юкка чыгара. Квадратка күтәрү бу мәсьәләне хәл итә - барлык аермалар уңай була. (Абсолют кыйммәт тә мөмкин, ләкин квадрат математик яктан уңайлырак.)

Популяция дисперсиясе vs сайлама дисперсиясе

Мөһим аерма: бөтен популяцияне тикшерсәгез - n гә бүләсез. Сайламаны тикшерсәгез - n−1 гә бүләсез. Ни өчен n−1? Сайлама популяциядән кечерәк, шуңа n−1 гә бүлү чын дисперсияне яхшырак чамалый (бу «Бессель төзәтмәсе» дип атала).

Дисперсияне аңлау

  • Дисперсия кечкенә - саннар уртачага якын, мәгълүмат тотрыклы.
  • Дисперсия зур - саннар бик тарала, мәгълүмат тотрыксыз.
Мисал

Татарстанның ике районында уртача бодай уңышы бер - 30 центнер/гектар. Ләкин:

Тукай районы: 28, 29, 30, 31, 32. Дисперсия = 2.5. Тотрыклы.

Чистай районы: 15, 20, 30, 40, 45. Дисперсия = 143.75. Бик тотрыксыз.

Тукай районына ышанырга мөмкин - уңыш елдан-елга бер. Чистайда - авыл хуҗалыгы рискка зуррак.

Диапазон vs дисперсия

  • Диапазон: тиз исәпләнелә, аңлашылырлык, ләкин бары ике экстремаль санга карый.
  • Дисперсия: барлык саннарны исәпкә ала, тулырак картина, ләкин квадратлы берәмлекләрдә (градус², сум²).
Төп нәтиҗә

Диапазон - иң зур белән иң кечкенә арасы, гади, ләкин чикле. Дисперсия - һәр кыйммәтнең уртачадан ераклыгының квадратларының уртачасы, тулырак, ләкин квадратлы берәмлекләрдә. Икесе дә мәгълүматның «таралышын» күрсәтә - уртачалар бер булганда да мәгълүматлар бик аерыла алуын аңлата.