Ни өчен бары тик уртача җитми?
Алдагы дәрестә уртача, медиана, мода турында сөйләдек - алар мәгълүматның «үзәген» күрсәтә. Ләкин ике бөтенләй аерылган мәгълүмат төркеменең уртачасы бер булырга мөмкин. Аерманы аңлау өчен «тарату» күрсәткечләре кирәк.
Ике сыйныфның имтихан баллары:
А сыйныфы: 78, 79, 80, 81, 82. Уртача = 80.
Б сыйныфы: 50, 65, 80, 95, 110. Уртача = 80.
Уртача бер, ләкин мәгълүмат бөтенләй аерылган! А сыйныфында барысы якын, Б да - бик тарала.
Диапазон: иң гади күрсәткеч
Диапазон = Иң зур кыйммәт − Иң кечкенә кыйммәт
А сыйныфы диапазоны: 82 − 78 = 4
Б сыйныфы диапазоны: 110 − 50 = 60
Б сыйныфында баллар бик тарала - диапазон 15 тапкыр зуррак.
Диапазон исәпләү бик җиңел, ләкин бер зур кимчелеге бар: ул бары тик ике санга - иң зурга һәм иң кечкенәгә генә карый. Калган саннарны бөтенләй игнорь итә.
Рубин уеннарында бер сезон ярдәмчеләр саны: 3, 4, 4, 5, 5, 5, 5, 5, 4, 25
Диапазон: 25 − 3 = 22. Зур кебек, ләкин чынлыкта бер генә уен (25 ярдәмче) бөтен картинаны бозган. Калган уеннарда саннар бик якын.
Дисперсия: тулырак картина
Дисперсия - һәр кыйммәтнең уртачадан ничаклы ераклыгын үлчи. Барлык саннарны исәпкә ала, шуңа диапазоннан яхшырак.
Исәпләү адымнары:
- Уртачаны табыгыз.
- Һәр саннан уртачаны алыгыз (аерма).
- Һәр аерманы квадратка күтәрегез (тискәре саннардан котылу өчен).
- Квадратларның уртачасын табыгыз (сайлама өчен n−1 гә бүлегез).
Казанда 5 көн температура: 18, 20, 22, 19, 21. Уртача = 20°C.
Аермалар: −2, 0, +2, −1, +1
Квадратлар: 4, 0, 4, 1, 1
Квадратлар суммасы: 10
Дисперсия (сайлама): 10 ÷ (5−1) = 10 ÷ 4 = 2.5
Ни өчен квадратка күтәрәбез?
Уртачадан аермаларны гади итеп кушсагыз - алар һәрвакыт нольгә тигез. Тискәреләр уңайларны юкка чыгара. Квадратка күтәрү бу мәсьәләне хәл итә - барлык аермалар уңай була. (Абсолют кыйммәт тә мөмкин, ләкин квадрат математик яктан уңайлырак.)
Популяция дисперсиясе vs сайлама дисперсиясе
Мөһим аерма: бөтен популяцияне тикшерсәгез - n гә бүләсез. Сайламаны тикшерсәгез - n−1 гә бүләсез. Ни өчен n−1? Сайлама популяциядән кечерәк, шуңа n−1 гә бүлү чын дисперсияне яхшырак чамалый (бу «Бессель төзәтмәсе» дип атала).
Дисперсияне аңлау
- Дисперсия кечкенә - саннар уртачага якын, мәгълүмат тотрыклы.
- Дисперсия зур - саннар бик тарала, мәгълүмат тотрыксыз.
Татарстанның ике районында уртача бодай уңышы бер - 30 центнер/гектар. Ләкин:
Тукай районы: 28, 29, 30, 31, 32. Дисперсия = 2.5. Тотрыклы.
Чистай районы: 15, 20, 30, 40, 45. Дисперсия = 143.75. Бик тотрыксыз.
Тукай районына ышанырга мөмкин - уңыш елдан-елга бер. Чистайда - авыл хуҗалыгы рискка зуррак.
Диапазон vs дисперсия
- Диапазон: тиз исәпләнелә, аңлашылырлык, ләкин бары ике экстремаль санга карый.
- Дисперсия: барлык саннарны исәпкә ала, тулырак картина, ләкин квадратлы берәмлекләрдә (градус², сум²).
Диапазон - иң зур белән иң кечкенә арасы, гади, ләкин чикле. Дисперсия - һәр кыйммәтнең уртачадан ераклыгының квадратларының уртачасы, тулырак, ләкин квадратлы берәмлекләрдә. Икесе дә мәгълүматның «таралышын» күрсәтә - уртачалар бер булганда да мәгълүматлар бик аерыла алуын аңлата.