Довірчі інтервали

Складність: Середній Час читання: 12 хвилин

Від точки до діапазону

Коли ви кажете "середня зарплата в Україні -- 19 000 грн", це точкова оцінка -- одне число. Але наскільки ви впевнені? Чи може справжнє значення бути 18 500 або 19 500? Довірчий інтервал відповідає на це запитання, даючи діапазон замість одного числа.

95% ДІ 48 52 56 50
Приклад

Опитування Держстату: "Середня зарплата -- 19 000 грн, 95% довірчий інтервал: від 18 400 до 19 600 грн." Це означає: якби ми провели це опитування 100 разів, у 95 випадках справжнє значення потрапило б у розрахований інтервал.

Що означає "95% впевненості"?

Це НЕ означає "ймовірність 95%, що справжнє значення в цьому інтервалі". Справжнє значення або в інтервалі, або ні -- воно фіксоване. "95% впевненості" означає: метод, яким ми побудували інтервал, правильний у 95% випадків у довгостроковій перспективі.

Аналогія: мисливець, що влучає у ціль 95 разів зі 100. Для конкретного пострілу він або влучив, або ні. Але ви на 95% впевнені, що він влучить, бо його метод надійний.

Як побудувати довірчий інтервал

Формула для 95% довірчого інтервалу середнього:

Середнє ± 1,96 × (стандартне відхилення / √n)

Число 1,96 відповідає 95% рівню. Для 99% це 2,576.

Приклад

Опитування 400 клієнтів Rozetka. Середня оцінка задоволеності: 4,2 з 5. Стандартне відхилення: 0,8.

Стандартна похибка = 0,8 / √400 = 0,8 / 20 = 0,04

95% довірчий інтервал: 4,2 ± 1,96 × 0,04 = 4,2 ± 0,078

Інтервал: від 4,12 до 4,28. Ми на 95% впевнені, що справжня середня оцінка всіх клієнтів -- в цьому діапазоні.

Що впливає на ширину інтервалу?

  • Розмір вибірки (n): Більша вибірка = вужчий інтервал = точніша оцінка. n у знаменнику під коренем.
  • Розсіювання даних (σ): Більший розкид = ширший інтервал. Якщо дані "стрибають", оцінка менш точна.
  • Рівень довіри: 99% інтервал ширший за 95%, який ширший за 90%. Більша впевненість = ширший діапазон.
Приклад

Перед виборами опитали 1 000 людей: 52% підтримують кандидата А. 95% довірчий інтервал: 49-55%. Опитали 4 000: інтервал звужується до 50,5-53,5%. Більша вибірка -- точніший результат. Але зверніть увагу: вибірка зросла в 4 рази, а інтервал звузився лише вдвічі (правило √n).

Довірчі інтервали vs p-значення

Довірчий інтервал дає більше інформації, ніж p-значення. p-значення каже тільки "є ефект чи ні". Довірчий інтервал каже "ефект, ймовірно, від X до Y". Якщо довірчий інтервал для різниці не включає 0, результат статистично значущий.

99% ДІ 44 52 60 50
Приклад

Різниця середніх балів НМТ між двома методиками: 8 балів. 95% ДІ: від 2 до 14. Інтервал не включає 0, отже різниця значуща. Але ми також бачимо: ефект може бути і 2 бали (невеликий), і 14 (суттєвий). Це набагато інформативніше, ніж просто "p = 0,02".

Поширені помилки

  • "Ймовірність 95%, що справжнє значення в інтервалі." Технічно неправильно. Справжнє значення фіксоване. Метод правильний у 95% випадків.
  • "Вузький інтервал = точні дані." Тільки якщо вибірка репрезентативна. Упереджена вибірка дасть вузький, але хибний інтервал.
  • Ігнорування ширини інтервалу. Інтервал від -5 до +25 технічно значущий (не включає 0), але настільки широкий, що практичної цінності мало.
Ключовий висновок

Довірчий інтервал дає діапазон правдоподібних значень для параметра генеральної сукупності. 95% рівень довіри означає, що метод правильний у 95% випадків при повторних вибірках. Ширина інтервалу залежить від розміру вибірки, розсіювання даних та рівня довіри. Довірчі інтервали інформативніші за p-значення, бо показують і наявність ефекту, і його можливий діапазон.