Від точки до діапазону
Коли ви кажете "середня зарплата в Україні -- 19 000 грн", це точкова оцінка -- одне число. Але наскільки ви впевнені? Чи може справжнє значення бути 18 500 або 19 500? Довірчий інтервал відповідає на це запитання, даючи діапазон замість одного числа.
Опитування Держстату: "Середня зарплата -- 19 000 грн, 95% довірчий інтервал: від 18 400 до 19 600 грн." Це означає: якби ми провели це опитування 100 разів, у 95 випадках справжнє значення потрапило б у розрахований інтервал.
Що означає "95% впевненості"?
Це НЕ означає "ймовірність 95%, що справжнє значення в цьому інтервалі". Справжнє значення або в інтервалі, або ні -- воно фіксоване. "95% впевненості" означає: метод, яким ми побудували інтервал, правильний у 95% випадків у довгостроковій перспективі.
Аналогія: мисливець, що влучає у ціль 95 разів зі 100. Для конкретного пострілу він або влучив, або ні. Але ви на 95% впевнені, що він влучить, бо його метод надійний.
Як побудувати довірчий інтервал
Формула для 95% довірчого інтервалу середнього:
Середнє ± 1,96 × (стандартне відхилення / √n)
Число 1,96 відповідає 95% рівню. Для 99% це 2,576.
Опитування 400 клієнтів Rozetka. Середня оцінка задоволеності: 4,2 з 5. Стандартне відхилення: 0,8.
Стандартна похибка = 0,8 / √400 = 0,8 / 20 = 0,04
95% довірчий інтервал: 4,2 ± 1,96 × 0,04 = 4,2 ± 0,078
Інтервал: від 4,12 до 4,28. Ми на 95% впевнені, що справжня середня оцінка всіх клієнтів -- в цьому діапазоні.
Що впливає на ширину інтервалу?
- Розмір вибірки (n): Більша вибірка = вужчий інтервал = точніша оцінка. n у знаменнику під коренем.
- Розсіювання даних (σ): Більший розкид = ширший інтервал. Якщо дані "стрибають", оцінка менш точна.
- Рівень довіри: 99% інтервал ширший за 95%, який ширший за 90%. Більша впевненість = ширший діапазон.
Перед виборами опитали 1 000 людей: 52% підтримують кандидата А. 95% довірчий інтервал: 49-55%. Опитали 4 000: інтервал звужується до 50,5-53,5%. Більша вибірка -- точніший результат. Але зверніть увагу: вибірка зросла в 4 рази, а інтервал звузився лише вдвічі (правило √n).
Довірчі інтервали vs p-значення
Довірчий інтервал дає більше інформації, ніж p-значення. p-значення каже тільки "є ефект чи ні". Довірчий інтервал каже "ефект, ймовірно, від X до Y". Якщо довірчий інтервал для різниці не включає 0, результат статистично значущий.
Різниця середніх балів НМТ між двома методиками: 8 балів. 95% ДІ: від 2 до 14. Інтервал не включає 0, отже різниця значуща. Але ми також бачимо: ефект може бути і 2 бали (невеликий), і 14 (суттєвий). Це набагато інформативніше, ніж просто "p = 0,02".
Поширені помилки
- "Ймовірність 95%, що справжнє значення в інтервалі." Технічно неправильно. Справжнє значення фіксоване. Метод правильний у 95% випадків.
- "Вузький інтервал = точні дані." Тільки якщо вибірка репрезентативна. Упереджена вибірка дасть вузький, але хибний інтервал.
- Ігнорування ширини інтервалу. Інтервал від -5 до +25 технічно значущий (не включає 0), але настільки широкий, що практичної цінності мало.
Довірчий інтервал дає діапазон правдоподібних значень для параметра генеральної сукупності. 95% рівень довіри означає, що метод правильний у 95% випадків при повторних вибірках. Ширина інтервалу залежить від розміру вибірки, розсіювання даних та рівня довіри. Довірчі інтервали інформативніші за p-значення, бо показують і наявність ефекту, і його можливий діапазон.