Определение
Центральная предельная теорема (ЦПТ) утверждает, что распределение выборочных средних приближается к нормальному распределению по мере увеличения размера выборки, независимо от формы распределения исходной генеральной совокупности. Это верно при условии, что выборки независимы и размер выборки достаточно велик.
Как это работает
Неважно, как выглядят исходные данные - асимметричные, равномерные, бимодальные - средние повторных выборок сформируют колоколообразную кривую.
Бросок одного кубика дает плоское (равномерное) распределение - каждое число от 1 до 6 равновероятно.
Но если вы бросите 30 кубиков и запишете среднее, а затем повторите это 1000 раз, распределение этих средних будет колоколообразным, с центром около 3.5.
Чем больше кубиков за один бросок, тем ближе распределение средних к идеальной нормальной кривой.
Почему это важно
Центральная предельная теорема, вероятно, самая важная теорема в статистике. Она обосновывает использование доверительных интервалов, проверки гипотез и многих других методов, предполагающих нормальность. Без ЦПТ эти инструменты работали бы только с данными, которые уже нормально распределены, что редко встречается в реальном мире.
ЦПТ также объясняет, почему средние более надежны, чем отдельные измерения. Изменчивость выборочных средних уменьшается по мере увеличения размера выборки (в 1/квадратный корень из n раз), поэтому более крупные исследования дают более точные оценки.
Центральная предельная теорема гарантирует, что выборочные средние приблизительно нормальны для достаточно больших выборок. Поэтому большинство статистических методов работают независимо от формы исходных данных.