Новая информация меняет всё
Представьте: вы собираетесь выходить из дома. Проверяете прогноз — вероятность дождя 30%. Потом выглядываете в окно и видите тёмные тучи. Это меняет вашу оценку? Конечно.
В этом суть условной вероятности: вероятность события меняется, когда вы узнаёте новую информацию. Вероятность дождя при условии, что вы видите тёмные тучи, отличается от общей вероятности дождя в любой случайный день.
Ключевая фраза: «при условии, что»
В теории вероятностей фраза «при условии, что» — сигнал, что речь об условной вероятности. Она означает, что вы уже знаете о каком-то событии и хотите понять, как это влияет на вероятность другого.
Математики записывают это так:
P(A | B) — читается «вероятность A при условии, что произошло B».
Вертикальная черта «|» — просто сокращение для «при условии, что». Не нужно заучивать обозначения — просто помните, что условная вероятность отвечает на вопрос: «Теперь, когда я знаю вот это, как это влияет на шансы вон того?»
Простой пример: цветные шарики
В банке 4 красных и 6 синих шариков (всего 10). Вы достаёте один не глядя. Вероятность достать красный: 4/10 = 0,40.
Теперь представьте, что кто-то заглянул и сказал: «Шарик, который ты достал, НЕ синий». С этой информацией вы знаете, что шарик красный. Вероятность красного при условии «не синий» теперь 1,00 — полная уверенность.
Это условная вероятность в действии. Новая информация («не синий») полностью изменила вероятность.
Большинство реальных случаев менее экстремальны, но принцип тот же: новая информация сужает круг возможностей и меняет вероятности.
Формула (простым языком)
Формула условной вероятности:
P(A | B) = P(A и B) ÷ P(B)
Словами: чтобы найти вероятность A при условии, что произошло B, возьмите вероятность того, что оба события A и B произошли, и разделите на вероятность B.
Почему это работает? Когда вы знаете, что B произошло, вы уже не смотрите на все возможные исходы — только на те, где B случилось. Деление на P(B) «увеличивает масштаб» этого маленького мира.
В школе 60% учеников занимаются спортом. Из всех учеников 24% и занимаются спортом, и учатся на отлично. Какова вероятность, что ученик — отличник, если он занимается спортом?
P(отличник | спорт) = P(отличник и спорт) ÷ P(спорт)
= 0,24 ÷ 0,60 = 0,40, или 40%.
Среди учеников-спортсменов 40% — отличники.
Пример из жизни: медицинские тесты
Медицинские тесты — одно из самых важных и одновременно самых непонятых применений условной вероятности. Вот сценарий, который ставит в тупик даже врачей:
Болезнь встречается у 1% населения. Тест на эту болезнь точен на 90%, а именно:
- Если вы БОЛЕЕТЕ, тест правильно показывает «положительно» в 90% случаев.
- Если вы НЕ болеете, тест правильно показывает «отрицательно» в 90% случаев (но ошибочно показывает «положительно» в 10% случаев).
Вы сдали тест, и он положительный. Какова вероятность, что вы действительно больны?
Большинство людей говорят «около 90%». Реальный ответ значительно ниже. Разберём на 1000 воображаемых людях:
- 10 человек реально больны (1% от 1000).
- Из этих 10 тест правильно определит 9 как положительных (90% точности).
- 990 человек НЕ больны.
- Из этих 990 тест ошибочно покажет положительный результат у 99 человек (10% ложных срабатываний).
Всего положительных результатов: 9 + 99 = 108. Но только 9 из этих 108 реально больны.
P(болезнь | положительный тест) = 9 ÷ 108 = 0,083, или около 8,3%.
Даже при «90%-ной точности» теста положительный результат означает лишь около 8% вероятности болезни. Это потому, что болезнь редкая, и ложные срабатывания от большой здоровой группы значительно превышают истинные положительные от маленькой группы больных.
Это не изъян теста — так работает условная вероятность, когда базовая частота (насколько распространена болезнь) низкая. Понимание этого может уберечь вас от ненужной паники после скрининга.
Пример из жизни: погода
В Москве дождь идёт примерно 20% дней в году. В дождливые дни утром облачно в 85% случаев. В сухие дни утренняя облачность бывает в 30% случаев.
Вы просыпаетесь и видите облака. Какова вероятность дождя?
Возьмём 100 дней как нашу выборку:
- 20 дней с дождём. Из них 17 были облачными утром (85% от 20).
- 80 дней без дождя. Из них 24 были облачными утром (30% от 80).
Всего дней с утренней облачностью: 17 + 24 = 41.
Из этих 41 облачного утра 17 привели к дождю.
P(дождь | облачность) = 17 ÷ 41 = 0,415, или около 41,5%.
Облака подняли вероятность дождя с 20% до примерно 42%. Информация помогла, но облака сами по себе не гарантируют дождь.
Независимые и зависимые события — повторение
В предыдущем уроке мы упоминали, что одни события независимы (одно не влияет на другое), а другие зависимы (одно меняет вероятность другого). Условная вероятность даёт точный способ проверить это:
Если P(A | B) = P(A), то A и B независимы.
Другими словами, если знание о том, что B произошло, не меняет вероятность A, события не влияют друг на друга. Если знание о B меняет вероятность A — события зависимы.
Допустим, 50% покупателей в кофейне заказывают кофе. Среди тех, кто приходит до 9 утра, кофе заказывают 75%. Поскольку P(кофе | до 9 утра) = 0,75 отличается от P(кофе) = 0,50, время прихода и заказ кофе — зависимые события. Ранние посетители чаще хотят кофе.
Почему условная вероятность путает людей
Наш мозг от природы не приспособлен к условной вероятности. Мы склонны к двум типичным ошибкам:
- Игнорирование базовой частоты. В примере с медицинским тестом люди фокусируются на 90%-ной точности и забывают, что болезнь редкая. Редкость болезни — ключевая информация.
- Путаница с направлением. P(положительный тест | болезнь) — это НЕ то же самое, что P(болезнь | положительный тест). Вероятность положительного теста, если вы больны, — 90%. Но вероятность того, что вы больны, если тест положительный, — всего 8%. Направление имеет огромное значение.
Эта вторая ошибка настолько распространена, что у неё есть название: ошибка обвинителя. Она встречается в судах, медицинских кабинетах и газетных заголовках. Осведомлённость о ней делает вас более проницательным мыслителем.
Практические советы
- Используйте конкретные числа. Вместо абстрактных процентов представьте 100 или 1000 человек. Так математика становится нагляднее, а результаты — понятнее.
- Спрашивайте «что изменилось?» Каждый раз, когда вы узнаёте новую информацию, спросите себя: «Это меняет шансы?» Если да — вы в зоне условной вероятности.
- Следите за направлением. Всегда чётко определяйте, какое событие «дано». P(A | B) и P(B | A) — обычно совершенно разные числа.
Условная вероятность показывает, как вероятность события меняется при получении новой информации. Формула P(A | B) = P(A и B) ÷ P(B) выражает это математически, но главный практический урок таков: всегда учитывайте базовую частоту (насколько что-то распространено изначально) и никогда не путайте P(A | B) с P(B | A). Использование конкретных чисел — например, представить 1000 человек — делает условную вероятность гораздо понятнее.