Переменные простым языком

Сложность: Начальный Время чтения: 8 минут

Что такое переменная?

Переменная — это всё, что может меняться или принимать разные значения. Вот и всё. Если что-то отличается от человека к человеку, от места к месту или от момента к моменту — это переменная.

2 4 6 8 15 20 25 30 35 40

Ваш возраст — переменная, потому что он меняется со временем. Размер обуви — переменная, потому что у разных людей он разный. Температура за окном — переменная, потому что она меняется в течение дня. Даже «завтракали ли вы сегодня» — переменная: ответ может быть «да» или «нет», и он различается от человека к человеку и ото дня ко дню.

В статистике мы изучаем переменные, чтобы понять, как они себя ведут и, что ещё важнее, как они связаны друг с другом. Помогает ли больше сна лучше сдать экзамен? Снижают ли физические нагрузки давление? Эти вопросы — о связях между переменными.

Независимые переменные

Независимая переменная — это фактор, который, по вашему предположению, может вызвать или повлиять на изменение. Это «вход», то, что вы целенаправленно меняете в эксперименте. Иногда её называют «объясняющей переменной», потому что именно она, как вы думаете, объясняет различия.

Пример

Влияет ли подготовка на оценку? Студент хочет узнать, приводит ли более долгая подготовка к лучшим результатам на экзамене. Здесь количество часов подготовки — независимая переменная. Это вход, то, что меняется. Студент может готовиться 1 час, 3 часа или 5 часов и посмотреть, что произойдёт с оценкой.

Независимая переменная не обязательно должна быть тем, чем вы активно управляете. Во многих исследованиях её просто наблюдают. Например, если вы изучаете, пьют ли жители южных регионов больше воды, климат (тёплый или холодный) — независимая переменная. Вы не меняете климат, а наблюдаете, связаны ли различия в климате с различиями в потреблении воды.

Зависимые переменные

Зависимая переменная — это результат, который вы измеряете. Это то, что, по вашему предположению, может измениться под влиянием независимой переменной. Она «зависит» от независимой, отсюда и название. Иногда её называют «откликом», потому что она реагирует на изменения другой переменной.

Пример

Влияет ли спорт на качество сна? Вы хотите узнать, помогают ли регулярные тренировки лучше спать. Независимая переменная — объём физической нагрузки (нет, 30 минут в день, 60 минут в день). Зависимая переменная — качество сна, например, количество часов сна или самооценка по шкале от 1 до 10. Качество сна — то, что вы измеряете, чтобы увидеть, меняется ли оно при изменении нагрузки.

Как их различить

Простой приём: спросите себя «что из двух может быть причиной изменения другого?». Причина (или предполагаемая причина) — независимая переменная. Следствие (или предполагаемое следствие) — зависимая.

  • Растут ли растения быстрее, если их чаще поливать? Независимая: частота полива. Зависимая: рост растений.
  • Улучшает ли завтрак концентрацию на работе? Независимая: завтракал человек или нет. Зависимая: уровень концентрации.
  • Влияет ли цена на количество покупок? Независимая: цена. Зависимая: количество покупок.
  • Влияет ли температура в комнате на скорость таяния мороженого? Независимая: температура. Зависимая: время таяния.
Пример

Выпечка пирожков. Вы печёте пирожки и хотите понять, как температура духовки влияет на время готовки. Вы пробуете 160, 180 и 200 градусов. Температура духовки — независимая переменная (вы её меняете). Время до готовности — зависимая переменная (вы его измеряете). Ожидание: при более высокой температуре пирожки будут готовы быстрее.

Смешивающие переменные: скрытые подвохи

А вот тут начинается самое интересное — и именно здесь многих обманывают. Смешивающая переменная (конфаундер) — это скрытый фактор, который влияет одновременно на независимую и зависимую переменные, создавая видимость прямой связи, хотя реальность сложнее.

Смешивающие переменные — причина знаменитого предупреждения: корреляция не означает причинно-следственную связь. То, что два явления происходят одновременно, не значит, что одно вызывает другое. Возможно, оба обусловлены чем-то третьим.

Пример

Мороженое и утопления. Данные показывают: когда растут продажи мороженого, растёт и число утоплений. Мороженое вызывает утопления? Конечно, нет. Смешивающая переменная — жаркая погода. Когда жарко, люди покупают больше мороженого и чаще купаются, что приводит к большему числу несчастных случаев на воде. Жара одновременно влияет на обе переменные, создавая обманчивую связь.

Смешивающие переменные встречаются повсюду в реальных данных. Вот ещё примеры:

  • Люди, которые едят органические продукты, живут дольше. Но те, кто покупает органику, обычно больше зарабатывают, имеют лучший доступ к медицине и больше времени на спорт. Доход и образ жизни — смешивающие переменные.
  • Дети, занимающиеся музыкой, лучше учатся. Но семьи, способные оплатить музыкальную школу, обычно располагают большими образовательными ресурсами. Ресурсы семьи — смешивающая переменная.
  • Регионы с бо́льшим потреблением чая дают больше олимпийских медалистов. Этот вымышленный, но правдоподобный пример легко объяснить: более богатые и населённые регионы могут позволить себе и больше чая, и лучшие спортивные школы.

Как бороться со смешивающими переменными

Выявление конфаундеров — один из важнейших навыков статистического мышления. Вот как исследователи с ними справляются:

  • Контролируемые эксперименты: Участников случайным образом распределяют по группам, чтобы смешивающие факторы распределились равномерно. Если вы случайно назначаете одним заниматься спортом, а другим — нет, такие факторы, как возраст, диета и доход, должны уравновеситься между группами.
  • Измерение и корректировка: Собирайте данные о потенциальных конфаундерах и используйте статистические методы, чтобы учесть их при анализе.
  • Честность об ограничениях: Во многих реальных исследованиях устранить все конфаундеры невозможно. Лучшее, что можно сделать, — признать, что результаты показывают связь, а не обязательно причину.
Пример

Помогает ли кофе работать продуктивнее? Коллега утверждает, что кофе повышает её продуктивность. Но подумайте: она пьёт кофе утром, когда свежее всего; она пьёт кофе, когда берётся за интересные задачи; ритуал приготовления кофе даёт ей небольшую ментальную паузу. Время суток, тип задачи и перерыв — все это смешивающие переменные. Её продуктивность может никак не зависеть от самого кофеина.

Переменные в повседневной жизни

Понимание переменных — не абстрактная теория. Оно помогает критически оценивать утверждения, которые встречаются каждый день:

  • Когда реклама заявляет «Люди, использующие наше приложение, худеют на 5 кг», спросите: Какая здесь независимая переменная? Зависимая? Есть ли конфаундеры? (Может, люди, скачивающие фитнес-приложения, и так мотивированы похудеть.)
  • Когда в статье пишут «Дети, которые больше читают, лучше сдают ЕГЭ», задумайтесь: чтение — причина, или и чтение, и оценки отражают домашнюю среду ребёнка?
  • Когда знакомый говорит «Я начал пить витамины, и простуда прошла», подумайте: помогли витамины или простуда прошла бы сама через пару дней?

Краткая сводка по типам переменных

  • Независимая переменная: Фактор, который может вызвать или повлиять на изменение. Вход.
  • Зависимая переменная: Результат, который вы измеряете. То, что, по вашему мнению, может измениться в ответ.
  • Смешивающая переменная: Скрытый фактор, влияющий одновременно на независимую и зависимую переменные, потенциально создающий ложное впечатление причинно-следственной связи.
Ключевой вывод

Переменные — это то, что меняется или различается. В любом исследовании независимая переменная — предполагаемая причина, а зависимая — измеряемый результат. Но будьте внимательны: смешивающие переменные могут прятаться в тени, создавая видимость прямой связи, когда на самом деле обе переменные обусловлены скрытым третьим фактором. Фраза «корреляция не равна причинности» существует именно из-за конфаундеров. Научиться их замечать — один из самых ценных навыков, которым учит статистика.