Лягушка в кипятке и еще 300 популярных инструментов мышления, которые сделают вас умнее - Макканн Лорен. Страница 39

Одной из сложнейших вещей в планировании надежного эксперимента является определение конечной точки – метрики, которая используется для оценки гипотезы. В идеале конечная точка – это объективная метрика, которую можно легко измерить и последовательно интерпретировать. Вот примеры объективных метрик: жив ли человек, купивший продукт? Нажал ли пользователь кнопку на сайте?

Однако, когда идея, которая интересует исследователей, не является ясно просматриваемой или измеримой, они могут использовать прокси-конечную точку (еще ее называют суррогатной конечной точкой или маркером) – метрику, тесно связанную с конечной точкой, которую они измерили бы, если бы могли. Слово прокси означает замену кого-то или чего-то. Другие примеры использования этой ментальной модели включают в себя прокси-голосование (например, заочное голосование) и прокси-войну (например, текущие конфликты в Йемене и Сирии являются прокси-войной между Ираном и Саудовской Аравией).

Хотя качество университетов нельзя оценить одной объективной мерой, новостной журнал U.S. News and World Report пытается составить рейтинг учебных заведений с помощью прокси-меры, составленной из таких объективных факторов, как число выпускников и посещаемость, вместе с более субъективными мерами, такими как академическая репутация. Другие примеры распространенных прокси-мер включают в себя индекс массы тела (ИМТ) для оценки степени ожирения и IQ, которым измеряют интеллект. Прокси-меры более подвержены критике, потому что являются непрямыми мерами, и все эти три примера не исключение.

Чтобы понять, почему эта критика бывает обоснованной, рассмотрим аномальные сердечные ритмы (желудочковые аритмии), которые вызывают внезапную смерть. Были разработаны лекарства от желудочковой аритмии, и очевидно, что они должны защищать от внезапной смерти тех, кто их принимает. Но на самом деле использование этих препаратов приводит к значительному увеличению числа случаев внезапной смерти среди пациентов с бессимптомной желудочковой аритмией после сердечного приступа. Для этих пациентов снижение частоты желудочковых аритмий после лечения не является индикатором выживаемости, то есть хорошим показателем.

Несмотря на сложности при проведении хорошо организованных экспериментов, реальные научные доказательства надежнее единичных случаев, поскольку они позволяют делать правдоподобные выводы. Да, нужно остерегаться ложных корреляций и скрытых искажений (подробнее о них мы расскажем в следующем разделе), но в итоге вы получите результат, который сильно улучшит ваше мышление.

Скрытые искажения

В предыдущем разделе мы упомянули несколько вещей, на которые нужно обратить внимание при рассмотрении или проведении эксперимента, – таких как эффект ожиданий экспериментатора и смешанные факторы. Есть еще несколько скрытых явлений, которых следует опасаться.

Прежде всего, иногда неэтично и непрактично случайным образом делить людей на разные экспериментальные группы. Например, если исследователи хотят изучить, как курение влияет на беременность, будет неправильно заставлять некурящих беременных курить. Курильщиками в исследовании, таким образом, могут быть те, кто решит продолжать курить, что приводит к искажению под названием систематическая ошибка отбора.

При систематической ошибке отбора нет никакой гарантии, что курение будет единственным различием между этими группами. Поэтому, если исследование покажет разницу, будет трудно определить, какую роль в этом сыграло курение. Например, женщины, которые решили продолжать курить во время беременности вопреки советам врачей, могут принимать и другие спорные с точки зрения медицины решения, которые приводят к неблагоприятным последствиям.

Систематическая ошибка отбора также возникает, если выборка эксперимента не является типичной для основной массы населения, как это бывает с онлайн-опросами.

Если изучаемая группа не является типичной, то результаты нельзя применить для всех.

В общем, нужно очень осторожно делать выводы на основе нерандомизированных экспериментов. Комикс про Дилберта, приведенный ниже, высмеивает ошибку отбора, присущую множеству исследований, о которых говорят в новостях.

Лягушка в кипятке и еще 300 популярных инструментов мышления, которые сделают вас умнее - img_43

Дилберт © 2001 Скотт Адамс. Используется с разрешения Andrews McMeel Syndication. Все права защищены.

Похожую систематическую ошибку отбора делают родители, когда выбирают школу для своих детей. Понятно, что они хотят сделать все, что в их силах, и даже переезжают или доплачивают, чтобы дети учились в «лучших школах». Но почему эта школа считается лучше? Из-за учителей? Или детей там лучше готовят благодаря материальной обеспеченности родителей и интересу к образованию? Ошибка отбора, скорее всего, объясняет немалую долю высоких результатов экзаменов в этих школах и количество выпускников, поступивших в колледж.

Другой тип ошибки отбора, часто встречающийся в анкетах, – это искажение неответа, которое возникает, когда подгруппа людей не участвует в эксперименте после того, как была выбрана для него, то есть не отвечает на вопросы. Если причина отсутствия ответа связана с темой анкеты, конечный результат будет искаженным.

Например, ваша компания хочет понять, есть ли у сотрудников проблемы с мотивацией. Как и во многих компаниях, эту потенциальную проблему можно изучить с помощью опроса. Сотрудники, которые пропустили опрос из-за того, что по графику были в отпуске, будут случайными и вряд ли внесут искажение, а вот сотрудники, которые пропустят его из-за апатии, будут неслучайными и, скорее всего, исказят результат. Ведь эта группа состоит из сотрудников, которые не увлечены работой, и, если они откажутся участвовать, их апатия не будет зафиксирована.

Подобные опросы также редко учитывают мнение бывших сотрудников, а это тоже искажает результаты. Это искажение называется систематической ошибкой выжившего. Возможно, несчастные сотрудники уже уволились, но вы не учтете их мнение, если опросите только тех, кто остался в компании. Таким образом, результаты будут искажены, ведь вы опросили только «выживших».

Получается, что на опросы нельзя полагаться из-за этих искажений? Не всегда. Почти у каждого метода есть недостатки, и редко можно избежать искажений в том или ином виде. Нужно только знать потенциальные проблемы исследования и учитывать их в своих выводах. Например, если вы знаете о систематической ошибке выжившего, можно изучить данные собеседований перед увольнением, чтобы проверить, не было ли проблем с мотивацией у покинувших вас сотрудников. А можно попытаться опросить и их.

Еще несколько примеров демонстрируют, какой незаметной бывает ошибка выжившего. Во время Второй мировой войны исследователи военно-морского флота изучили повреждения самолетов, вернувшихся с операций, чтобы улучшить их оборону в будущих миссиях. Глядя на пробоины в самолетах, они решили оснастить дополнительной защитой места, которые пострадали сильнее всего.

Систематическая ошибка выжившего

Лягушка в кипятке и еще 300 популярных инструментов мышления, которые сделают вас умнее - img_44

Адаптировано из изображения Creative Commons. Макгеддон «Иллюстрация гипотетической картины повреждений бомбардировщика Второй мировой войны». Wikimedia Commons, 12 ноября 2016 года, https://commons.wikimedia.org/wiki/File: Survivorship-bias.png.

Но статистик Авраам Уолд заметил, что в исследовании участвовали только самолеты, вернувшиеся с операций, а не то множество самолетов, которые были сбиты. Таким образом, он сделал противоположный вывод, который оказался верным: пробоины были в тех местах, попадание в которые самолет может выдержать и вернуться невредимым, а вот попадание туда, где не было дырок, скорее всего, приводило к падению.