Что такое ошибка техасского снайпера
Название идёт из анекдота: техасец стреляет в амбар, потом рисует мишени вокруг кластеров попаданий и хвастается точностью. Ошибка техасского снайпера — это выбор данных или создание категорий уже после получения результатов, а потом представление закономерности как заранее предсказанной.
По сути это «cherry-picking» (вишнёвый выбор) наоборот: не просто игнорировать неудобные данные, а активно рисовать «мишень» вокруг тех, что понравились.
Примеры в реальной жизни
Кластеры болезней. В городе несколько случаев онкологии рядом с заводом. «Завод вызывает рак!». Но если проверить все районы города с аналогичным числом жителей — такие кластеры найдутся везде просто из-за случайного распределения. Рисование «мишени» вокруг конкретного завода — ошибка снайпера.
Астрология и нумерология. Из сотен характеристик знака зодиака человек выбирает те, которые «совпали», и делает вывод: астрология работает.
Биржевой трейдер. Из 20 торговых стратегий одна дала прибыль в прошлом году. «Вот рабочая стратегия!». Случайный успех одной из двадцати — статистика, а не закономерность.
Связь с множественными сравнениями
В статистике это называется проблемой множественных сравнений. Если проверять достаточно много гипотез — одна случайно окажется «значимой» просто из-за вероятности. Нечестные исследователи используют это: собирают много данных, смотрят, где «получилось», и публикуют только это.
Правильный научный подход: сформулировать гипотезу до сбора данных, зарегистрировать её — и потом проверять. Это называется pre-registration и стало стандартом в психологии после репликационного кризиса.
