Вопрос, изменивший науку
В 1950 году британский математик Алан Тьюринг задал вопрос, ставший основополагающим для всей науки об искусственном интеллекте: «Может ли машина мыслить?» Чтобы дать на него практический ответ, он предложил «игру в имитацию» — эксперимент, который мы сегодня называем тестом Тьюринга.
Правила простые. Человек-судья общается с двумя собеседниками по текстовому каналу — с другим человеком и с компьютером. Задача судьи — определить, кто есть кто. Если машина сумеет обмануть судью (тот не сможет отличить её от человека), значит, она «мыслит» — или, по меньшей мере, ведёт себя неотличимо от мыслящего существа.
Зачем нужен такой тест
Тьюринг был прагматиком. Он понимал, что спор о том, «действительно ли машина мыслит», рискует зайти в философские дебри без ответа. Сознание вообще трудно определить и измерить. Зато поведение измерить легко: если система ведёт себя так, как вёл бы себя мыслящий существо, для практических целей этого достаточно.
Это операциональный подход: определять явление через его наблюдаемые проявления, а не через внутреннюю природу. Тот же подход используется в науке постоянно — мы не можем напрямую «увидеть» температуру, но можем измерить её через расширение ртути в термометре.
Первые попытки: ELIZA и Джозеф Вейценбаум
В 1966 году американский учёный Джозеф Вейценбаум создал программу ELIZA — первый чат-бот. ELIZA имитировала психотерапевта: она перефразировала слова собеседника в форму вопросов. «Мне грустно» — «Почему вам грустно?». Программа была крайне примитивной, никакого понимания там не было. Но многие люди, общаясь с ней, начинали верить, что разговаривают с живым психологом, и делились глубоко личными переживаниями. Вейценбаум был потрясён и встревожен этим результатом.
ELIZA тест Тьюринга не проходила в строгом смысле, но наглядно показала: людей легко обмануть, если создать иллюзию понимания.
Конкурс Лёбнера и современность
С 1991 года ежегодно проводится Премия Лёбнера — реальный конкурс на основе теста Тьюринга. Чат-боты соревнуются, кто лучше обманет судей. Долгое время победители были весьма примитивны, хотя иногда и успешно обманывали отдельных судей. В 2014 году программа «Юджин Густман», имитирующая 13-летнего украинского мальчика, убедила 33% судей, что является человеком. Это была шумная новость, хотя критики отметили: программа просто хорошо отвлекала вопросами, не отвечая по существу.
С появлением больших языковых моделей вроде GPT-4 и Claude ситуация изменилась кардинально. Современные системы способны вести длинные, связные, умные разговоры и почти всегда обманывают нетренированных судей. По многим практическим критериям тест Тьюринга уже пройден.
Критика теста
Тест Тьюринга критикуют с нескольких сторон. Философ Джон Сёрль предложил мысленный эксперимент «Китайская комната»: представьте человека в закрытой комнате, который получает иероглифы и по инструкции отвечает другими иероглифами, не понимая китайского языка вообще. Снаружи кажется, что комната «понимает» китайский. Так и компьютер может «проходить» тест Тьюринга, манипулируя символами без настоящего понимания.
Другая критика: тест проверяет способность к обману, а не к мышлению. Умный актёр может притвориться ребёнком; это не значит, что он поглупел. Наконец, тест ограничен текстовым общением — он не учитывает восприятие, действие, эмоции. Несмотря на критику, тест Тьюринга остаётся культурным и концептуальным маяком AI-исследований.
