GPT-4 прошла легендарный тест Тьюринга. 54% собеседников посчитали нейросеть человеком. 67% узнали человека в… человеке

6
0
Опубликовано:
GPT-4 прошла легендарный тест Тьюринга. 54% собеседников посчитали нейросеть человеком. 67% узнали человека в… человеке

Тест, придуманный Аланом Тьюрингом в 1950 году, наконец-то пройден. С ним справилась нейросеть GPT-4,  пишет LiveScience.

Что за тест такой

Задача теста, которую закладывал в него Тьюринг, — определить, может ли машина мыслить. Предполагалось, что это будет реализовано следующим способом. Человек (судья) вслепую общается с одним человеком и одним компьютером, задаёт любые вопросы. По итогу общения он должен определить: где человек, а где компьютер. Если судья перепутает, значит, компьютер вёл себя достаточно «человекоподобно» и прошёл тест.

Что бы вы спросили у компьютера, если бы были судьёй? Первое, что приходит в голову — задать кучу умных вопросов из разных областей знания. Компьютер ответит. Человек — нет. Но в этом и заключается парадокс теста, и главная причина его критики. По сути, машина должна показать не мыслительные способности, а умение сымитировать поведение человека, изобразить недостаточность знаний, обмануть! Если робот научился обманывать человека, значит ли это, что он мыслит как человек?

И всё же, несмотря на критику, ждать, когда программа пройдёт тест Тьюринга, было хорошей традицией разработчиков. Несколько раз они объявляли, что тест пройден. С задачей так или иначе справились программы ELYZA, PARRY, чат-бот Женя Густман. Но во всех случаях успех был сомнительным. Например, Женя Густман представлялся собеседникам школьником из Одессы. То есть он мог прикрывать несуразности в своих ответах подростковым возрастом и языковым барьером.

Тест пройден?

Что касается GPT-4, его тестировали в IEEE — Институте инженеров электротехники и электроники. 500 участников эксперимента общались с четырьмя собеседниками: одним человеком и тремя ИИ-моделями: прошедшей когда-то тест «Элизой», GPT-3,5 и GPT-4. В итоге, в 54% случаев GPT-4 приняли за человека («Элизу» — в 22%,  GPT-3,5 —  в 50% случаев). Результат 54% засчитан, поскольку это больше половины случаев, но он не кажется таким уж впечатляющим. Впрочем, если учесть, что человека «приняли за человека» в 67% процентов случаев, то взгляд на ситуацию немного меняется.

В Skillbox появилась онлайн-школа для детей: есть бесплатный пробный урок и скидка 20%

Поделиться

Похожие статьи

Популярные статьи

Последние новости

Последние комментарии