Предыдущий пост Поделиться Следующий пост
Cheating on a test
lex_kravetski

1     Зачин



Чат-боты — это баян, которым программисты развлекаются уже полвека. Они появились раньше, чем появились сами чаты и даже эти ваши интернеты.

Практически в тот самый момент, когда компьютер обзавёлся средствами ввода и вывода, у людей появилось желание сделать что-то такое, чтобы компьютер изобразил из себя собеседника. В идеале — чтобы стал собеседником, а не просто его изобразил. И даже не просто собеседником, а вообще как бы личностью, не хуже людей.

С чем, собственно, и связан так называемый «тест Тьюринга», который сам автор, впрочем, сформулировал довольно скупо и как бы между делом.

Общий смысл в краткой формулировке таков. Есть некий интерфейс речевого или текстового взаимодействия. Через него человек под кодовым названием «Испытатель» общается с Собеседником — другим человеком или с компьютером. Задача Испытателя — вычислить, кто его Собеседник: человек или компьютер, при условии, что компьютер «пытается» выдать себя за человека, а человек при этом за компьютер себя выдавать не пытается.

Естественно, сказано тут довольно немного, поэтому при малом объёме познаний в области данной темы и научного метода широта трактовок может достигать космических масштабов. Журналисты же вполне совмещают в себе означенные два качества, гармонично дополняя их страстным желанием донести до аудитории наиболее горячую и сенсационно звучащую новость.

Поэтому стоило кому-то заикнуться про то, что «программа, написанная русским программистом, прошла тест Тьюринга», эту новость сразу же растащили по всем ресурсам. Ибо сенсационно, наукообразно и вдобавок патриотично — русский программист же, все дела.

Гугл в ответ на запрос «тест Тьюринга одесский мальчик» выдаёт массу ссылок на самые разные издания, кои практически все и практически без сомнений восхваляют очередной прорыв в области компьютерного интеллектостроения.

Надо отметить, прорывы в означенном интеллектостроении действительно время от времени происходят. Однако о них молчат, ибо реальность не так сенсационно звучит, да и вообще довольно сложна для понимания. А тут про всем понятное — про разговоры. И про словосочетание, которое относительно широко известно. Не как «е равно эм цэ квадрат», но тоже неплохо.

В общем, при помощи традиционного переписывания друг у друга с небольшим вкраплением собственных восторгов, новость разошлась. Чат-бот стал восприниматься как первый Искусственный Интеллект. А некоторые журналисты даже дописались до того, что назвали «одесского мальчика» биороботом.


2     Фэйл



Тест Тьюринга часто критикуют за его механистичность и нечёткость. Дело в том, что из его формулировки неясно, о котором именно «интеллекте» идёт речь. О сознании ли? О его ли внешней имитации?

Тут обычно начинается суровая философия на темы взаимосвязи сознания с его внешними проявлениями, возможности мышления без сознания и определения всех этих терминов, в том числе, с учётом того, что все они появились в те времена, когда компьютеров не было даже в проекте.

Однако несмотря на крайнюю занимательность всех этих вопросов, они имеют крайне опосредованное отношение к данному конкретному случаю. Поскольку вопрос, имитирует ли интеллект прошедшая тест Тьюринга программа или же на самом деле им обладает, имеет смысл только в том случае, если программа действительно прошла тест Тьюринга. «Одесский же мальчик» его на самом деле не прошёл. Он в лучшем случае прошёл лишь некоторую имитацию этого теста. Основанную на целом ряде смысловых искажений в его постановке, а в дальнейшем ещё и на искажении оценки проходящих тест программ.


3     «Физический смысл» теста Тьюринга и его нарушения



Несмотря на краткость формулировки способа проведения теста её фрагменты не случайны. Особенно тот, в котором Испытатель именно что пытается вычислить, кто его собеседник. В этом ключевой момент: разговор Испытателя со скрытой за интерфейсом общения сущностью — это не просто разговор, а по сути научный эксперимент.

При условии «просто разговора» выдать компьютер за программу довольно просто. Когда вы заказываете по интернету билеты на самолёт, например, вы можете не знать наверняка, ищет ли их специальный фрагмент серверной программы или просто какой-то сотрудник данной фирмы. Да, у онлайн-сервисов сейчас высокая скорость отклика и по ней можно отличить одно от другого, но давайте предположим, что это не так. И что ответ во всех таких сервисах приходит не раньше, чем через час.

В этом случае нельзя сказать, кто нашёл вам билеты. Возможно, сервер просто оповестил о вашей заявке какого-то человека, а тот позвонил в билетную кассу с целью эту заявку удовлетворить. Там — в рамках разговора человека с человеком — он купил билет, соответствующий вашему заказу, и отправил его данные вам. Или отправил отчёт о невозможности такой покупки, поскольку все билеты проданы.

Но невозможность отличить в рамках такой ситуации человека от серверной программы вовсе не говорит о том, что все системы покупки билетов прошли тест Тьюринга. Нет, вы просто и не пытались отличить одно от другого. Вообще говоря, вам было безразлично, кто там на самом деле скрывается за веб-интерфейсом.

Это — первый нюанс ошибочной интерпретации условий теста. И его мы вполне наблюдаем в устроенном шоу: члены жюри, судя по всему, не пытались реально отличить человека от программы. Они просто в неё играли, прощая ей все явно не человеческие недостатки, так же, как мы их уже привычно прощаем Ворду и Фотошопу.

Как следует из примеров разговоров, приведённых в приложении к статье, отличить программу от человека в данном случае дело пары минут. И если часть членов жюри этого сделать не смогла, то они либо умственно отсталые, либо и не ставили себе цели отличить, а просто играли в диалог, а во время вердикта полагались на «внутреннее ощущение», что вдобавок усугублялось симпатиями к некоторым разработчикам и к их программе. Оба варианта — это конечно чит от самих организаторов якобы теста.

О том, почему «одесский мальчик» пропаливается на раз, я расскажу чуть позже, а пока поговорим про второй нюанс.

В рамках теста Испытатель не должен быть ограничен в тех вопросах, которые он задаёт программе. Чем сильнее ограничен спектр допустимых вопросов, тем проще «пройти тест». Точнее, не пройти, а сымитировать прохождение.

Однако грубое ограничение в возможностях было бы слишком заметно, поэтому в ряде случаев его делают косвенным: программа просто отказывается отвечать на большинство вопросов, пользуясь теми или иными психологическими и риторическими трюками, заложенными в неё её создателями. В этом случае весьма вероятно, что Испытатель начнёт испытывать снисхождение — «ну ладно, тут они, конечно, не смогли, но старались ведь» — и как бы начнёт подыгрывать программе.

В пределе программа просто могла бы на все вопросы отвечать «да не знаю я, чего прицепился?», но это будет слишком явно. Снисхождение таким способом не пробудить. Но если программа иногда отвечает более-менее осмысленно, а в остальных случаях отшучивается или отвечает на вопросы другими, универсально расплывчатыми вопросами/фразами («а что мы вообще знаем о мире?», «всё относительно, давай лучше поговорим о другом»), то неподготовленные и подверженные эмоциям люди вполне могут начать испытывать симпатию. Не к программе, но к её разработчикам. И даже отдавая себе отчёт, что это — программа, ответят «человек».

Создатели «одесского мальчика» в полной мере использовали эти чит-стратегии. «Подросток — он может многого не знать». «Ох, сколько тут весёлых шуток!». «Мальчик — сюси-пуси». Кроме того, диалоги ведутся на английском, а «одесский школьник» им «плохо владеет». Фактически этот тест проходит уже не столько программа, сколько придуманный разработчиками сеттинг персонажа. Он и маленький, и не англоговорящий…

И туповатый, надо полагать, вдобавок.

Однако честный и понимающий цель теста Испытатель должен ответить: «если тут что-то и имитируется, то разве что интеллект клинического идиота».

Цель теста в том, чтобы на экспериментах убедиться, что нет никакого способа отличить человека-собеседника от компьютера, не заглядывая физически за ширму — интерфейс. Причём именно полноценного человека, а не человека с серьёзно повреждённой психикой. Или тем более с психикой, вообще отсутствующей.

Диалог с выключенным компьютером отлично имитирует диалог с человеком в коме. Но тест, как и сам вопрос, всё-таки не про это.

Цель теста в том, чтобы убедиться, что нет никакого способа отличить компьютер от полноценного человека, действительно использовав все возможные способы их отличить. А не просто наугад кинуть в чат пару фраз и если ответы не совсем уж «машинные» признать программу «мыслящей», чтобы польстить её создателям.

Цель теста в том, чтобы убедиться, что собеседник демонстрирует интеллект, неотличимый от полноценного человеческого. А не проверить, умеет ли компьютер изображать клинического идиота. Он умеет — это уже давно известно.

В сенсационном тесте с сенсационной программой это было заведомо не выполнено. Частично потому, что организаторы специально подобрали непрофессионалов в теме и не разъяснили им суть теста, частично потому, что разработчики программы использовали ряд чит-приёмов, запутавших и без того не очень профессиональных членов жюри. А ещё частично потому, что результаты вообще выглядят подтасованными, поскольку не опознать в этой программе программу даже для непрофессионала весьма проблематично.

И вот почему.


4     Структура программы



Даже те отрывочные диалоги, которые всё-таки удалось найти (а найти их не так просто — большинство источников сенсационной новости, видимо, даже не удосужились посмотреть примеры общения с этой программой), так вот, все эти диалоги довольно выпукло демонстрируют, что данный чат-бот отличается от других чат-ботов разве что набором встроенных хохм. На мой вкус, кстати, весьма слабых, но и это, видимо, должно быть списано на «тринадцатилетнего школьника».

В остальном же логическая структура этого чат-бота довольно примитивна.

Бот ищет в словах собеседника ключевые словосочетания, на которые заготовлена его словестная реакция. Причём, реакция заготовлена довольно примитивная, без ветвления по контексту, в расчёте, видимо, на то, что в большинстве диалогов данное словосочетание в основном будет встречаться как раз в наиболее вероятном контексте.

Так, например, если программа встречает фразу «где ты живёшь», он отвечает «в Одессе». В большинстве случаев этот фокус прокатит — ведь самый распространённый вариант с этими словами как раз и является вопросом «где живёт мой собеседник?». Однако такой тупой алгоритм на раз раскалывается нетривиальным использованием фразы. Например, «это ж где ты живёшь, раз такого не знаешь?». Понятно, что и человек может не понять сарказма и ответить «в Одессе», но если человеку сказать «это был сарказм» и повторить вопрос, то он поймёт, что ответ «в Одессе» — не вариант. А тупой алгоритм — не поймёт.

Далее. Если бот не находит ни одного ключевого словосочетания, то он либо отвечает что-то расплывчатое, либо пытается перевести разговор.

В некоторых случаях бот даёт рандомные ответы, реагируя на некоторые ключевые слова в вопросах.

Иногда он повторяет ответ собеседника, заменив в нём местоимения.

Кроме того, бот, возможно, запоминает имя собеседника и подставляет его в некоторые заранее заготовленные фразы.

Всё. На этом логика бота кончается. Авторы что-то такое говорят про «разбор паттернов», но оно, судя по диалогам, сводится к поиску синтаксических форм пресловутых ключевых сочетаний во фразах и вопросах собеседника.

Правда, надо отдать разработчикам должное: они, в отличие от журналистов, не претендуют ни на «Искусственный Интеллект», ни даже на прохождение реального теста Тьюринга, хотя и явно переоценивают качество своего бота.


5     Как отличить программу от человека



Некоторые способы уже были мимоходом упомянуты в предыдущих разделах, но в этом хотелось бы обобщить и углубить.

Так вот, интеллект не сводится к базе знаний, реагирующей на корректные в рамках определённого протокола запросы к ней. Он обладает целым спектром куда как более хитрых качеств.

Иногда люди разговаривают так, будто некоторыми из этих качеств не обладают. Однако в случае с полноценным человеком такое наблюдается не постоянно, а лишь эпизодически. И редко когда бывает, что разом исчезают все эти качества одновременно, причём никакие слова собеседника не позволяют их вернуть обратно.

Как было сказано ранее, подобная программа если что-то и имитирует, то разве что интеллект клинического идиота. Условия проведения теста запрещают брать их в качестве тестовых собеседников, поскольку цель — проверить соответствие программы полноценному интеллекту, а не наоборот выяснить, может ли отдельный человек быть так же малоинтеллектуален, как программа. А потому вполне ясно, что отсутствие оных качеств у собеседника означает, что этот собеседник на самом деле — программа.

Давайте рассмотрим некоторые из этих качеств.


5.1     Способность понимать контекст



Человек умеет понимать контекст разговора. Причём, понимает он контекст не по ключевым словам, а путём осознания смысла разговора. То есть по мере развития этого разговора, даже если человек забыл некоторые его фрагменты, он всё равно понимает канву беседы в целом. Он понимает, про что идёт речь, понимает позицию своего собеседника — хотя бы отчасти, и понимает свою позицию.

Тем может быть несколько и разговор может прыгать с одной на другую, но всё-таки «несколько» это не «бесконечное количество». Даже прыжок с темы на тему обычно как-то связан с ранее сказанным.

Поэтому реплики и ответы человека привязаны не к одной только последней реплике его собеседника. Мы можем в какой-то момент спросить собеседника, «а где ключ?» и тот, исходя из предыдущей части разговора, поймёт, о каком ключе идёт речь: о гаечном ли, о ключе от дверного замка ли, о ключе к решению проблемы или о музыкальном ключе. Более того, он в большинстве случаев поймёт не только, о каком ключе речь, но и ещё о ключе какого диаметра, от какой двери, к решению какой проблемы или на каких нотах мы его спрашиваем. Даже если слово «ключ» ранее вообще не фигурировало.

Этим, кстати, грешат все современные программы, включая те, которые не претендуют на искусственный интеллект: они не пытаются понять контекст. Точнее, пытаются, но только в простейших случаях. Так, нажатие на правую кнопку мыши может выводить разные вплывающие меню, в зависимости от того, над каким элементом интерфейса была нажата правая кнопка и в каком режиме сейчас находится программа. Это уже неплохой шаг, но этот шаг — первый.

В идеале программа должна понимать или хотя бы делать статистически вероятные предположения о том, чего сейчас пытается достичь работающий с ней человек. Этим она будет экономить ему кучу времени.

Благо, сейчас прогресс в этой области идёт и программы всё чаще прогнозируют дальнейшие действия человека, исходя из его предыдущих действий.

«Одесский мальчик» при этом не понимает контекста беседы от слова «совсем». В частности, да, реальный мальчик может не знать о произошедших в его городе событиях (маловероятно, но может), однако по формулировкам собеседника он всё-таки должен понять, что если собеседник так настойчиво о них спрашивает, то он, видимо, не хочет ещё раз услышать про зачипатую лестницу. Понять и адекватно среагировать.


5.2     Способность помнить



Хотя люди тоже имеют неприятную способность забывать — в том числе только что сказанное, — они ещё имеют способность помнить. Если собеседник не помнит практически ничего из ранее сказанного и им, и его собеседником, но вот его имя почему-то помнит, то либо у него серьёзные органические повреждения мозга, либо он — программа. Если же проводится тест Тьюринга, то последнее гораздо более вероятно, ибо, напомню, взятых для теста собеседников-людей просто по условиям теста нельзя набирать из числа заведомо психически неполноценных.

Проявлений наличия памяти у людей гораздо больше, чем память на имена или иные конкретные данные — даты, числа, адреса и т.п. Они ещё помнят уже высказанные ими мысли. Если мысль переформулировать другими словами, то человек почти всегда понимает, что это — та же мысль. Или хотя бы мысль, очень близкая к уже прозвучавшей.

Если человека спросить «где ты живёшь?», а он ответит «в Одессе», то вопрос «а где конкретно?» уже не вызовет с его стороны повторного ответа «в Одессе». Если человек — тормоз или по какой-то причине предположит, что его ответ не расслышали, то, быть может, второй раз он это и ответит. Но не третий, и не десятый. Особенно если повторно задаваемые вопросы снабжать уточняющими маркерами типа «конкретно».

У примитивных ботов же способность запоминать высказанные мысли отсутствует, поэтому они на уточняющий по контексту вопрос скорее всего повторят прежний ответ. А от вопроса «где конкретно?» испытают «когнитивный диссонанс», поскольку этот вопрос опирается на сказанное ранее, а внутри себя никаких слов, указывающих на то, что речь идёт о месте жительства, не содержат. Таким образом реакцией будет либо универсальная расплывчатая, естественно, совершенно неуместная при столь прямом вопросе, либо попытка перевести разговор на «давай поговорим о чём-то другом».

Человеческая память вдобавок позволяет помнить ещё и канву событий. Что в некотором роде похоже на ранее фигурировавший «контекст». Положим, вы стоите рядом с человеком, который чинит лампочку. В какой-то момент он просит дать ему отвёртку. Вы даёте. В следующий раз человек уже не говорит «отвёртку», а просто делает просящий жест рукой. Но вы помните, что ему в прошлый раз нужна была отвёртка и понимаете, что если бы ему в этот раз нужно было бы что-то другое, он сказал бы это прямым текстом: ведь он знает, что вы помните и по умолчанию среагируете на просящий жест именно как на «дай отвёртку». По этой причине вы даёте ему отвёртку.

Описание этого психологического механизма выглядит даже сложнее, чем реальное его воплощение — столь естественно для человека помнить предыдущие события и понимать контекст. Но для бота это, напротив, неестественно, и чтобы это сымитировать надо очень постараться.

Боты не помнят уже высказанные мысли и уже произошедшие события — они в лучшем случае помнят только данные и конкретные фразы. Поэтому ведут себя с точки зрения человека совершенно противоестественно.

В частности, «одесский мальчик» не помнит, что ему только что сообщили, что Кучма уже не президент. Понятно, само это утверждение — проблема давно не обновлявшейся базы знаний, а реальный человек, конечно, тоже мог чего-то забыть или не знать. Но если бы реальному человеку сказали, «нет, Кучма уже не президент», он мог бы начать спорить с этим, мог бы признать свою ошибку и спросить, «а кто тогда?». Однако вряд ли он бы стал себя вести так, будто бы возражения вообще не поступало.

Это ещё один способ «раскрыть бота» — вести с ним разговор так, чтобы следующие фразы опирались на предыдущие. Или ещё лучше, чтобы смысл следующих фраз был бы понятен только в контексте смысла предыдущих.

Опять же суровый дефект современного софта в том, что они не очень хорошо умеют запоминать предыдущие события. Программы помнят ссылки на ранее открытые файлы, помнят ранее введённые слова, ранее использованные цвета, но это, увы, в лучшем случае. В общем и целом же они ведут себя с пользователем так, будто каждый раз видят его впервые, а создаваемых в них же документов не видели вообще никогда. Можно, например, найти текст по фрагментам фраз в нём, но при этом человек вполне способен понять и фразу «мне нужен тот дизайн, ну помнишь, с цветочками», а софт — нет. Пока что нет.


5.3     Способность догадываться



Человек, естественно, способен не только понимать собеседника, но и не понимать его. Однако благодаря наличию интеллекта даже в тех случаях, когда слова собеседника не совсем понятны, у человека есть предположения по поводу того, что именно собеседник имел в виду.

То есть непонимание в большинстве случаев не тотальное (как в случае, например, с текстом на неизвестном языке), а частичное. Может быть, например, непонятно, на чём именно собеседник пытается сделать акцент или какой именно вывод следует из сказанного. И даже если непонимание более масштабное, то всё равно имеются несколько предположений, про что тут может идти речь.

В результате человек начинает задавать наводящие вопросы, с целью понять-таки, чего имеет в виду собеседник. И это важная характеристика интеллекта — способность к самостоятельному исследованию.

Не смотря даже на то, что в простейших случаях исследуется не загадка природы, а всего лишь направление мыслей собеседника, способность исследовать с лёгкостью позволяет отличить человека от существующих к данному моменту чат-ботов. Некоторые из них, конечно, пытаются имитировать «исследование собеседника», однако это в лучшем случае сводится к общим фразам вида «я не понял, объясни». Таким образом, разработчики пытаются добиться от собеседника переформулировки его предыдущих слов, в которой уже могут встретиться имеющиеся в базе данных чат-бота ключевые слова, но это по сути тоже попытка считерить, а не искусственный интеллект.

Человек тоже может сказать «я не понял», но он не будет повторять эту фразу сто раз, если явно видно, что собеседник тоже не понял, чего именно этот человек не понял. Вместо этого он будет «сужать» область поиска темы объяснений для своего собеседника.

— Тебе надо проапдейтить драйвер.

— Я что-то не понимаю.

— Я не понял, что именно ты не понимаешь?

— Я не понимаю, ты про драйвер видеокарты или про драйвер материнской платы?

— А. Я про оба.

Даже при наличии недопонимания, оба беседующих человека, в отличие от чат-ботов, прилагают некоторые осознанные усилия, чтобы выяснить не только точку зрения второго собеседника, но и возможные точки его недопонимания. И это, собственно, подводит нас к ещё одному качеству интеллекта человека.


5.4     Способность сотрудничать



Ситуации бывают разные, но в большинстве из них собеседники не являются однозначными врагами по всем пунктам.

Впрочем, даже если и являются, весь людской социум построен на человеческом взаимодействии, а потому демонстрация явного нежелания сотрудничать ни по каким вопросам, рассматривается людьми как акт агрессии. И как результат, в дружеской беседе ли, в деловой ли, в конфронтации ли, но люди постоянно демонстрируют готовность сотрудничать.

Во время диалогов это выражается в отношении к собеседнику. Здесь трудно подобрать правильный термин, чтобы описать общую черту всех диалогов, но условно можно сказать так: «собеседник не игнорирует собеседника». В том смысле, что слова второго собеседника связаны с оценкой настроения первого, с историей их взаимоотношений и с выражаемыми им желаниями. Приличным считается хотя бы пытаться отвечать на вопросы, хотя бы пытаться поддерживать некоторую связность изложения, хотя бы демонстрировать, что мнение собеседника хоть что-то значит и так далее.

На практике это выливается в то, что сколько бы прыжков по темам ни наблюдалось в болтовне собеседников, в эту игру они как бы играют вдвоём. Чат-бот же просто реагирует на последнюю фразу. Собеседник, вообще говоря, его не волнует, поскольку эмоции современные боты испытывать не способны, долговременных целей не имеют и в социуме не росли. Скорее всего, всё это тоже можно сымитировать, но пока что таких имитаций не встречается.

Так что чат-бот диагностируется и по сквозящему в разговоре с ним равнодушию к собеседнику, на фоне которого даже задолбанный работник в окошке госучреждения выглядит образцом душевной теплоты.

У «одесского мальчика», в частности, наблюдается ровно то самое. Его откровенно не интересует ни то, что говорит собеседник, ни то, что говорит он сам. Он без проблем отказывается от любой темы разговора, поскольку любимых тем у него нет. Он полностью игнорирует явно демонстрируемое собеседником продолжать именно эту тему. Он переводит любой разговор с любого его места без каких-либо моральных терзаний по поводу нарушения негласного этикета. И ладно бы он переводил разговор на сопредельную, более интересную ему тему, — он просто останавливает собеседника и предлагает ему поговорить на другую тему, которую тоже должен придумать сам собеседник.

Капризные люди тоже так делают — «я не хочу об этом говорить, расскажи мне о чём-то другом» — но даже самые капризные из них психологически неспособны повторить этот манёвр тридцать раз подряд. Чат-бот же лишён эмоций, а потому повторит хоть тысячу раз.


6     Совокупность факторов и практический смысл



Про каждый пункт перечисленного можно сказать: «но ведь у людей подобное тоже бывает». Это, разумеется, действительно так, однако практический смысл теста Тьюринга состоит в том, чтобы диагностировать наличие интеллекта, а не возможности сымитировать его, интеллекта дефекты в гипертрофированной форме.

Человек временами забывает информацию, сбивается с мысли, не понимает контекст, не идёт на контакт и так далее, но «интеллектом» в нём называется не вот это, а как раз способность помнить, анализировать, контактировать, исследовать. Именно эти способности должен убедительно продемонстрировать и Искусственный Интеллект. В том числе, в рамках теста Тьюринга.

Если некоторым человеком демонстрируются преимущественно дефекты, то уместен скорее обратный вопрос. Не «похож ли вот этот экземпляр софта на человека?», а «похож ли вот этот экземпляр человека на современный софт?». Имитация почти растительного существования людей с серьёзными органическими повреждениями мозга, это всё-таки не то, что фигурирует под условным названием «ИИ». И не то, что пытаются выяснить при помощи данного теста.


7     Современное значение теста Тьюринга



Сейчас есть существуют серьёзные подозрения, что кроме реального воплощения интеллекта в машине возможно и воплощение его заведомо неинтеллектуальной имитации — как минимум при помощи статистических методов на основе той огромной базы данных, которой является интернет. Предположительно возможно разработать алгоритм, который будет находить ответы и фразы, написанные кем-то из живых людей в заметках, статьях и комментариях. Причём находить так, чтобы найденный текст был с большой вероятностью адекватен предыдущим словам собеседника — не только последней фразе, но и сказанному ранее. Это не решит большинства вышеперечисленных проблем, но сделает имитацию гораздо более убедительной, чем уже имеющиеся. Такой алгоритм будет способен обмануть в том числе и экспертов, а не только случайных людей, и в том числе в рамках теста Тьюринга, а не во время, скажем так, «игры в разговор». При этом интеллект в нём заведомо будет отсутствовать.

Однако подобные соображения лишь делают прохождение данного теста необходимым условием, вместо достаточного, но не отменяют его целиком. Поэтому вполне корректно будет сказать, что программа, не прошедшая даже честно поставленный тест Тьюринга, Искусственным Интеллектом не является.

Это — как бы стартовая точка, с которой начинается отсчёт. Типа выпускных экзаменов в школе, если не сдать которые, то в вуз точно не возьмут.

Что же должно быть «вступительными экзаменами» — это тема для обширной отдельной статьи, ибо количество философских и практических вопросов в этой теме таково, что потянет на десятки страниц. Но в приложении к разобранной здесь «Тьюринг-сенсации» и без всех этих нюансов вполне понятно, что об Искусственном Интеллекте в данном случае речь даже близко не идёт.


8     Приложение



Чат-бот называет себя Евгением Густманом. Женя и EG — это тоже он.

В первом диалоге собеседники не маркируются, но тем не менее всё равно легко понять, кто человек, а кто — бот.

Текст диалогов можно посмотреть в аналогичном разделе в doc-файле или на сайте «XX2 Век».



doc-файл
Публикация в блоге автора
Публикация на сайте «XX2 Век»

  • 1
Сейчас есть другая проблема: не все живые пользователи прошли бы этот самый тест Тьюринга.

Вот-вот. Часто задаёшь нетривиальный вопрос по программированию, типа почему множественное наследование не создаёт проблем в случае если родители не имеют общего предка или зачем timediff тип - всё, шаблон рвётся напроч. Создаётся впечателение что программисты живут именно теми паттернами, которые описал Алексей и завидев ключевое слово выдают зашитый в програмисткие догмы текст. Понимать вопрос они не в состоянии. Но у них есть и приемущества. Они нападают пачками и используют последний аргумент - бан хаммер :) Интернет всё стрепит.

Я вчера даже в очередной раз задумался: зачем человеку разум? Ну правда, покуражится над здравым смыслом, над разумом. Разум для того чтобы его не было. Зачем в таком случае разум?

> смысл теста Тьюринга состоит в том, чтобы диагностировать наличие интеллекта, а не возможности сымитировать его, интеллекта, дефекты в гипертрофированной форме.

:))


класс. популярная механика)
только из-за Украины это сейчас мало кому интересно)

Ну и черт с этим. Все равно надо публиковать. Не ждать же, пока ажиотаж спадет.

Чистенько, голубенько, полочка прозрачная, как в виндоус -7. И четыре кракозябры рядом с кнопкой "войти".
Офтоп гггг

Спасибо. Интересно и познавательно. Судя по диалогам - бот вычисляется на раз.

О, спс за подробности. А то я краем уха читал про этого бота, и как-то оно желтушно выглядело.

Lex, а как Вы считаете: Кая из пелевинского S.N.U.F.F. обладала ИИ или только иммитировала?

У Пелевина основная идея, я так понимаю, в том, что анализирующий весь багаж человечества «имитационный» ИИ в результате оказывается более человеком, чем все биологические люди, на тот момент населяющие Землю.

Если имитация неотличима от оригинала, то вопрос обладает ли имитация свойствами оригинала или нет лишен смысла.

Ну и судя по описанию в книге, Кая проходит под определение обладания интеллектом по целому ряду критериев, выдвинутому разными учеными. Под определение Джеффа Хокинса точно подходит.

викидепия: "Интеллект (от лат. intellectus — понимание) — качество психики, состоящее из способности адаптироваться к новым ситуациям, способности к обучению на основе опыта, пониманию и применению абстрактных концепций и использованию своих знаний для управления окружающей средой. Общая способность к познанию и решению трудностей, которая объединяет все познавательные способности человека: ощущение, восприятие, память, представление, мышление, воображение."
и для более глубокого понимания: "Конгресс, немцы какие-то… Голова пухнет."

Это называется "определение методом сведения к непонятному". Потому, что с первой строчки упирается в понятие психики.
Поскольку идут терминологические споры, являются ли животные единственными носителями психики (некоторые, вообще, оставляют это исключительно за человеком), мы не можем сказать, может ли по определению обладать психикой и, соответственно, интеллектом неживая система.

Согласен, словесное определение страдает атавизмом.
Загвоздка в том, что программа, какая бы она не была сложная работает в рамках системы, которая изначально заточена под вычисления т.е. трудно от калькулятора ожидать чего-то большего, а именно калькулятор участвовал в тесте.
Вот и форма отправки сообщения просит ввести проверочный текст ))

Мда, программа явно из 90-х. А сколько шума было.

Похоже на развитие темы известных у лингвистов постулатов Грайса.

  • 1
?

Log in

No account? Create an account