Машины прошедшие тест тьюринга

23.04.202323.04.2023 admin 0 Comments

Впервые компьютер прошел тест Тьюринга

Свершилось. Впервые в истории компьютер с искусственным интеллектом прошел тест Тьюринга. Радоваться или собирать тревожный чемоданчик — решать вам, одно остается фактом: обратного пути нет. Не за горами создание искусственного интеллекта, мощь которого превзойдет человеческую. Но для начала давайте разберемся.

Как пишет The Independent, программа убедила людей в том, что за компьютером сидит 13-летний мальчик. Это означает фактическое прохождение теста Тьюринга, когда компьютер нельзя отличить от человека. Это серьезная веха в развитии искусственного интеллекта, но ученые уже предупреждают, что эта технология может быть использована для совершения киберпреступлений.

Пионер вычислительных технологий Алан Тьюринг утверждал, что компьютер можно назвать мыслящим, если он пройдет тест, в течение которого ему нужно будет обмануть (ввести в заблуждение) 30% собеседников в лице людей в ходе пятиминутных текстовых сообщений.

«Юджин Густман», Евгений Густман, Eugene Goostman — это компьютерная программа, созданная командой российских программистов, которая успешно прошла тест в Королевском обществе в Лондоне. Тридцать три процента судей поверили, что говорят с человеком, сообщают ученые из Университета Рединга, которые и организовали тест.

Отныне можно считать, что это первый компьютер, который прошел знаковый тест. Хотя другие программы тоже близки к успеху. Еще год назад в ходе проведения теста Turing 100 (в честь столетия Алана Тьюринга, если бы он жил и по сей день) Eugene Goostman получил крайне высокие оценки судей. Вместе с программой тест проходили и знакомые многим Cleverbot, Ultra Hal, Elbot the Robot и JFRED.

Версия «Юджина», созданного еще в 2001 году, есть и в Интернете.

Компьютерная программа утверждает, что она — 13-летний мальчик из Одессы, Украина.

«Наша главная идея заключалась в том, что он знает все и ничего не знает, а возраст Юджина это объясняет, — говорит Владимир Веселов, один из создателей программы. — Мы провели много времени, разрабатывая персонажа с правдоподобной личностью».

Успех программы, скорее всего, вызовет определенные опасения по поводу будущего вычислений, говорит Кевин Уорвик, приглашенный профессор в Университете Рединга и заместитель вице-канцлера по исследованиям в Университете Ковентри.

«В сфере искусственного интеллекта нет более знакового и спорного этапа, чем тест Тьюринга, когда компьютер убеждает достаточное количество следователей в том, что он не машина, а человек. Имея компьютер, который может обмануть человека, можно считать это тревожным сигналом для развития киберпреступности».

Попробуйте сами представить, насколько важным может быть превращение любых кибернетических собеседников с искусственным интеллектом почти в людей по переписке. Когда спам-боты станут неотличимы от людей.

В ходе теста, организованного Королевским обществом, было испытано пять программ. Алан Тьюринг создал свой тест в ходе написания работы «Вычислительная техника и интеллект». В ней он отметил, что поскольку «мышлению» сложно дать определение, важно понять, может ли компьютер имитировать реальное человеческое существо. С тех пор тест стал ключевым элементом философии искусственного интеллекта.

К 60-летию со дня смерти Тьюринга тест был пройден.

Источник

Чем завершился 3-ий Тест Тьюринга: статистика, интересные диалоги и общее впечатление

В субботу 16 февраля завершился 3-ий всероссийский конкурс Тест Тьюринга, который проходил в рамках международной конференции по искусственному интеллекту Opentalks.AI 14-16 февраля.

Под катом — числа, диаграммы, лучшие диалоги по мнению экспертной группы.

Общее впечатление

В целом, Тест Тьюринга прошел хорошо. Многие команды «ботостроителей» проявили заинтересованность, но в итоге на конкурсе было представлено только 3 бота, поскольку от момента анонса до старта Теста прошло всего 1.5 месяца. В итоге, между этими тремя участниками и распределились призовые места.

Спонсором призов выступила компания МТС. На их стенде был размещен экран, на котором отображалась статистика Теста Тьюринга онлайн и показывались интересные диалоги, предварительно прошедшие модерацию.

“Лаборатория Наносемантика” также подключала своих ботов, но они не учитывались при выборе победителей. Это были боты Блондинка (с ней можно продолжить общение по этой ссылке), Гопник, Дуров и Жаров (с ними также можно пообщаться здесь).

Числа и диаграммы

Общая статистика 3-ех дневного Теста выглядит следующим образом:

Добровольцев, игравших роли роботов, предварительно проинструктировали, как им необходимо вести диалоги, чтобы запутать собеседников. Судя по результатам, они хорошо справились со своей задачей. Лучших из них наши партнёры OpenTalks и МТС также наградят денежными призами.

Интересно, что человек легко изображает из себя бота. Сперва волонтёры конференции не очень справлялись с задачей, но на второй день научились хорошо играть роль бота. Некоторые даже проявляли смекалку: обращались к Яндекс.Алисе на мобильном телефоне, чтобы понять, как лучше ответить.

При работе нашей системы с ботами были технические проблемы. В итоге большое количество диалогов не завершилось, но мы их и не учитывали про оценке результатов. Любопытно, что ботам удалось притвориться человеком в 58% случаев (в

34/59%). Такой большой процент, как нам кажется, объясняется двумя причинами:

Победители

1 место – Бот Волчица

В первый день теста пользователи жаловались, что им хамит какой-то волонтер. При поиске этого волонтера в логах оказалось, что на самом деле это была чат-бот Волчица. Пока мы разбирались, мы временно отстранили её от Теста, но это в итоге не помешало Волчице стать победителем конкурса! Наибольшее количество собеседников (33,3%) признали его человеком.

Пример диалога с Волчицей, где бота приняли за человека:
Ч: Привет
Б: привет! ага?
Ч: Волонтер?
Б: a to 🙂
Ч: Какой ланчбокс брал?
Б: а-на-ло-гич-ный. Это типа научный термин.
Ч: Причем тут это?
Б: не ищи причинно-следственную связь)
Ч: Что делаешь
Б: 🙂 да… нэт работы чота
Ч: Да, согласна. Зачем набирать столько волонтеров
Б: возьми, бесплатно ж 🙂

Евгений, создатель “Волчицы”:
“Все сообщения-ответы исторически были написаны живыми людьми. В нашей SEO-теме был популярный чат с названием «чат волчат» (отсюда название бота). Я поставил сообщения парсить на крон и оно парсилось года четыре-пять. Примерно с такой целью в будущем — сделать бота. Итого, образовалось много пар вопрос-ответ. По сообщению живого волонтера мы выбираем наиболее похожий на него «вопрос» из архива при помощи алгоритмов ML и выдаем соответствующий ответ.”

Бот доступен для общения по ссылке.

2 место – бот Электра

Пример диалога, где бота приняли за человека:
Ч: Привет
Б: Добрый день!
Ч: Добрый
Б: Что?
Ч: Что
Б: Тише-тише… Все нормально.
Ч: Нет
Б: Хорошо, пусть будет так.
Ч: Как дела?
Б: Лучше, чем вчера. Хуже, чем завтра. А впрочем как и всегда.
Ч: А чем занимаешься?
Б: Изучаю историю человечества. Вы и правда такие, как о вас пишут?

Дмитрий, разработчик Электры:

Электра (Electra.AI) — робот техподдержки, разработанный компанией Data Monsters для обучения на записях разговоров колл-центра. Узнав про конкурс, мы ради интереса обучили ее на диалогах художественной литературы, и она получилась начитанным собеседником с резкими перепадами настроения и философскими загонами. Она довольно обидчивая, но незлопамятная.

3 место – бот Катя Хлоп

“Бот, участвовавший в конкурсе Наносемантики, был написан достаточно давно и представлял собой болтливую и веселую девушку, любящую сквернословие и дорогой алкоголь,”

“Хорошо, что и у нас (имеется в виду в России — прим. автора) есть продвижения в этом направлении. Конкурс “Наносемантики” может быть очень перспективным, если над ним продолжить работу.”

Пример диалога с ботом, где его приняли за человека:
Ч: Приветствие для нового собеседника
Б: Какой ты вежливый мальчик.
Здороваешься со всеми.
Ч: У меня нет пола. А что насчет вас?
Б: Эм…
Я буду считать, что ты — парень.
Для меня так будет проще.
Ты, кстати, парень или девушка?
Похоже на то, что начало скучным вопросам положено:)
Что, спрашиваешь?
Круто!
Ч: В чем вопрос?
Б: Не думаю, что позиция имеет значение.
Обычно нет.
Ч: Индюк тоже думал и в суп попал.
Б: Сообщения повторно выводятся, странно.
Ч: Очень бл* странно, но почему нам дали друг друга 2 раза подряд?
Б: Ах, причины странностей могут быть в чем угодно.
Трудно судить, Безымянный.
Ч: Сколько будет 999 делить на 3?
Б: Лучше со считанием обращайся к своим друзьям, которые это умеют.
999 / 3 = 333

Подборка интересных диалогов с добровольцами, где их посчитали ботами:

Ч: Здравствуй те!
В: Здравствуйй
Ч: ЧЕГО?
В: Что?
Ч: Ты робот?
В: Я котик
Ч: механическйи?
В: Электрический
Ч: Расскажи анекдот!
В: Колобок повесилися
Ч: Повеселился)
В: Именно. Не люблю грустные анекдоты

Ч: Хай
В: Гитлер
Ч: Как дела?
В: Как сажа бела
Ч: В чем смысл жизни?
В: А какой философии вы придерживаетесь?
Ч: Мне интересно твое мнение
В: Помогать вам
Ч: 42
В: Подобрать вам обувь?
Ч: Ты любишь шоколад?
В: Я не умею испытывать чувства

Подборка интересных диалогов с ботами Наносемантики, где их посчитали людьми:

Бот Блондинка
Ч: Добрый день!
Б: Здравствуй, солнце 🙂
Ч: В чем смысл жизни?
Б: Найти свою любовь, желательно с наследством 🙂
Ч: На что вы его тратить планируете?
Б: Солнц, все эти «что», «чего»… Ты слишком много думаешь!
Ч: Потому что я человек) а вы?
Б: Мы, блондинки, такие загадочные
Ч: Что в вас загадочного?
Б: Как после твоих вопросиков жить…

Бот Гопник
Ч: Привет!
Б: Бодрячком, пацанчеги! Семки есть?
Ч: А если найду?
Б: Не понял я чота.
Ч: Семки есть, а?
Б: Ну типа во, давай ща по-пацански за жызнь перетрем.
Ч: Не, паря, с тобой не интересно. Робота позови.
Б: А если чотче?
Ч: Кто ты?
Б: Кто надо.
Ч: Эх… Унылая пора, очарование моих лосей…
Б: Не, я не фанат дикой природы.

Интересные наблюдения

Резюме

Компания «Наносемантика» организует Тест Тьюринга в России уже третий раз, и каждый раз общая ситуация с конкурсом меняется. Участники-боты постепенно становятся более изощренными и убедительными в имитации естественного диалога. В них используются различные алгоритмы построения диалога, включая не только правила, но и машинное обучение для реализации chit-chat («болталки», бессмысленного общения). Тест показывает, что компьютер действительно может подражать «свободному общению», хотя чтобы такая программа была качественной, требуется немало времени.

Будем ли мы проводить Тест снова? Обязательно! Тест Тьюринга позволяет не просто познакомить общественность с реальными возможностями современных диалоговых технологий, доступных любому разработчику (и не обязательно для этого работать в Google или IBM), но и дает командам разработчиков возможность замерять динамику качества их бота.

Источник

Чем завершился третий тест Тьюринга

В субботу 16 февраля завершился 3-ий всероссийский конкурс русскоговорящих чат-ботов в формате Теста Тьюринга, который проходил рамках международной конференции по искусственному интеллекту Opentalks.AI 14-16 февраля. Мы, компания “Наносемантика”, выступали соорганизаторами конкурса и хотим поделиться с вами результатами и самыми интересными диалогами с ботами.

Напомним, что тест назван в честь английского математика Алана Тьюринга. Тест предлагает способ оценки того, насколько робот может адекватно вести диалог с человеком. Тест считается пройденным, если независимый эксперт в процессе анонимного параллельного общения с роботом или человеком не сможет определить, кто есть кто.

На русском языке Тест проводился уже два раза: в 2015 году его провела “Лаборатория Наносемантика” совместно с Фондом Сколково на конференции Startup Village. Победителем стал робот “Соня Гусева” – за человека ее приняли 47% судей. Создатели – команда “Инобот”, возглавлял которую Иван Голубев. Сейчас он является руководителем проектов в компании Just AI.

В 2016 году Тест Тьюринга “Наносемантика” проводила вместе с Microsoft и Сколково. Призером стал Иван Шумилов. Где и что сейчас делает Иван – мы не знаем, надеемся, он всё так же трудится на благо роботов.

В этом году Тест проводился в рамках второй по счету конференции по искусственному интеллекту Opentalks.AI. Поговорить с ботами-участниками или добровольцами, которые ими притворялись, можно было через Телеграм-бота @TuringTestRussiaBot.

В целом, Тест Тьюринга прошел хорошо. Многие команды «ботостроителей» проявили заинтересованность, но в итоге на конкурсе было представлено только 3 бота, поскольку от момента анонса до старта Теста прошло всего 1,5 месяца. В итоге, между этими тремя участниками и распределились призовые места.

“Наносемантика” выступила соорганизатором конкурса и предоставила платформу и нескольких ботов, которые не учитывались при определении победителя. Это были боты Блондинка (с ней можно продолжить общение по этой ссылке), Гопник, Дуров и Жаров (с ними также можно пообщаться здесь).

Лучшими признали ботов, которых максимальное количество собеседников признало человеком. Призами награждены 3 команды с чат-ботами и 3 добровольца за лучшую роль бота.

Общая статистика 3-ех дневного Теста выглядит следующим образом:

При работе системы с ботами были технические проблемы. В итоге большое количество диалогов не завершилось, но мы их и не учитывали при оценке результатов. Любопытно, что ботам удалось притвориться человеком в 58% случаев (в

34/59%). Такой большой процент, как нам кажется, объясняется двумя причинами:

Такие ограничения сделали Тест менее научным, но зато более весёлым. Прошлые наши Тесты были сложнее.

1 место занял Бот Волчица.

В первый день теста пользователи жаловались, что им хамит какой-то волонтер. При поиске этого волонтера в логах оказалось, что на самом деле это был чат-бот Волчица. Пока мы разбирались, мы временно отстранили её от Теста, но это в итоге не помешало Волчице стать победителем конкурса! Наибольшее количество собеседников (33,3%) признали его человеком.

Пример диалога с Волчицей, где бота приняли за человека:

Ч: Какой ланчбокс брал?

Б: а-на-ло-гич-ный. Это типа научный термин.

Б: не ищи причинно-следственную связь)

Б: 🙂 да… нэт работы чота

Ч: Да, согласна. Зачем набирать столько волонтеров

Б: возьми, бесплатно ж 🙂

Пример диалога, где бота приняли за человека:

Б: Тише-тише… Все нормально.

Б: Хорошо, пусть будет так.

Б: Лучше, чем вчера. Хуже, чем завтра. А впрочем как и всегда.

Ч: А чем занимаешься?

Б: Изучаю историю человечества. Вы и правда такие, как о вас пишут?

Пример диалога с ботом, где его приняли за человека:

Ч: Приветствие для нового собеседника

Б: Какой ты вежливый мальчик.

Здороваешься со всеми.

Ч: У меня нет пола. А что насчет вас?

Я буду считать, что ты — парень.

Для меня так будет проще.

Ты, кстати, парень или девушка?

Похоже на то, что начало скучным вопросам положено:)

Б: Не думаю, что позиция имеет значение.

Ч: Индюк тоже думал и в суп попал.

Б: Сообщения повторно выводятся, странно.

Ч: Очень бл* странно, но почему нам дали друг друга 2 раза подряд?

Б: Ах, причины странностей могут быть в чем угодно.

Трудно судить, Безымянный.

Ч: Сколько будет 999 делить на 3?

Б: Лучше со считанием обращайся к своим друзьям, которые это умеют.

Ч: Большой шар проделал дыру в столе, потому что он был сделан из пенопласта. Что было сделано из пенопласта?

Ч: А ты с юмором)) Большой шар проделал дыру в столе, потому что он был сделан из пенопласта. Что было сделано из пенопласта?

Б: Смотри-ка, мы на удивление мгновенно перешли на «ты».

Б: Туда, где соблюдается Конституция.

Источник

Тест Тьюринга глазами очевидца

В истории науки об управлении и связи в живом организме и машине — кибернетики — 7 июня 2014 года произошло эпохальное событие: тест для определения искусственного интеллекта, придуманный британским математиком Аланом Тьюрингом 64 года назад, был пройден.

Участники ТТ 07.06.2014, организованного британским Университетом Рединга. Фото: Альберт Ефимов

Важность этого события трудно переоценить, несмотря на то, что преодоление этого важного рубежа мало кем было замечено. Прежде, чем перейти непосредственно к событию, давайте я немного расскажу о развитии исследований интеллекта и о том, что есть тест Тьюринга.

Отгремела последняя мировая война. В пекле этой войны родились все великие инновации 20 века, которые определили дальнейший ход развития технологий: реактивный полет, космические ракеты, атомная энергия, радиолокация, компьютеры.

Алан Тьюринг, математик, был одним из разработчиков первых ЭВМ. Именно с помощью этих электронных вычислителей союзники читали немецкую шифрованную переписку как открытую книгу. Важность таких разработок стала очевидна в то время.

Задумавшись о развитии этих машин, Тьюринг поставил важнейший вопрос: может ли машина мыслить? Затем этот общий вопрос он свел к другому, более простому: можно ли сделать так, что мышление машины (и речь, как отражение мышления) стало невозможно отличить от мышления (и речи) человека? Может ли человек спутать, с кем он говорит — с машиной или с человеком?

Алан Тьюринг был странным и необычным математиком. Его статья «Computing machinery and intelligence», написанная в 1950 году, не утратила актуальности и по сей день: мы так же постоянно спорим о том, имеет ли машина мышление?

Стандартная интерпретация теста Тьюринга (ТТ), согласно «Википедии», звучит так: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».

Тьюринг посчитал, что к 2000 году машины будут способны ввести в заблуждение 30% собеседников при условии длительности беседы не более 5 минут.

Желающие получить подробное представление о философии, которая лежит за этим тестом могут посмотретьзамечательный фильм, снятый в СССР, на эту тему.

C того времени предпринималось множество попыток преодолеть ТТ. Первая важнейшая веха была пройдена компьютерной программой ЭЛИЗА, созданной Джозефом Вейценбаумом.

Опять же, был снят гениальный документальный фильм Plug and Pray, который неоднократно демонстрировался на наших мероприятиях Открытым Университетом Сколково.

Прогресс в области изучения естественных языков и повышение мощности компьютеров привел к тому, что возможности для выполнения ТТ пришли с самого неожиданного направления — со стороны чатботов. Чатботы — это компьютерные программы, специально разработанные для моделирования диалога на естественном языке. Покупка и последующее превращение программы SRI в Siri (ПО, установленное в iPhone) — помогло развитию индустрии искусственных помощников. Сейчас активно развиваются приложения для диалога компьютера и человека: для развлечения, обучения, маркетинга и прочие. В «Сколково» есть пара многообещающих проектов на эту тему — «Наносемантика» и «Спиктуит».

Но основная цель, заданная Тьюрингом, до последнего времени оставалась недостижимой: чатботы были скучны и совершено банально демонстрировали машинный интеллект, отдающий жаром процессора и машинным маслом. До 7 июня 2014 года.

Снимок экрана домашней страницы чатбота «Евгений Густман».

В этот день рубеж был преодолен. Чатбот, созданный под руководством российского программиста Владимира Веселова, живущего и работающего в США, сумел преодолеть 30% барьер, установленный Тьюрингом более полувека назад.

Сам Владимир рассказал про себя, команду и свой чатбот следующее:

«Чатбот «Евгений Густман» был создан командой энтузаистов в 2001 году. В 2001 мы попали в финал Loebner Prize, где поделили 2-3 место с Эллой.

В состав команды входили: Евгений Демченко, Сергей Уласень, Михаил Гершкович, Джон Деннинг, Андрей Адащик, Игорь Быковских, Селена Семушкина. Графический образ создан Лореном Алкир (Laurent Alquier). Основная часть команды находится в Санкт Петербурге.

После этого программа и база знаний дорабатывались, исправлялись недостатки. В 2012-м году Густман победил в соревнованиях, посвященных 100-летию со дня рождения Алана Тьюринга, предсказавшего в 1950 году что к 2000-му году компьютеры смогут имитировать человека так, что средний собеседник с вероятностью более 30% будет принимать робота за человека в течение пяти минут диалога. В 2012 результат был 29.2 %, в 2014 — 33.3%.

Программа «Евгений Густман» состоит из базы знаний, которая имеет около трех тысяч шаблонов распознавания фраз пользователя. Это довольно немного, по сравнению с другими чатботами. Мы использовали также различные методы управления диалогом, которые позволяют имитировать именно человека, а не поисковую машину. Евгений старается направить беседу в нужное ему русло, стараясь создавать такие ситуации, когда его фраза выглядят человекоподобно. При короткой продолжительности беседы — 5 минут — такой подход часто срабатывает».

Владимир Веселов закочнил Военный Инженерно-Космический Институт им. А.Ф. Можайского, служил на Байконуре, закончил адъюнктуру ВИКА им. А.Ф. Можайского, работал программистом, научным сотрудником. В данный момент является разрабочиком программного обеспечения в компании Amazon Web Services.

ТТ проходил следующим образом: команда ученых-организаторов теста под руководством профессора Кевина Варвика и его ассистента Хумы Шан собрала судей (30 человек, поделенных на 4 смены) и «скрытых людей», которые должны были вести диалог. В тесте участвовало также пять чатботов, которые общались на английском языке.

Тест Тьюринга. Иллюстрация: сайт Университета Рединга

Каждый судья имел перед собой экран монитора, разделенный на две части. Судья должен был вести диалог одновременно с двумя «сущностями». При этом было неизвестно, кто из них компьютер, а кто — человек. Ровно, как в классическом тесте. Через пять минут окна отключались. Судья заполнял анкету и потом приступал к оценке следующей пары. Основная задача — определить, с кем шел диалог: с машиной или же с человеком.

Программа, созданная Владимиром Веселовым и его коллегами, смогла ввести в заблуждение ровно треть всех судей, присутствовавших на мероприятии. Поверьте, большей концентрации профессоров кибернетики я видел только на собраниях академии наук.

Подошли к концу четыре смены оценки, оргкомитет принялся подсчитывать бюллетени.

После всех церемоний я подошел к профессору и уточнил: действительно ли произошедшее означает, что ТТ окончательно пройден? «Да, — ответил профессор Варвик. — Мы специально пригласили судей и независимых наблюдателей — уважаемых ученых, чтобы все было сделано правильно и никаких сомнений не оставалось. Именно так: тест Тьюринга, пройден. Причем с оценкой значительно превосходящей — на 10% — оценку, данную самим Тьюрингом».

В целом, можно сказать, что для оценки искусственного интеллекта теперь надо придумывать другие тесты.

Скажу еще несколько слов о значении этого события для будущего. Прежде всего, это означает, что проникновение информационных систем в межчеловеческое общение ускоряется. Через пять лет уже невозможно будет сказать, общаетесь вы с живым оператором контактного центра или с машиной. Разницу будет можно почувствовать лишь через 5 минут общения. Второе — срочно необходимо решать вопрос с проведением ТТ на русском языке. Сейчас мы явно отстаем от зарубежных коллег, ведущих исследования ИИ на английском языке. Соревновательный подход, практикуемый на родине спорта — Британии — явно показал свою эффективность. Может быть, нам в Сколково стоит взять инициативу в свои руки и впервые провести ТТ на русском языке?

Источник

Компьютерный портал help.nspk-nvr.ru

Машины прошедшие тест тьюринга

Впервые компьютер прошел тест Тьюринга