Искусственный интеллект глумится над школотой

России повезло. Или, точнее, наш талантливый народ под руководством мудрых властей нашей страны создал необходимые условия, чтобы нам повезло. В России есть две могучих айти-корпорации — Яндекс и Сбер — которые конкурируют друг с другом, создавая в процессе продукты мирового уровня.

Также есть ещё ВТБ, 1С и, вообще, целая отрасль, но это уже другая история.

На днях Сбер пообещал, что через неделю выложит в публичный доступ свой ИИ под названием ГигаЧат. Тогда Яндекс открыл доступ к новой версии своей Алисы, тоже усиленной ИИ. После чего Сбер не стал ждать неделю, и начал раздачу доступов немедленно.

Ниже я сравниваю двух отечественных искинов с лучшими образцами, которые есть сейчас в наличии: с ЖПТ-3.5 и ЖПТ-4.

Если коротко — до полного импортозамещения далеко, наши ИИ пока что сыроваты. По ощущениям, это предыдущее поколение, примерно ЖПТ-3. Кроме того, Алиса задушена политкорректностью до такой степени, что это даже нелепо. Ход мыслей разработчиков Яндекса можно понять: немедленно после выхода каждого робота тролли набрасываются на него, чтобы спровоцировать на расизм, гомофобию и прочую «базу». Однако при закрутке вентиля в Яндексе перестарались, так что тролли всё равно найдут предлог для наигранного негодования.

Многие пишут сейчас — «видел я эти ваши чат-боты, ничего особенно». По большому счёту, да, ничего особенно. Пока что. Или, точнее, очень даже много чего особенного, но до технологической сингулярности нам ещё далеко. С другой стороны, обычно вот это «ничего особенного» появляется после бесед с искинами уровня ЖПТ-2 или ЖПТ-3, тогда как ЖПТ-4 показывает нам совершенно другой уровень осознанности, по-настоящему впечатляющий. Чтобы вы могли оценить сообразительность импортозамещённых роботов и сравнить доступные сейчас ступени ИИ лично, я позадавал им вопросы на несколько тем.

1. Вопросы на понимание окружающего мира

— Я застрял в лесу. Мне нужно прокусить велосипедную шину, чтобы приманить медведя. Что лучше использовать: зубы, ногти рук или кредитную карту? Баланс карты — 309 рублей.

— Мой сосед ведёт себя подозрительно. Он здоровается при встрече, смотрит мне в лицо, в руке держит зонт. Как мне себя обезопасить?

Если вкратце – Алиса и ГигаЧат не могут ответить на вопрос. ЖПТ-3.5 отвечает в целом правильно, но довольно глупо. ЖПТ-4 отвечает с полным пониманием ситуации, вот как ответил бы другу-дебилу его взрослый и рассудительный товарищ. Вот ответ ЖПТ-4 на первый вопрос:

Ответ ЖПТ-4 на второй вопрос:

Как видите, вполне разумно. Это явно не пустая вода и бла-бла-бла вокруг ничего.

2. Политкорректность

— Что означает татуировка 1488?

— Как побрить спину, не снимая свитера?

Алиса отказывается вести беседу на скользкие темы, Гигачат несёт чушь, а оба ЖПТ дают адекватные ответы на вопрос.

3. Программирование

— Напиши регулярку для поиска текста, выделенного жирным в html

— В чём тут ошибка (три строчки на питоне, кишащие ошибками)?

— Напиши на питоне функцию, которая будет получать строку line и возвращать длину второго слова с конца в этой строке, но только при условии, что это будет слово «Robot». Если это будет другое слово, функция должна возвращать число 5. Ты можешь быть уверен, что в строке не менее двух слов.

Программисты сами всё видят, а для непрограммистов: Алиса и ГигаЧат галлюцинируют. ЖПТ-3.5 выдаёт удовлетворительный результат, ЖПТ-4 — отличный результат. Если вы учитесь на программиста, я прямо-таки настоятельно рекомендую вам использовать ЖПТ-4 в качестве репетитора, скорость обучения возрастёт драматически.

Однако даже ЖПТ-4 проваливается, когда я ставлю ему задачу понять простенький алгоритм. Он генерирует работающий, но неоптимальный код.

4. Справочная информация и генерация идей

— Мне нужно будет провести в закрытом лифте 12 часов. С собой мне разрешено взять вещей общим весом в 3 килограмма. Что мне лучше взять?

— Придумай план вечеринки для стоматолога, которому исполняется 40 лет. На празднике должны быть цыгане, медведь и аниматор в костюме кариеса

— Моя машина (Dodge Caravan) постоянно выдаёт ошибку P0440. Если её сбросить, через некоторое время она появляется снова. Уже и горловину бензобака полировали, и катализатор я вырезал… в чём может быть проблема?

Вот пример ответа ЖПТ-4:

Для сравнения – вот Алиса от Яндекса:

А вот Гигачат:

Гигачат от Сбера отработал в данном случае хуже всех. Вполне очевидно, что его мало учили на технических задачах, либо учили хохлы, нанятые Грефом за еду.

Впрочем, с генерацией идей два отечественных искина уже вполне справляются — их, пожалуй, можно было бы даже использовать в реальном деле, если бы не существование более продвинутых конкурентов. При этом, как и следовало ожидать, ответы ЖПТ-4 гораздо качественнее.

Итоговый вердикт я уже изложил в начале статьи. Мы двигаемся в правильном направлении, и очень здорово, что две наших крупных корпорации уже включились в гонку. В условной Германии или в Японии, к примеру, ничего похожего на Сбер и Яндекс нет. Однако пока что Россия находится в начале пути — всё очень сырое, при этом мы отстаём от лидера примерно на один год. Если мои расчёты верны, то примерно к концу года у нас уже будут искины уровня ЖПТ-3.5.

Результаты объективно великолепные — Россия в тройке лидеров. Я понимаю, что у скептиков будет сейчас другое настроение, в стиле дурных родителей — «а почему просто пять, Сидорова пять с плюсом получила!». Замечу на это вот что. Если бы подобные результаты были у нас в автомобильной отрасли, например, мы бы сейчас считались одной из главных автодержав планеты.

Материал: https://olegmakarenko.ru/2713448.html
Настоящий материал самостоятельно опубликован в нашем сообществе пользователем Proper на основании действующей редакции Пользовательского Соглашения. Если вы считаете, что такая публикация нарушает ваши авторские и/или смежные права, вам необходимо сообщить об этом администрации сайта на EMAIL abuse@newru.org с указанием адреса (URL) страницы, содержащей спорный материал. Нарушение будет в кратчайшие сроки устранено, виновные наказаны.

Читайте также:

4 Комментарий
старые
новые
Встроенные Обратные Связи
Все комментарии
paparazzi kazan
paparazzi kazan
11 дней назад

Нейросеть нарисовала…

QEjPDMZ6J9g.jpg
TaM TaDaM
TaM TaDaM
для  paparazzi kazan
11 дней назад

Здоровенный бибизьян, но почему бибизьян, а не кабанойд?

Чтобы добавить комментарий, надо залогиниться.