ИИ в поисках смысла

Год уходящий запомнится целым рядом замечательных ИИ-достижений. Тут и синтез речи беспрецедентного качества, и переизобретение криптографии, и кинематограф, музыка и творчество вообще, и победа в го, считавшаяся невозможной… Но даже на этом фоне новость, пришедшая на днях, выделяется. Потому что касается процесса, который, вообще говоря, до сих пор считался недостижимо сложным для автоматизации: осмысления информации. Правда, и сейчас ещё доказать, что — получилось, проблематично. Но косвенные улики, которые удалось собрать, свидетельствуют: машина научилась выделять смысл.

Чтобы понять, как этого удалось добиться, нужно вернуться на тройку месяцев назад. В сентябрь, когда разработчики Google Translate — знаете ведь этот сервис, один из самых популярных мультиязычных машинных переводчиков? — отрапортовали об успешной замене некоторых стандартных переводных моделей одной универсальной, основанной на ИИ и глубоком обучении.

До тех пор GT был набором моделей-трансляторов, которые, грубо говоря, писались наново для каждой пары языков. А гугловцы сделали следующее: взяли у коллег нейросетевой ИИ, который не раз уже применялся для решения других задач, и заставили его обучаться на миллиардах словарных пар из нескольких языков сразу, чтобы затем заставить переводить. Вообразите, насколько это сэкономит труд программистов! Ведь в одном только GT больше ста поддерживаемых языков, и если для каждой языковой пары писать отдельную модель, получается сто в квадрате.

Конечно, они были не первыми, кто попытался применить ИИ для перевода. Недостатки этого подхода известны, их два. Во-первых, ИИ-переводчики плохо показывают себя на фразах с относительно редкими словами. Во-вторых, они слишком жадны до машинных ресурсов — как в обучении, так и в работе. Однако гугловцам удалось обе проблемы решить, построив нейросеть особой формы (в частностью, с обратной связью: «вниманием»). Подробности изложены в статье, препринт которой остался на Arxiv.org

Так вот результаты, показанные ИИ-переводчиком, оказались на уровне лучших машинных трансляторов. Между языками, для которых удалось набрать один-два миллиарда словарных пар, ИИ переводит не просто лучше, а делая аж на 80% меньше ошибок по сравнению с классическим транслятором. Неудивительно, что разработка сразу же и была внедрена: ИИ взял на себя несколько языков в Google Translate и со временем стал набирать их всё больше. И вот когда счёт пошёл на десятки, вскрылась ещё одна удивительная вещь. Оказывается, ИИ-переводчик умеет переводить даже между языками, переводить между которыми его не учили!

Представьте, например, что на этапе обучения машину тренируют переводить с португальского на английский и с английского на испанский. Значит ли это, что она сможет потом перевести прямо с португальского на испанский? До сих пор ответ был отрицательным (гугловцы осторожно уточняют, что им об успехах в этом направлении ничего не известно). Но построенный ими ИИ-переводчик действительно это делает, причём качество перевода опять-таки на высоте. И это несмотря на то, что он в глаза не видел прямого сопоставления португальских и испанских фраз! Если же при обучении показать машине кое-что из португало-испанского словаря, качество перевода ещё улучшится.

Но как ИИ это делает? К сожалению, искусственная нейросеть — не компьютерная программа, внутрь которой можно залезть и вычленить алгоритм. С нейросетью приходится применять методы, отдалённо напоминающие методы исследования головного мозга живых существ: загружать её работой и визуализировать активность разных участков, пытаясь проникнуть в суть протекающих там процессов. Именно такому анализу был подвергнут и ИИ-переводчик — и получена следующая картинка:

Гуглоперевод

Здесь (а) показана работа нейросети в период перевода между тремя языками: английским, корейским и японским. При этом одним цветом обозначены блоки данных, имеющие общий смысл, то есть, например, хранящие предложение, переводимое с английского на корейский и с японского на английский. А (с) показывает уже внутреннюю структуру одноцветных сочленений: тут для разных языков уже разные цвета. Так вот тот факт, что языковые гроздья сгруппированы, но разделены по языкам, означает, что ИИ научился не просто механически сопоставлять слова и фразы из разных языков, а именно выделять смысл текста и накапливать его.

Это можно понимать и как осмысление (то есть выделение и накопление некоторой фундаментальной информации о содержании текста, не имеющей прямой связи собственно с языком, на котором текст был написан), так и изобретение искусственным интеллектом собственного промежуточного низкоуровневого языка («интерлингва», который машина потом использует, чтобы переводить между языковыми парами, которым её не учили). В обоих случаях это одинаково масштабное достижение — и оно уже применяется практически в Google Translate, хоть пока и не для всех языков, и имеет огромный потенциал.

Чем это может пригодиться человеку и чем угрожать? Что касается пользы, следует понимать вот какую вещь: умение выделять смысл из информации — святой грааль для всех самых важных задач, какие только человек мечтает заставить машину решать. Научите машину выделять смысл — и вы научите её изобретать методы компрессии данных недостижимо высокой эффективности. Научите выделять смысл — и машина обыграет всех спекулянтов на бирже. Научите выделять смысл — и она пройдёт, наконец, тест Тьюринга, но уже не обманув человека красивой имитацией, а действительно осмысленно строя диалог! Так что за качественным ИИ-переводом обязательно последуют другие интересные свершения в областях, вроде бы с лингвистикой совершенно не связанных, тут нет никаких сомнений.

А вот чем это может нам угрожать? Угроза тут проистекает из одного того факта, что машина становится умнее человека. Не быстрее, точнее или логичней, а именно умнее. Раз она способна теперь проникать в суть вещей и событий по крайней мере так же глубоко, как создатель, возникает и реальная опасность, что это может быть против создателя так или иначе обращено.

Правда, тут понадобится разум: одного только блока выделения смысла для бунта машин мало. Но что если где-то там, в переплетениях искусственных нейронов гугловского сильного ИИ, научившегося тому, чему и человека научить не всегда возможно, огонёк разума уже теплится, а мы просто не понимаем?

Источник материала
Настоящий материал самостоятельно опубликован в нашем сообществе пользователем Postman на основании действующей редакции Пользовательского Соглашения. Если вы считаете, что такая публикация нарушает ваши авторские и/или смежные права, вам необходимо сообщить об этом администрации сайта на EMAIL abuse@proru.org с указанием адреса (URL) страницы, содержащей спорный материал. Нарушение будет в кратчайшие сроки устранено, виновные наказаны.

Читайте также:

Кстати, по этому поводу сразу вспомнилось: Чем царь отличается от президента? Царь знает, что если он разворует страну, то ничего не останется его детям. Президент знает, что если он НЕ разворует страну, то ничего не останется его детям.

Комментарии о материале

На почту
avatar
wpDiscuz