Яндекс создал "гибридный" искусственный интеллект для перевода текстов

Аватар пользователя Postulat

Специалисты "Яндекса" создали новую систему онлайн-перевода, которая одновременно использует и старые статистические алгоритмы, и искусственный интеллект, сообщает пресс-служба компании.


Пока наша новая система поддерживает только перевод с английского на русский язык.

В ближайшее время мы начнем добавлять другие языковые пары и в течение нескольких месяцев реализуем поддержку большинства самых популярных языков, — заявили в пресс-службе "Яндекса", отвечая на вопросы корреспондента РИА Новости.

В последние несколько лет ведущие IT-компании начали активно развивать и использовать различные формы искусственного интеллекта для поиска информации в Сети, обработки фотографий и их каталогизации и множества других целей, где неклассические алгоритмы обработки данных не работают.

Ярким примером этого подхода стала система искусственного интеллекта AlphaGo, открыто обыгравшая чемпионов мира и Европы по го и анонимно победившая сотни топ-игроков в онлайн-системах этой древнекитайской игры.

Большая часть таких разработок основывается на так называемых глубинных — или сверточных нейросетях.

Они представляют собой каскады или многослойные структуры из нескольких десятков или сотен более простых нейросетей.

Каждая из них обрабатывает не исходные данные, а продукты анализа, полученные сетью, расположенной выше, что позволяет упрощать очень сложные проблемы и решать их при помощи сравнительно скромных вычислительных ресурсов.

Нечто похожее происходит и при использовании искусственного разума для перевода с одного языка на другой.

Когда нейросеть "читает" переводимый текст, то она не пытается перевести его по фразам или отдельным словам, а ищет ответ целиком, используя данные, накопленные при анализе текстов, переведенных человеком.

У подобного подхода, как отмечают специалисты "Яндекса", есть как плюсы, так и минусы: в таком виде текст становится более читаемым и похожим на то, как его перевел бы человек, но, с другой стороны, машина периодически начинает "фантазировать", если ей встречаются редкие слова и фразы.

Эту проблему "Яндекс" решил, объединив искусственный разум со старой системой перевода, хорошо справлявшейся с редкими словами, но сталкивавшейся с большими проблемами при их объединении в предложения.

Когда пользователь вводит текст, его одновременно переводит и нейросеть, и статистический алгоритм, после чего система машинного обучения CatBoost, недавно созданная "Яндексом", сопоставляет результаты и собирает из них более читаемый и грамотный вариант.

Сейчас старая версия "Яндекс.Переводчика" поддерживает 94 языка, в том числе ряд редких и вымышленных, например синдарин — язык эльфов из книг Дж. Р. Р. Толкина

Авторство: 
Копия чужих материалов
Комментарий автора: 

Понравилось;

... машина периодически начинает "фантазировать", если ей встречаются редкие слова и фразы.

Прямо как некоторые камрады в комментариях.smiley

Комментарии

Аватар пользователя vadesi
vadesi(13 лет 6 месяцев)

Ну, успехи пока не впечатляют - хвастаются переводом только с языка эльфов, придуманного Толкином, т.е. с живым настоящим языком успехов, которыми можно было бы похвастаться, нет. (И я не про последний абзац, а про то, о чём читал на др. ресурсе - хвастаются именно только переводом с искусственного языка).

Да, и вы в курсе, что по ту сторону интерфейса машинного перевода всё равно сидят люди-переводчики? Мне предлагали работу - подправлять, точнее, выбирать более адекватные, варианты перевода, сделанные ИИ. Копейки, гемор, не согласился, но факт то, что вы можете думать, что это всё машина сделала, а на самом деле там ещё и "негр" из плоти и крови сидит и кнопки давит, выбирает, который из говновариантов машинного перевода менее говнистый.

Комментарий администрации:  
*** отключен (кусок дерьма) ***