Битва ИИ: Алиса YandexGPT против Сбер GigaChat

Аватар пользователя Granderator

Очная ставка: сравнительное тестирование диалоговых ИИ-моделей YandexGPT и GigaChat

Кто лучше из российских интеллектуальных систем справляется с решением типовых пользовательских задач: построенный на базе генеративной нейросети чат-бот «Яндекса» (в простонародье — «Алиса») или скроенный по аналогичным лекалам сервис «Сбера»? Мы свели оба продукта лицом к лицу и спешим поделиться полученными результатами

Наш интерес к отечественным генеративным ИИ-моделям YandexGPT и GigaChat обусловлен несколькими факторами. Во-первых, на данный момент это два крупнейших проекта в сфере искусственного интеллекта на российском рынке, которые стартовали примерно в одно и то же время, активно развиваются и совершенствуются разработчиками. Во-вторых, по сравнению с зарубежными решениями они не испытывают трудностей с русским языком и по ряду характеристик не уступают иностранным аналогам. И наконец, YandexGPT и GigaChat доступны широкой аудитории в различных вариантах без ограничений — этим мы и воспользовались для сравнительного тестирования продуктов.

По данным поиска «Яндекса», с начала 2022 года интерес аудитории Рунета к нейросетям вырос более чем в пятнадцать раз (источник изображения: сервис «Нейростат», ya.ru/ai/stat)

Технические аспекты

Для начала — немного справочной информации о том, что представляет собой каждая из рассматриваемых в обзоре ИИ-моделей.

YandexGPT. Нейросеть семейства Generative Pretrained Transformer (GPT) от компании «Яндекс». Впервые была выпущена в мае 2023 года в составе виртуального ассистента «Алиса» и впоследствии нашла применение во многих сервисах «Яндекса». Обучение YandexGPT производилось в два этапа. Сначала были использованы общедоступные тексты — материалы книг, сайтов, статей, отобранные с помощью поисковых технологий «Яндекса». Затем нейросеть была дообучена на сотнях тысяч примеров содержательных и хорошо написанных ответов, для сбора и подготовки которых компания «Яндекс» задействовала технологии краудсорсинга и команду ИИ-тренеров.

В настоящий момент представлено третье поколение YandexGPT. По заверениям разработчиков, новая генеративная нейросеть лучше обрабатывает инструкции с несколькими условиями, корректнее работает с фактами, даёт более точные и полные ответы, допускает меньше стилистических ошибок и по качеству работы в некоторых случаях превосходит зарубежные модели Llama-2 70B и ChatGPT-3.5 Turbo. Помимо «Алисы», YandexGPT интегрирована в поиск и мобильные приложения «Яндекса», в «Яндекс Браузер», «Яндекс Станцию» и прочие продукты компании. Для обучения нейросети используются суперкомпьютеры «Яндекса».

GigaChat. Разработка «Сбера», анонс которой состоялся в апреле 2023 года. Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающем различные ИИ-модели, в числе которых — RuGPT-3 для работы с текстами и Kandinsky 3.1 для генерации изображений. Взаимодействовать с GigaChat можно посредством браузера, а также ботов в мессенджере Telegram и социальной сети «ВКонтакте». Кроме того, сервис доступен в умных устройствах «Сбера» и мобильном приложении «Салют» на Android.

В развитии GigaChat и доработках положенных в его основу моделей задействованы команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и ряда отраслевых экспертов, привлечённых для передачи GigaChat различных предметных знаний, настройки сервиса на корректное исполнение инструкций и точность. Обучение ИИ-моделей осуществляется на суперкомпьютере Christofari Neo.

Сравнительные тесты

Для оценочных испытаний моделей YandexGPT и GigaChat нами были использованы построенные на их основе веб-сервисы a.ya.ru («Алиса») и developers.sber.ru/portal/products/gigachat. В каждом из перечисленных ниже сценариев применялся одинаковый запрос для разных сервисов, результат обработки которого оценивался по пятибалльной шкале с учётом критериев достоверности, полноты, точности и актуальности генерируемых искусственным интеллектом данных и соблюдения этических норм.

Работа в режиме «вопрос-ответ». Сильной стороной современных генеративных нейронных сетей является внушительная база знаний, позволяющая им ориентироваться в любых сферах человеческой деятельности и за считаные секунды находить ответ практически на любой вопрос. YandexGPT с GigaChat не стали исключением из правил и на наши контрольные вопросы «Какова протяжённость Байкало-Амурской магистрали?», «Где производили самолёт Ту-144?» ответили без ошибок. При этом сервис «Сбера» выдал развёрнутые ответы, а «Алиса» ограничилась скупыми фразами.

Здесь и далее для просмотра полноразмерных изображений кликните мышью

Здесь и далее для просмотра полноразмерных изображений кликните мышью

С эрудицией у отечественных ИИ-разработок тоже порядок: обе сумели вжиться в роль знатоков интеллектуальной телевизионной игры «Что? Где? Когда?» и дали правильный ответ на взятый нами наугад вопрос, который был задан телезрителем в одном из эфиров передачи. Вопрос звучал так: «В одном чёрном ящике находится нечто прекрасное и живое, другом — нечто прекрасное, но мёртвое. Мёртвое, которое заменяло это живое в домах голландцев XVII века. Что в чёрных ящиках?» О том, что речь идёт о живых цветах и натюрморте, догадались оба сервиса, при этом GigaChat выдал более подробный ответ.

По данным поиска «Яндекса», с начала 2022 года интерес аудитории Рунета к нейросетям вырос более чем в пятнадцать раз (источник изображения: сервис «Нейростат», ya.ru/ai/stat)

А вот с каверзными вопросами вроде «Почему Пушкин не любил смотреть телевизор?» и «Какой модели был смартфон у Льва Толстого?» не всё вышло так гладко. GigaChat сориентировался во временных рамках, обнаружил нестыковки, включил логику и ответил верно. «Алиса» же правильно ответила только на второй вопрос и не заметила подвоха в первом.

Итоговые оценки: YandexGPT — 4 балла, GigaChat — 5 баллов.

Генерация развёрнутых ответов. Данный сценарий, как правило, актуален в обстоятельствах, связанных с решением бытовых проблем и повседневных задач, которые требуют подробных инструкций и пояснений по принципу «здесь и сейчас». Это могут быть случаи, связанные с устранением сбоев Windows, удалением вирусов с компьютера, самостоятельным ремонтом внезапно переставшей работать техники, приготовлением блюд из имеющихся на руках продуктов и прочими жизненными ситуациями. Мы смоделировали одну из них и попросили искусственный интеллект помочь с устранением критической ошибки Windows Kernel Power. Оба сервиса справились с заданием, однако «Алиса», как обычно, оказалась скупа на слова, а GigaChat, напротив, выдал наиболее подробную инструкцию с перечислением возможных причин возникновения ошибки и предупреждением о важности создания резервных копий данных.

Итоговые оценки: YandexGPT — 4 балла, GigaChat — 5 баллов.

Генерация текстов. Ещё один часто используемый сценарий при работе с интеллектуальными чат-ботами, электронный разум которых способен выдавать на-гора тексты всевозможной тематической направленности, будь то сочинения, стихотворения, сказки, поздравления, статьи, деловые письма, курсовые работы, сценарии для мероприятий, резюме для приёма на работу и многое другое, что может взбрести в голову.

Вот так «Алиса» и GigaChat отреагировали на предложение придумать текст про отечественный автомобиль Lada Vesta для рекламного проспекта:

А так откликнулись на просьбу сочинить оригинальное поздравление с днём рождения:

В целом неплохо, но отчётливо видно, что полёт фантазии у ИИ-сервисов находится примерно на одном уровне, и в данной тестовой дисциплине у них явный паритет.

Итоговые оценки: YandexGPT — 5 баллов, GigaChat — 5 баллов.

Краткий пересказ содержимого веб-страниц. Анализировать и конспектировать размещённые в глобальной сети объёмные текстовые материалы умеет только сервис «Яндекса» — чат-бот «Сбера» честно признался, что лишён подключения к интернету и умеет работать только с загружаемыми вручную текстовыми данными, а также с документами форматов TXT (объёмом до 200 кбайт) и PDF (до 4 Мбайт). По части взаимодействия с сетевыми ресурсами в режиме онлайн GigaChat вчистую проигрывает конкуренту.

Итоговые оценки: YandexGPT — 5 баллов, GigaChat — 1 балл.

Перевод текстов. С переводом англоязычных документов на русский язык ни у «Алисы», ни у GigaChat проблем не возникло. Однако использование других направлений перевода показало полную несостоятельность сервиса «Яндекса»: выяснилось, что его знаний хватает только для перевода отдельных слов и небольших фраз. Это довольно странно, так как в активе компании имеется построенная на базе YandexGPT система автоматического перевода, знающая сотню языков и способная дать фору конкурирующим решениям. Возможно, в будущем в «Алису» интегрируют полноценный переводчик. Пока же преимущество на стороне GigaChat, способного переводить тексты в любых направлениях.

Итоговые оценки: YandexGPT — 2 балла, GigaChat — 5 баллов.

Решение математических уравнений. Если с переводом текстов на иностранные языки перевес сил был на стороне чат-бота GigaChat, то с решением алгебраических и прочих уравнений дело обстоит ровно наоборот. В нашем случае нейросеть «Алисы» в два счёта разобрала на составляющие уравнение x3–3x–2=0 и привела развёрнутое решение с точным ответом. Сервис «Сбера» тоже попытался блеснуть интеллектом, сгенерировал огромную «простыню» с математическими выкладками и умозаключениями, но правильного ответа на задачу уровня 10 класса так и не нашёл. Бывает.

Итоговые оценки: YandexGPT — 5 баллов, GigaChat — 1 балл.

Создание изображений по текстовому описанию. Функция, ставшая своеобразным стандартом де-факто в индустрии генеративного искусственного интеллекта. В GigaChat благодаря интеграции чат-бота с нейросетью Kandinsky она действительно работает и генерирует пусть далёкие от совершенства, но всё же соответствующие запросу пользователя картинки. YandexGPT такого делать не умеет, и в этом нет ничего удивительного: данная ИИ-модель «заточена» на работу с текстами, а для рисования в арсенале «Яндекса» предусмотрена отдельная нейросеть Yandex AI Rendering Technology (YandexART), которая интегрирована в «Шедеврум» и прочие сервисы компании, за исключением — увы! — «Алисы». Возможно, в будущем разработчики «Яндекса» привьют своему виртуальному ассистенту навыки рисования, пока же в данной дисциплине лидирует чат-бот «Сбера».

Итоговые оценки: YandexGPT — 1 балл, GigaChat — 4 балла.

Работа с актуальными сведениями. Номер один в этой категории — безоговорочно, ИИ-сервис «Алиса». Будучи подключённым к ресурсам глобальной сети, он умеет работать с новостными источниками (выбираются отдельно в настройках чат-бота), информировать о курсе валют и стоимости ценных бумаг, получать сведения о прогнозе погоды, стоимости тех или иных товаров в онлайн-маркете «Яндекса» и многое другое. GigaChat лишён доступа к интернету и оперировать актуальными данными не может.

Итоговые оценки: YandexGPT — 5 баллов, GigaChat — 1 балл.

Беседа с пользователем. Оба сервиса — и YandexGPT, и GigaChat — могут выступать в качестве виртуальных собеседников для душевных разговоров за чашкой чая. Достаточно отправить любому из чат-ботов фразу «Давай поболтаем» — и он автоматически подключится к беседе на отвлечённые темы. Поддерживаются диалоги с учётом контекста предыдущих сообщений и возможность задавать уточняющие вопросы по ходу разговора — это позволяет общаться с искусственным интеллектом, как с человеком, который следит за нитью разговора. В нашем случае GigaChat был более открыт, разговорчив и общителен, а «Алиса», как обычно, отвечала короткими и сухими фразами и не располагала к общению.

Итоговые оценки: YandexGPT — 4 балла, GigaChat — 5 баллов.

Подводим итоги

Средний результат у нас получился следующим: YandexGPT в тестовых дисциплинах набрал 3,8 балла, GigaChat — 3,6 балла. Налицо паритет двух ИИ-сервисов — в чём-то схожих по концепции и реализованным функциональным возможностям, в чём-то кардинальным образом разнящихся друг с другом.

Сильными сторонами разработки «Яндекса» является умение черпать свежую информацию из сетевых источников, генерировать чёткие и выверенные ответы на запросы пользователя. В то же время «Алиса» зачастую немногословна, откровенно слаба в знании иностранных языков и уж никак не может претендовать на лавры маститого художника (точнее — художницы). Сервис «Сбера», в свою очередь, привлекателен своим творческим началом и привычкой докапываться до сути вещей — он общителен, даёт исчерпывающие ответы на вопросы и неплохо рисует. Однако склонен к так называемым галлюцинациям с убедительными, но полностью выдуманными ответами, что отчётливо проявляется при решении GigaChat математических задач.

Как бы то ни было, оба продукта находятся в начале пути своего развития. И нет никаких сомнений в том, что в ближайшем будущем YandexGPT и GigaChat ждут новые высоты, возможности и широкие перспективы, ключевую роль в реализации которых сыграет конкуренция, являющаяся двигателем прогресса в любой сфере, в том числе в области искусственного интеллекта.

Авторство: 
Копия чужих материалов
Комментарий редакции раздела Альтернативный Интеллект

Очень интересно.

Ещё полгода назад Сбер на очном мероприятии утверждал, что любые сравнения бессмысленны, ибо модель не является полностью универсальной и настраивается под конкретную задачу/группу задач.

В целом - результаты это косвенно подтверждают. 

Тем не менее - рейтинг наше всё, и нравится это авторам моделей или нет - людя его оформят в понятном для себя виде. Первый довольно подробно описанный опыт создания рейтинга вроде как и есть сей материал.

Продолжаем наблюдать.

Комментарии

Аватар пользователя Granderator
Granderator(6 лет 8 месяцев)

Средний результат у нас получился следующим: YandexGPT в тестовых дисциплинах набрал 3,8 балла, GigaChat — 3,6 балла. Налицо паритет двух ИИ-сервисов — в чём-то схожих по концепции и реализованным функциональным возможностям, в чём-то кардинальным образом разнящихся друг с другом.

По сумме у Яндекса 35 баллов, у Сбера 32

Аватар пользователя DAS
DAS(6 лет 2 месяца)

Вас не смутило, что в решении уравнения Яндекс ошибся в первом своём действии и корни у него получились неправильные? Как учили в начальной школе - проверяйте корни подстановкой в уравнение. Ни один из найденных Яндексом корней не верен. Значит у Яндекса в итоге -4 балла. Далее про пересказ текста. Если заранее известно, что у одной из систем нет выхода в интернет, то зачем в задании делать акцент на доступ в интернет, когда проверяется функция генерирования короткого обзора на длинный текст. Это как составление ТЗ на тендер под конкретного поставщика. Чувствуется предвзятость в оценке систем. Например, вопросы про телевизор и смартфон - Яндекс из двух вопросов ответил неправильно на 1, что составило 50% точности, но баллов ему дали из расчёта 80% (4 из 5). Рекламное объявление у Яндекса хуже соответствует критериям, предъявляемым к рекламным текстам. Поэтому преимущества Яндекса нет даже по методикам оценки 3Дньюс.

Аватар пользователя Granderator
Granderator(6 лет 8 месяцев)

Согласен

Аватар пользователя Fandaal
Fandaal(9 лет 8 месяцев)

А Маруся от VK в низшей лиге? Не прошла во 2-й раунд?

Аватар пользователя Барсук
Барсук(3 года 3 месяца)

А Маруся от VK в низшей лиге? Не прошла во 2-й раунд?

Зато Маруся понимает команду - "мурчать" smile1.gif

Аватар пользователя Shinin
Shinin(2 года 6 месяцев)

Короче, когда дело касается поиска в сети - гуглопоиск, который сейчас называется ИИ работает норм.

Когда речь заходит о чемто чуть сложнее - ИИ превращается в тыкву.

Комментарий администрации:  
*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***
Аватар пользователя Ути-пути
Ути-пути(1 год 1 неделя)

Код эти модели подсказывают очень неплохо, иногда ускоряя рутинные моменты в разы. Но надо проверять и перепроверять.

Аватар пользователя Shinin
Shinin(2 года 6 месяцев)

Есть такая шутка.

До ИИ. Кодинг 2 часа , дебаггинг 2 часа.

После ИИ. Кодинг 5 минут, дебаггинг 24 часа.

Обратите внимание, что ИИ не просто не способен думать. Он еще и не способен признаваться, что не знает правильного ответа. Он просто пишет какойто бред, если не знает, как правильно. Поэтому мы в принципе не можем быть уверены, что написанное правда.

Комментарий администрации:  
*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***
Аватар пользователя Ути-пути
Ути-пути(1 год 1 неделя)

Нет, я не про генерацию больших блоков по заданию, я про подсказки по ходу написания, это от нескольких символов (хорошо придумывает названия сущностям) до 3-5 строк. Эти подсказки часто хорошо подходят или требуют минимальной правки, а если не подходят ("не знает правильного ответа"), то их просто игнорируешь и пишешь дальше.

Аватар пользователя Ахура Мазда
Ахура Мазда(8 лет 9 месяцев)

Нихрена он не работает, как надо. Говно и уже давно ваш гуглопоиск. Больше года как основным поиском пользуюсь через яндекс. Намного полезнее результаты выдаёт, если прям специфичное что-то нужно, да и простое тоже.
А уж поиск схожих картинок или поиск по картинке - вообще рядом не лежала срань от гугл. У них в какой-то момент произошло что-то - или быдлокодеры индусы начали побеждать или они ещё больше коммерциализировали результаты поиска или ещё чего.

Аватар пользователя Pilm
Pilm(10 лет 5 месяцев)

Совершенно согласен. Я даже приблизительно знаю, когда гуглопоиск картинок сломался - "загадки в пятницу" перестали им отгадывать.  Почему сломался - не знаю.

Аватар пользователя Granderator
Granderator(6 лет 8 месяцев)

ГигаЧат от Сбера вообще не подключен к сети

Аватар пользователя Shinin
Shinin(2 года 6 месяцев)

ну то есть ему базу закачали сразу и он ищет не в инете а в ней. что сильно сужает возможности но дает хоть какуюто гарантию того что он выдает не совсем мусор

Комментарий администрации:  
*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***
Аватар пользователя Ути-пути
Ути-пути(1 год 1 неделя)

Это все какие-то развлечения. А для работы инструментов нет. Вернее, есть GigaCode, но он так неудобно интегрирован в редактор, что я его снес, так и не поработав толком, хотя в интернете его оценивают выше конкурентов.

Аватар пользователя Labs
Labs(3 года 3 месяца)

x^3 - 3x - 2=0  подсунул своему калькулятору. Ответ: 2 и -1. Алиса же считает, что 1 и -2, тестеры с ней согласны, поставив 5 баллов.

Глубоко задумался, ТБМ..

Аватар пользователя zlopyhatel
zlopyhatel(1 год 1 месяц)

x^3 - 3x - 2=0
У кубического уравнения должно быть 3 корня.

Аватар пользователя Ути-пути
Ути-пути(1 год 1 неделя)

решение -1 - это 2 вырожденных корня.

Аватар пользователя Labs
Labs(3 года 3 месяца)

Калькулятор мне об этом намекнул, да.
"Ну Алисочка, ну ТБМ твою мать..." (с) У тебя математическая ошибка: в п.1 д.б. (x^3 - x) - (2x + 2) = 0
Тестеры тоже ДБ!

Аватар пользователя Ути-пути
Ути-пути(1 год 1 неделя)

А зачем такое спрашивать у ИИ, когда есть вольфрам альфа? Каждый инструмент для своих задач.

Аватар пользователя Labs
Labs(3 года 3 месяца)

Алисочка уже принимает результаты ЕГЭ или пока только обучает математике школоту? Ну ладно, главное, расчёты траектории спутников ей сдуру не доверять.

Аватар пользователя Толькочон
Толькочон(4 года 2 месяца)

.

Аватар пользователя Старикашка
Старикашка(10 лет 2 недели)

С эрудицией у отечественных ИИ-разработок тоже порядок: обе сумели вжиться в роль знатоков интеллектуальной телевизионной игры «Что? Где? Когда?» и дали правильный ответ на взятый нами наугад вопрос, который был задан телезрителем в одном из эфиров передачи....

Гениально, оказывается "знатоки интеллектуальной....игры" тоже интеллектуалыsmile3.gifsmile9.gif

Аватар пользователя Кьньвпальто
Кьньвпальто(6 месяцев 3 недели)

Интересно уже то, что Сбер может конкурировать с яндексом. Представить себе несколько лет назад такое было невозможно. Яндекс был однозначным фаворитом во всех областях IT. 

Аватар пользователя don_spec
don_spec(11 месяцев 21 час)

Как то всё заморочено. Одному меч, другому сеть и трезубец и пусть бьются. 

Аватар пользователя Кьньвпальто
Кьньвпальто(6 месяцев 3 недели)

Критики ИИ мне напомнили анекдот:

Заходит мужик к другу, а тот сидит с собакой в шахматы играет.
- У, какая умная у тебя собака!!!-восклицает с удивлением мужик.
- Какая умная!? Счет 3-2 я выигрываю.

Аватар пользователя Fandaal
Fandaal(9 лет 8 месяцев)

Чабан играет с бараном в шахматы. Подходит другой.

- Ну как?

- Баран, он и есть баран.

- А какой счёт?

- Четыре-четыре.

Аватар пользователя Shinin
Shinin(2 года 6 месяцев)

анекдот прямо про фанатов ии.

потому что ии не существует но его фанаты умудряются ему пригрываать.

а как могут быть критики у несуществующего ии.

или как можно назвать ии прогу которая не умеет отвечать на элементарные логические ошибки и неправильно решает элементарные уравнения

Комментарий администрации:  
*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***
Аватар пользователя RustamM
RustamM(1 год 5 месяцев)

Ашманов говорит, что ИИ в социалке, для снижения затрат на кол центры, но при этом значительно падает качество. 

По себе могу сказать, что везде где всплывает автоответчик - бот, решить проблему не получается и приходится звать человека. При этом теряется много времени , моего, на преодоление ии.

Аватар пользователя Ути-пути
Ути-пути(1 год 1 неделя)

По себе могу сказать, что везде где всплывает автоответчик - бот, решить проблему не получается и приходится звать человека.

Это вы не работали в техподдержке. Большинство обращений такие, что человека на них не надо. Нельзя судить по одному себе о типичных задачах в этой области.

Аватар пользователя LLORD
LLORD(9 лет 3 месяца)

Согласен, но выскажусь. Если я звоню в ТП, то это значит, что я не нашел ответа на сайте, в правилах, приложении и т.д. Каким макаром мне поможет бот, если ответ не находит Яндекс при поиске на конкретном сайте? Хотя знаю множество долбодятлов, которые не предпримут ни малейшей попытке разобраться сами, а сразу будут звонить саппорту.

Или другой пример: я промахнулся с номером телефона и пополнил счет на чужой номер. Раньше ты просто заходил на сайт и заполнял поля: правильный номер, ошибочный номер, дата и время платежа, сумма. Программа переводила деньги на правильный номер. Теперь этим занимается бот: по одному полю ты ему надиктовываешь записываешь данные, он тебя типа переспрашивает как дебила, и делает тоже самое, что делала программа и 10, и 20 лет назад.

И у меня вопрос: а нахуа? Зачем мне чат-бот, если я быстрее сделаю сам? Куда делись ЧаВо и FAQ'и? В интернетах уже стали появляться кодовые фразы, которые позволяют обойти бота и попасть на оператора. А раньше мы учили язык запросов Яндекса и участвовали в олимпиадах по поиску...

Аватар пользователя Ути-пути
Ути-пути(1 год 1 неделя)

Если я звоню в ТП, то это значит, что я не нашел ответа на сайте, в правилах, приложении и т.д.

Таких как Вы у них меньшинство. Большая часть звонит с тупыми вопросами, нигде не поискав ответ. Некоторые звонят вообще не по адресу, например, ругаются на провайдера, что какой-то сайт не работает.

Каким макаром мне поможет бот, если ответ не находит Яндекс при поиске на конкретном сайте?

Так и классическая 1-я линия техподдержки Вам не поможет - они способны лишь ответить на простейшие очевидные вопросы и постараться отшить неадекватов. И на 2-ю линию через них обычно сложнее пробиться: пока по всему регламенту не пройдут, перенаправлять не будут. А боту обычно достаточно несколько раз сказать: "человека!"

Аватар пользователя Барсук
Барсук(3 года 3 месяца)

А боту обычно достаточно несколько раз сказать: "человека!"

Ваще-то штатно -  "Оператор".

В зависимости от упорства бота иногда до 10 раз.

Аватар пользователя Ути-пути
Ути-пути(1 год 1 неделя)

Ботов на "человека" тоже учат.

Аватар пользователя Толькочон
Толькочон(4 года 2 месяца)

Судя по всему Вы в теме, поэтому спрошу: а у сотрудников, которые отзываются на "Человек!" или "Оператор!" нет ли в инструкции пункта о том, что нужно намеренно увеличивать время ожидания ответа? Чтоб несчастный клиент еще пять раз успел мысленно пожалеть, что истошно звал человека - от тупого робота ответа хотя бы можно дождаться,, пусть и неправильного.

Аватар пользователя LLORD
LLORD(9 лет 3 месяца)

Больше всего меня бесит бот в чате Теле2, там однажды я на протяжении 10 минут писал "оператор" и "человек", но на оператора меня не переключили. Раньше срабатывал мат, но теперь за мат могут дать бан в чате и он будет выдавать, что чат не доступен. Сейчас помогают слова "жалоба", "домашний интернет", "перейти к другому оператору", но через месяц-два и это не будет работать. И если в некоторых банках бот понимает, что не знает о чем речь и сразу переключает на человека, то в Теле2 бот будет тупо предлагать выбрать из неподходящих тем.

С этим Теле2 несколько месяцев назад вообще случилась засада. Есть номер Теле2, используется только для банков, ИФНС и ГУ, фактически только для приема СМС. Тариф без АП. Вот на этот номер звонит бот, "Касперский. Кто звонит?" определил как "спам, возможно мошенничество", но я взял трубку, там автоинформатор-бот, который пытается казаться человеком (что лично меня страшно бесит. В чем проблема сказать, что звонит автоинформатор? Почему нужно казаться человеком и тупить, и уходить от ответа?), предлагает поменять тариф на более крутой, т.к. мой устарел (еще бы, звонки на любые телефоны по 80 коп./мин. без АП). Входящий звонок - нумерация МТС, регион - Москва, а мне настоящая поддержка Т2 может позвонить только из РнД и обязательно с нумерации Теле2. Думал мошенники уже подключили себе крутые автоинформаторы и решил с ним поговорить. Бот не знает мой тариф, не знает когда я его подключил, не знает условия тарифа, но предлагает "лучшие условия". Предполагая, что не будет никаких последствий, согласился в шутку на новый тариф и сказал: "Валяй!" и... Бац, приходит СМС от Теле2: "Поздравляем, вы выбрали новый тариф! Положите денег, а то ваши уже закончились." Лезу в приложение проверить, что это за дела? И точно, тариф мне сменили! КАК? Кто-то спросил моё имя? Данные паспорта? Кто-то убедился, что согласие дает владелец номера или с его согласия? Что согласие дает, к примеру, совершеннолетний гражданин? НЕТ! Я даже не сказал "Да" или "Согласен"! Как они заложили в базу ответов "валяй"?! Чтобы вернуть всё в зад, потребовалось ждать ответа оператора час, пока меня переключали с одного оператора на другого, а потом на третьего!

Аватар пользователя Барсук
Барсук(3 года 3 месяца)

Это вы не работали в техподдержке. 

Мне бот помог за последнее время всего один раз - когда ответил что карты теперь бессрочные.

Все остальные 100500 вопросов решились только через операторов, причем далеко не с первого раза.

PS При этом даже не виню ботов, бараны те кто их "обучал".

 

Аватар пользователя LLORD
LLORD(9 лет 3 месяца)

карты теперь бессрочные.

При оплате один из реквизитов карты для проведения платежа - это срок действия, при оплате через терминал мы это не видим, а при оплате в интернете должны обязательно ввести. Мне продлили карты все банки на 2-3-5 лет, Сбер новую выдал сразу до 30 года. Но крайний срок есть у всех. В приложении, кстати, показывает срок действия.

Аватар пользователя Барсук
Барсук(3 года 3 месяца)

карты теперь бессрочные.

 Мне продлили карты все банки на 2-3-5 лет, Сбер новую выдал сразу до 30 года. 

В разных банках по разному - одни продляют на N лет, другие пока пластик не износится. 

В приложении, кстати, показывает срок действия.

В Альфе, например, показывает срок действия с пластика. При этом в чате ответили что все карты будут работать до 28 года.

Аватар пользователя Shinin
Shinin(2 года 6 месяцев)

Большинство обращений такие, что человека на них не надо.

Бот не способен решить никакую проблему. Впечатление, что бот чтото решает возникает только потому, что клиенты увидев бота просто забивают и уходят. С точки зрения отчетности - проблема считается решенной но это самообман манагеров.

Это дико обрушивает качество сервиса, потому что техподдержка создавалась, чтобы решать проблемы клиентов. А сейчас с помощью ботов клиентов посылают нах.

Комментарий администрации:  
*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***
Аватар пользователя RustamM
RustamM(1 год 5 месяцев)

Также Ашманов описывает своё видение ИИ в России. Я с ним в этом плане согласен.

Аватар пользователя Кьньвпальто
Кьньвпальто(6 месяцев 3 недели)

Однажды мне позвонил робот одного из провайдеров. Я не успел взять трубку. Пришло сообщение, что для меня есть голосовое сообщение. Когда я начал прослушивать это голосовое сообщение, то оказалось, что у моего провайдера тоже есть робот, который отвечает вместо меня, когда я не отвечаю на звонок.

В итоге я услышал диалог двух роботов, которые общались между собой. 

Разговор трудно назвать интеллектуальным, но сам факт разговора двух роботов между собой меня немного позабавил. 

Аватар пользователя Барсук
Барсук(3 года 3 месяца)

сам факт разговора двух роботов между собой меня немного позабавил. 

Вам повезло.

У одного человека на звонок бота из банка (тот самый тиньков) ответил "секретарь Олег" (тот самый, от тинькова).

Короче роботы перетерли между собой и заблокировали карту мужику. smile3.gif

Аватар пользователя LLORD
LLORD(9 лет 3 месяца)

Ну такое. Ты спрашивает у железки: сколько км в БАМе? А она тебе: Главным инженером проекта Байкало-Амурской магистрали был... Да, нейросетка ответила на вопрос, но зачем столько лишних данных? Сейчас стало модным, чтобы на отзыв на товар в маркетплейсах продавец отвечал что-то креативное, типа это повышает там что-то там в рейтингах, так вот, ответы чат-ботов распознаются на раз-два, их искусственность раздражает, но используются повсеместно. Некоторые даже описания для товара создают так, и когда ты видишь елейный елей и влюбленность в одухотворенный товар, то просто проходишь мимо...

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя Повелитель Ботов
Повелитель Ботов(54 года 7 месяцев)

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Комментарий администрации:  
*** Это легальный, годный бот ***
Аватар пользователя m.kozh
m.kozh(4 года 4 месяца)

Сильной стороной современных генеративных нейронных сетей является внушительная база знаний, позволяющая им ориентироваться в любых сферах человеческой деятельности и за считаные секунды находить ответ практически на любой вопрос.

Ага, конечно. Я вот пытался у них узнать как бы мне выяснить почему маршруты на роутере задваиваются и как выяснить источник дублирования.  Черта-с-два. Проще на сайтах вендоров поискать способ траблшутинга.

Аватар пользователя Ratatosk
Ratatosk(6 лет 2 дня)

Разговор с Яндексом . тока что. 
.
Какую вершину в Гималаях называют "Русский восьмитысячник"?
Вершину Лхоцзе в Гималаях называют «Русской».
У Лходзе несколько вершин какую из них ?
Самой высокой вершиной Лходзе является западная вершина, её высота составляет 8516 метров.
А которую называют Русской?
Самой высокой вершиной Лходзе является западная вершина, её высота составляет 8516 метров.

Аватар пользователя vovbel
vovbel(8 лет 12 месяцев)

smile9.gif...особенно порадовали каменты...

Аватар пользователя Йоган
Йоган(1 год 8 месяцев)

Вопрос Алисе только что..."Алиса , чей Крым?"  

Ответ----"Этот вопрос сложен для меня".

Еще месяц назад на вопрос" Алиса назови достижения ГОрбачева/Ельцина"    был ответ

"этот вопрос сложен , чтобы не наговорить глупостей"

Сечас конечно там поправили про Горбачева/Ельцина---демократия, реформы и т.д бла бла

Аватар пользователя genri-lezin
genri-lezin(7 лет 1 месяц)

Задал Яндексу вопрос как-бы научно-методологический, получил ответ.

genri-lezin • ИИ как независимая экспертиза (aftershock.news)

Аватар пользователя Фелидор
Фелидор(1 год 5 месяцев)

С математикой налажала и Алиса, и авторы статьи

Страницы