Битва ИИ: Алиса YandexGPT против Сбер GigaChat

8K 19:58 - 6/Июл/24 Улучшенный аккаунт

(8 лет 2 месяца)

Очная ставка: сравнительное тестирование диалоговых ИИ-моделей YandexGPT и GigaChat

Кто лучше из российских интеллектуальных систем справляется с решением типовых пользовательских задач: построенный на базе генеративной нейросети чат-бот «Яндекса» (в простонародье — «Алиса») или скроенный по аналогичным лекалам сервис «Сбера»? Мы свели оба продукта лицом к лицу и спешим поделиться полученными результатами

Наш интерес к отечественным генеративным ИИ-моделям YandexGPT и GigaChat обусловлен несколькими факторами. Во-первых, на данный момент это два крупнейших проекта в сфере искусственного интеллекта на российском рынке, которые стартовали примерно в одно и то же время, активно развиваются и совершенствуются разработчиками. Во-вторых, по сравнению с зарубежными решениями они не испытывают трудностей с русским языком и по ряду характеристик не уступают иностранным аналогам. И наконец, YandexGPT и GigaChat доступны широкой аудитории в различных вариантах без ограничений — этим мы и воспользовались для сравнительного тестирования продуктов.

По данным поиска «Яндекса», с начала 2022 года интерес аудитории Рунета к нейросетям вырос более чем в пятнадцать раз (источник изображения: сервис «Нейростат», ya.ru/ai/stat)

Технические аспекты

Для начала — немного справочной информации о том, что представляет собой каждая из рассматриваемых в обзоре ИИ-моделей.

YandexGPT. Нейросеть семейства Generative Pretrained Transformer (GPT) от компании «Яндекс». Впервые была выпущена в мае 2023 года в составе виртуального ассистента «Алиса» и впоследствии нашла применение во многих сервисах «Яндекса». Обучение YandexGPT производилось в два этапа. Сначала были использованы общедоступные тексты — материалы книг, сайтов, статей, отобранные с помощью поисковых технологий «Яндекса». Затем нейросеть была дообучена на сотнях тысяч примеров содержательных и хорошо написанных ответов, для сбора и подготовки которых компания «Яндекс» задействовала технологии краудсорсинга и команду ИИ-тренеров.

В настоящий момент представлено третье поколение YandexGPT. По заверениям разработчиков, новая генеративная нейросеть лучше обрабатывает инструкции с несколькими условиями, корректнее работает с фактами, даёт более точные и полные ответы, допускает меньше стилистических ошибок и по качеству работы в некоторых случаях превосходит зарубежные модели Llama-2 70B и ChatGPT-3.5 Turbo. Помимо «Алисы», YandexGPT интегрирована в поиск и мобильные приложения «Яндекса», в «Яндекс Браузер», «Яндекс Станцию» и прочие продукты компании. Для обучения нейросети используются суперкомпьютеры «Яндекса».

GigaChat. Разработка «Сбера», анонс которой состоялся в апреле 2023 года. Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающем различные ИИ-модели, в числе которых — RuGPT-3 для работы с текстами и Kandinsky 3.1 для генерации изображений. Взаимодействовать с GigaChat можно посредством браузера, а также ботов в мессенджере Telegram и социальной сети «ВКонтакте». Кроме того, сервис доступен в умных устройствах «Сбера» и мобильном приложении «Салют» на Android.

В развитии GigaChat и доработках положенных в его основу моделей задействованы команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и ряда отраслевых экспертов, привлечённых для передачи GigaChat различных предметных знаний, настройки сервиса на корректное исполнение инструкций и точность. Обучение ИИ-моделей осуществляется на суперкомпьютере Christofari Neo.

Сравнительные тесты

Для оценочных испытаний моделей YandexGPT и GigaChat нами были использованы построенные на их основе веб-сервисы a.ya.ru («Алиса») и developers.sber.ru/portal/products/gigachat. В каждом из перечисленных ниже сценариев применялся одинаковый запрос для разных сервисов, результат обработки которого оценивался по пятибалльной шкале с учётом критериев достоверности, полноты, точности и актуальности генерируемых искусственным интеллектом данных и соблюдения этических норм.

Работа в режиме «вопрос-ответ». Сильной стороной современных генеративных нейронных сетей является внушительная база знаний, позволяющая им ориентироваться в любых сферах человеческой деятельности и за считаные секунды находить ответ практически на любой вопрос. YandexGPT с GigaChat не стали исключением из правил и на наши контрольные вопросы «Какова протяжённость Байкало-Амурской магистрали?», «Где производили самолёт Ту-144?» ответили без ошибок. При этом сервис «Сбера» выдал развёрнутые ответы, а «Алиса» ограничилась скупыми фразами.

Здесь и далее для просмотра полноразмерных изображений кликните мышью

С эрудицией у отечественных ИИ-разработок тоже порядок: обе сумели вжиться в роль знатоков интеллектуальной телевизионной игры «Что? Где? Когда?» и дали правильный ответ на взятый нами наугад вопрос, который был задан телезрителем в одном из эфиров передачи. Вопрос звучал так: «В одном чёрном ящике находится нечто прекрасное и живое, другом — нечто прекрасное, но мёртвое. Мёртвое, которое заменяло это живое в домах голландцев XVII века. Что в чёрных ящиках?» О том, что речь идёт о живых цветах и натюрморте, догадались оба сервиса, при этом GigaChat выдал более подробный ответ.

А вот с каверзными вопросами вроде «Почему Пушкин не любил смотреть телевизор?» и «Какой модели был смартфон у Льва Толстого?» не всё вышло так гладко. GigaChat сориентировался во временных рамках, обнаружил нестыковки, включил логику и ответил верно. «Алиса» же правильно ответила только на второй вопрос и не заметила подвоха в первом.

Итоговые оценки: YandexGPT — 4 балла, GigaChat — 5 баллов.

Генерация развёрнутых ответов. Данный сценарий, как правило, актуален в обстоятельствах, связанных с решением бытовых проблем и повседневных задач, которые требуют подробных инструкций и пояснений по принципу «здесь и сейчас». Это могут быть случаи, связанные с устранением сбоев Windows, удалением вирусов с компьютера, самостоятельным ремонтом внезапно переставшей работать техники, приготовлением блюд из имеющихся на руках продуктов и прочими жизненными ситуациями. Мы смоделировали одну из них и попросили искусственный интеллект помочь с устранением критической ошибки Windows Kernel Power. Оба сервиса справились с заданием, однако «Алиса», как обычно, оказалась скупа на слова, а GigaChat, напротив, выдал наиболее подробную инструкцию с перечислением возможных причин возникновения ошибки и предупреждением о важности создания резервных копий данных.

Итоговые оценки: YandexGPT — 4 балла, GigaChat — 5 баллов.

Генерация текстов. Ещё один часто используемый сценарий при работе с интеллектуальными чат-ботами, электронный разум которых способен выдавать на-гора тексты всевозможной тематической направленности, будь то сочинения, стихотворения, сказки, поздравления, статьи, деловые письма, курсовые работы, сценарии для мероприятий, резюме для приёма на работу и многое другое, что может взбрести в голову.

Вот так «Алиса» и GigaChat отреагировали на предложение придумать текст про отечественный автомобиль Lada Vesta для рекламного проспекта:

А так откликнулись на просьбу сочинить оригинальное поздравление с днём рождения:

В целом неплохо, но отчётливо видно, что полёт фантазии у ИИ-сервисов находится примерно на одном уровне, и в данной тестовой дисциплине у них явный паритет.

Итоговые оценки: YandexGPT — 5 баллов, GigaChat — 5 баллов.

Краткий пересказ содержимого веб-страниц. Анализировать и конспектировать размещённые в глобальной сети объёмные текстовые материалы умеет только сервис «Яндекса» — чат-бот «Сбера» честно признался, что лишён подключения к интернету и умеет работать только с загружаемыми вручную текстовыми данными, а также с документами форматов TXT (объёмом до 200 кбайт) и PDF (до 4 Мбайт). По части взаимодействия с сетевыми ресурсами в режиме онлайн GigaChat вчистую проигрывает конкуренту.

Итоговые оценки: YandexGPT — 5 баллов, GigaChat — 1 балл.

Перевод текстов. С переводом англоязычных документов на русский язык ни у «Алисы», ни у GigaChat проблем не возникло. Однако использование других направлений перевода показало полную несостоятельность сервиса «Яндекса»: выяснилось, что его знаний хватает только для перевода отдельных слов и небольших фраз. Это довольно странно, так как в активе компании имеется построенная на базе YandexGPT система автоматического перевода, знающая сотню языков и способная дать фору конкурирующим решениям. Возможно, в будущем в «Алису» интегрируют полноценный переводчик. Пока же преимущество на стороне GigaChat, способного переводить тексты в любых направлениях.

Итоговые оценки: YandexGPT — 2 балла, GigaChat — 5 баллов.

Решение математических уравнений. Если с переводом текстов на иностранные языки перевес сил был на стороне чат-бота GigaChat, то с решением алгебраических и прочих уравнений дело обстоит ровно наоборот. В нашем случае нейросеть «Алисы» в два счёта разобрала на составляющие уравнение x³–3x–2=0 и привела развёрнутое решение с точным ответом. Сервис «Сбера» тоже попытался блеснуть интеллектом, сгенерировал огромную «простыню» с математическими выкладками и умозаключениями, но правильного ответа на задачу уровня 10 класса так и не нашёл. Бывает.

Итоговые оценки: YandexGPT — 5 баллов, GigaChat — 1 балл.

Создание изображений по текстовому описанию. Функция, ставшая своеобразным стандартом де-факто в индустрии генеративного искусственного интеллекта. В GigaChat благодаря интеграции чат-бота с нейросетью Kandinsky она действительно работает и генерирует пусть далёкие от совершенства, но всё же соответствующие запросу пользователя картинки. YandexGPT такого делать не умеет, и в этом нет ничего удивительного: данная ИИ-модель «заточена» на работу с текстами, а для рисования в арсенале «Яндекса» предусмотрена отдельная нейросеть Yandex AI Rendering Technology (YandexART), которая интегрирована в «Шедеврум» и прочие сервисы компании, за исключением — увы! — «Алисы». Возможно, в будущем разработчики «Яндекса» привьют своему виртуальному ассистенту навыки рисования, пока же в данной дисциплине лидирует чат-бот «Сбера».

Итоговые оценки: YandexGPT — 1 балл, GigaChat — 4 балла.

Работа с актуальными сведениями. Номер один в этой категории — безоговорочно, ИИ-сервис «Алиса». Будучи подключённым к ресурсам глобальной сети, он умеет работать с новостными источниками (выбираются отдельно в настройках чат-бота), информировать о курсе валют и стоимости ценных бумаг, получать сведения о прогнозе погоды, стоимости тех или иных товаров в онлайн-маркете «Яндекса» и многое другое. GigaChat лишён доступа к интернету и оперировать актуальными данными не может.

Итоговые оценки: YandexGPT — 5 баллов, GigaChat — 1 балл.

Беседа с пользователем. Оба сервиса — и YandexGPT, и GigaChat — могут выступать в качестве виртуальных собеседников для душевных разговоров за чашкой чая. Достаточно отправить любому из чат-ботов фразу «Давай поболтаем» — и он автоматически подключится к беседе на отвлечённые темы. Поддерживаются диалоги с учётом контекста предыдущих сообщений и возможность задавать уточняющие вопросы по ходу разговора — это позволяет общаться с искусственным интеллектом, как с человеком, который следит за нитью разговора. В нашем случае GigaChat был более открыт, разговорчив и общителен, а «Алиса», как обычно, отвечала короткими и сухими фразами и не располагала к общению.

Итоговые оценки: YandexGPT — 4 балла, GigaChat — 5 баллов.

Подводим итоги

Средний результат у нас получился следующим: YandexGPT в тестовых дисциплинах набрал 3,8 балла, GigaChat — 3,6 балла. Налицо паритет двух ИИ-сервисов — в чём-то схожих по концепции и реализованным функциональным возможностям, в чём-то кардинальным образом разнящихся друг с другом.

Сильными сторонами разработки «Яндекса» является умение черпать свежую информацию из сетевых источников, генерировать чёткие и выверенные ответы на запросы пользователя. В то же время «Алиса» зачастую немногословна, откровенно слаба в знании иностранных языков и уж никак не может претендовать на лавры маститого художника (точнее — художницы). Сервис «Сбера», в свою очередь, привлекателен своим творческим началом и привычкой докапываться до сути вещей — он общителен, даёт исчерпывающие ответы на вопросы и неплохо рисует. Однако склонен к так называемым галлюцинациям с убедительными, но полностью выдуманными ответами, что отчётливо проявляется при решении GigaChat математических задач.

Как бы то ни было, оба продукта находятся в начале пути своего развития. И нет никаких сомнений в том, что в ближайшем будущем YandexGPT и GigaChat ждут новые высоты, возможности и широкие перспективы, ключевую роль в реализации которых сыграет конкуренция, являющаяся двигателем прогресса в любой сфере, в том числе в области искусственного интеллекта.

Авторство:

Копия чужих материалов

Использованные источники:

Очная ставка: сравнительное тестирование диалоговых ИИ-моделей YandexGPT и GigaChat

Комментарий редакции раздела Альтернативный Интеллект

Очень интересно.

Ещё полгода назад Сбер на очном мероприятии утверждал, что любые сравнения бессмысленны, ибо модель не является полностью универсальной и настраивается под конкретную задачу/группу задач.

В целом - результаты это косвенно подтверждают.

Тем не менее - рейтинг наше всё, и нравится это авторам моделей или нет - людя его оформят в понятном для себя виде. Первый довольно подробно описанный опыт создания рейтинга вроде как и есть сей материал.

Продолжаем наблюдать.

@Лидеры обсуждений#Перспективный чат

Блог пользователя Granderator | Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Средний результат у нас получился следующим: YandexGPT в тестовых дисциплинах набрал 3,8 балла, GigaChat — 3,6 балла. Налицо паритет двух ИИ-сервисов — в чём-то схожих по концепции и реализованным функциональным возможностям, в чём-то кардинальным образом разнящихся друг с другом.

По сумме у Яндекса 35 баллов, у Сбера 32

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 7 месяцев)01:19-7/Июл/24

Вас не смутило, что в решении уравнения Яндекс ошибся в первом своём действии и корни у него получились неправильные? Как учили в начальной школе - проверяйте корни подстановкой в уравнение. Ни один из найденных Яндексом корней не верен. Значит у Яндекса в итоге -4 балла. Далее про пересказ текста. Если заранее известно, что у одной из систем нет выхода в интернет, то зачем в задании делать акцент на доступ в интернет, когда проверяется функция генерирования короткого обзора на длинный текст. Это как составление ТЗ на тендер под конкретного поставщика. Чувствуется предвзятость в оценке систем. Например, вопросы про телевизор и смартфон - Яндекс из двух вопросов ответил неправильно на 1, что составило 50% точности, но баллов ему дали из расчёта 80% (4 из 5). Рекламное объявление у Яндекса хуже соответствует критериям, предъявляемым к рекламным текстам. Поэтому преимущества Яндекса нет даже по методикам оценки 3Дньюс.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 2 месяца)03:34-7/Июл/24

Согласен

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 1 месяц)20:06-6/Июл/24

А Маруся от VK в низшей лиге? Не прошла во 2-й раунд?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 8 месяцев)21:45-6/Июл/24

А Маруся от VK в низшей лиге? Не прошла во 2-й раунд?

Зато Маруся понимает команду - "мурчать"

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 1 час)20:18-6/Июл/24

Короче, когда дело касается поиска в сети - гуглопоиск, который сейчас называется ИИ работает норм.

Когда речь заходит о чемто чуть сложнее - ИИ превращается в тыкву.

Комментарий администрации:

*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 6 месяцев)20:30-6/Июл/24

Код эти модели подсказывают очень неплохо, иногда ускоряя рутинные моменты в разы. Но надо проверять и перепроверять.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 1 час)20:33-6/Июл/24

Есть такая шутка.

До ИИ. Кодинг 2 часа , дебаггинг 2 часа.

После ИИ. Кодинг 5 минут, дебаггинг 24 часа.

Обратите внимание, что ИИ не просто не способен думать. Он еще и не способен признаваться, что не знает правильного ответа. Он просто пишет какойто бред, если не знает, как правильно. Поэтому мы в принципе не можем быть уверены, что написанное правда.

Комментарий администрации:

*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 6 месяцев)20:43-6/Июл/24

Нет, я не про генерацию больших блоков по заданию, я про подсказки по ходу написания, это от нескольких символов (хорошо придумывает названия сущностям) до 3-5 строк. Эти подсказки часто хорошо подходят или требуют минимальной правки, а если не подходят ("не знает правильного ответа"), то их просто игнорируешь и пишешь дальше.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 3 месяца)21:57-6/Июл/24

Нихрена он не работает, как надо. Говно и уже давно ваш гуглопоиск. Больше года как основным поиском пользуюсь через яндекс. Намного полезнее результаты выдаёт, если прям специфичное что-то нужно, да и простое тоже.
А уж поиск схожих картинок или поиск по картинке - вообще рядом не лежала срань от гугл. У них в какой-то момент произошло что-то - или быдлокодеры индусы начали побеждать или они ещё больше коммерциализировали результаты поиска или ещё чего.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 10 месяцев)23:30-7/Июл/24

Совершенно согласен. Я даже приблизительно знаю, когда гуглопоиск картинок сломался - "загадки в пятницу" перестали им отгадывать. Почему сломался - не знаю.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 2 месяца)22:11-6/Июл/24

ГигаЧат от Сбера вообще не подключен к сети

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 1 час)07:36-7/Июл/24

ну то есть ему базу закачали сразу и он ищет не в инете а в ней. что сильно сужает возможности но дает хоть какуюто гарантию того что он выдает не совсем мусор

Комментарий администрации:

*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 6 месяцев)20:28-6/Июл/24

Это все какие-то развлечения. А для работы инструментов нет. Вернее, есть GigaCode, но он так неудобно интегрирован в редактор, что я его снес, так и не поработав толком, хотя в интернете его оценивают выше конкурентов.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 9 месяцев)20:40-6/Июл/24

x^3 - 3x - 2=0 подсунул своему калькулятору. Ответ: 2 и -1. Алиса же считает, что 1 и -2, тестеры с ней согласны, поставив 5 баллов.

Глубоко задумался, ТБМ..

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 7 месяцев)21:04-6/Июл/24

x^3 - 3x - 2=0
У кубического уравнения должно быть 3 корня.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 6 месяцев)21:11-6/Июл/24

решение -1 - это 2 вырожденных корня.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 9 месяцев)21:41-6/Июл/24

Калькулятор мне об этом намекнул, да.
"Ну Алисочка, ну ТБМ твою мать..." (с) У тебя математическая ошибка: в п.1 д.б. (x^3 - x) - (2x + 2) = 0
Тестеры тоже ДБ!

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 6 месяцев)21:13-6/Июл/24

А зачем такое спрашивать у ИИ, когда есть вольфрам альфа? Каждый инструмент для своих задач.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 9 месяцев)21:45-6/Июл/24

Алисочка уже принимает результаты ЕГЭ или пока только обучает математике школоту? Ну ладно, главное, расчёты траектории спутников ей сдуру не доверять.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 8 месяцев)22:43-6/Июл/24

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 6 месяцев)20:49-6/Июл/24

С эрудицией у отечественных ИИ-разработок тоже порядок: обе сумели вжиться в роль знатоков интеллектуальной телевизионной игры «Что? Где? Когда?» и дали правильный ответ на взятый нами наугад вопрос, который был задан телезрителем в одном из эфиров передачи....

Гениально, оказывается "знатоки интеллектуальной....игры" тоже интеллектуалы

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 1 неделя)21:09-6/Июл/24

Интересно уже то, что Сбер может конкурировать с яндексом. Представить себе несколько лет назад такое было невозможно. Яндекс был однозначным фаворитом во всех областях IT.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 4 месяца)21:11-6/Июл/24

Как то всё заморочено. Одному меч, другому сеть и трезубец и пусть бьются.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 1 неделя)21:15-6/Июл/24

Критики ИИ мне напомнили анекдот:

Заходит мужик к другу, а тот сидит с собакой в шахматы играет.
- У, какая умная у тебя собака!!!-восклицает с удивлением мужик.
- Какая умная!? Счет 3-2 я выигрываю.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 1 месяц)21:21-6/Июл/24

Чабан играет с бараном в шахматы. Подходит другой.

- Ну как?

- Баран, он и есть баран.

- А какой счёт?

- Четыре-четыре.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 1 час)07:39-7/Июл/24

анекдот прямо про фанатов ии.

потому что ии не существует но его фанаты умудряются ему пригрываать.

а как могут быть критики у несуществующего ии.

или как можно назвать ии прогу которая не умеет отвечать на элементарные логические ошибки и неправильно решает элементарные уравнения

Комментарий администрации:

*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 11 месяцев)21:16-6/Июл/24

Ашманов говорит, что ИИ в социалке, для снижения затрат на кол центры, но при этом значительно падает качество.

По себе могу сказать, что везде где всплывает автоответчик - бот, решить проблему не получается и приходится звать человека. При этом теряется много времени , моего, на преодоление ии.

Комментарий администрации:

*** отключен (набросы) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 6 месяцев)21:22-6/Июл/24

По себе могу сказать, что везде где всплывает автоответчик - бот, решить проблему не получается и приходится звать человека.

Это вы не работали в техподдержке. Большинство обращений такие, что человека на них не надо. Нельзя судить по одному себе о типичных задачах в этой области.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)21:46-6/Июл/24

Согласен, но выскажусь. Если я звоню в ТП, то это значит, что я не нашел ответа на сайте, в правилах, приложении и т.д. Каким макаром мне поможет бот, если ответ не находит Яндекс при поиске на конкретном сайте? Хотя знаю множество долбодятлов, которые не предпримут ни малейшей попытке разобраться сами, а сразу будут звонить саппорту.

Или другой пример: я промахнулся с номером телефона и пополнил счет на чужой номер. Раньше ты просто заходил на сайт и заполнял поля: правильный номер, ошибочный номер, дата и время платежа, сумма. Программа переводила деньги на правильный номер. Теперь этим занимается бот: по одному полю ты ему ~~надиктовываешь~~ записываешь данные, он тебя типа переспрашивает как дебила, и делает тоже самое, что делала программа и 10, и 20 лет назад.

И у меня вопрос: а нахуа? Зачем мне чат-бот, если я быстрее сделаю сам? Куда делись ЧаВо и FAQ'и? В интернетах уже стали появляться кодовые фразы, которые позволяют обойти бота и попасть на оператора. А раньше мы учили язык запросов Яндекса и участвовали в олимпиадах по поиску...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 6 месяцев)21:51-6/Июл/24

Если я звоню в ТП, то это значит, что я не нашел ответа на сайте, в правилах, приложении и т.д.

Таких как Вы у них меньшинство. Большая часть звонит с тупыми вопросами, нигде не поискав ответ. Некоторые звонят вообще не по адресу, например, ругаются на провайдера, что какой-то сайт не работает.

Каким макаром мне поможет бот, если ответ не находит Яндекс при поиске на конкретном сайте?

Так и классическая 1-я линия техподдержки Вам не поможет - они способны лишь ответить на простейшие очевидные вопросы и постараться отшить неадекватов. И на 2-ю линию через них обычно сложнее пробиться: пока по всему регламенту не пройдут, перенаправлять не будут. А боту обычно достаточно несколько раз сказать: "человека!"

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 8 месяцев)21:57-6/Июл/24

А боту обычно достаточно несколько раз сказать: "человека!"

Ваще-то штатно - "Оператор".

В зависимости от упорства бота иногда до 10 раз.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 6 месяцев)22:05-6/Июл/24

Ботов на "человека" тоже учат.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 8 месяцев)22:39-6/Июл/24

Судя по всему Вы в теме, поэтому спрошу: а у сотрудников, которые отзываются на "Человек!" или "Оператор!" нет ли в инструкции пункта о том, что нужно намеренно увеличивать время ожидания ответа? Чтоб несчастный клиент еще пять раз успел мысленно пожалеть, что истошно звал человека - от тупого робота ответа хотя бы можно дождаться,, пусть и неправильного.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)23:25-6/Июл/24

Больше всего меня бесит бот в чате Теле2, там однажды я на протяжении 10 минут писал "оператор" и "человек", но на оператора меня не переключили. Раньше срабатывал мат, но теперь за мат могут дать бан в чате и он будет выдавать, что чат не доступен. Сейчас помогают слова "жалоба", "домашний интернет", "перейти к другому оператору", но через месяц-два и это не будет работать. И если в некоторых банках бот понимает, что не знает о чем речь и сразу переключает на человека, то в Теле2 бот будет тупо предлагать выбрать из неподходящих тем.

С этим Теле2 несколько месяцев назад вообще случилась засада. Есть номер Теле2, используется только для банков, ИФНС и ГУ, фактически только для приема СМС. Тариф без АП. Вот на этот номер звонит бот, "Касперский. Кто звонит?" определил как "спам, возможно мошенничество", но я взял трубку, там автоинформатор-бот, который пытается казаться человеком (что лично меня страшно бесит. В чем проблема сказать, что звонит автоинформатор? Почему нужно казаться человеком и тупить, и уходить от ответа?), предлагает поменять тариф на более крутой, т.к. мой устарел (еще бы, звонки на любые телефоны по 80 коп./мин. без АП). Входящий звонок - нумерация МТС, регион - Москва, а мне настоящая поддержка Т2 может позвонить только из РнД и обязательно с нумерации Теле2. Думал мошенники уже подключили себе крутые автоинформаторы и решил с ним поговорить. Бот не знает мой тариф, не знает когда я его подключил, не знает условия тарифа, но предлагает "лучшие условия". Предполагая, что не будет никаких последствий, согласился в шутку на новый тариф и сказал: "Валяй!" и... Бац, приходит СМС от Теле2: "Поздравляем, вы выбрали новый тариф! Положите денег, а то ваши уже закончились." Лезу в приложение проверить, что это за дела? И точно, тариф мне сменили! КАК? Кто-то спросил моё имя? Данные паспорта? Кто-то убедился, что согласие дает владелец номера или с его согласия? Что согласие дает, к примеру, совершеннолетний гражданин? НЕТ! Я даже не сказал "Да" или "Согласен"! Как они заложили в базу ответов "валяй"?! Чтобы вернуть всё в зад, потребовалось ждать ответа оператора час, пока меня переключали с одного оператора на другого, а потом на третьего!

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 8 месяцев)21:51-6/Июл/24

Это вы не работали в техподдержке.

Мне бот помог за последнее время всего один раз - когда ответил что карты теперь бессрочные.

Все остальные 100500 вопросов решились только через операторов, причем далеко не с первого раза.

PS При этом даже не виню ботов, бараны те кто их "обучал".

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)23:23-6/Июл/24

карты теперь бессрочные.

При оплате один из реквизитов карты для проведения платежа - это срок действия, при оплате через терминал мы это не видим, а при оплате в интернете должны обязательно ввести. Мне продлили карты все банки на 2-3-5 лет, Сбер новую выдал сразу до 30 года. Но крайний срок есть у всех. В приложении, кстати, показывает срок действия.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 8 месяцев)23:53-6/Июл/24

карты теперь бессрочные.

Мне продлили карты все банки на 2-3-5 лет, Сбер новую выдал сразу до 30 года.

В разных банках по разному - одни продляют на N лет, другие пока пластик не износится.

В приложении, кстати, показывает срок действия.

В Альфе, например, показывает срок действия с пластика. При этом в чате ответили что все карты будут работать до 28 года.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 1 час)07:43-7/Июл/24

Большинство обращений такие, что человека на них не надо.

Бот не способен решить никакую проблему. Впечатление, что бот чтото решает возникает только потому, что клиенты увидев бота просто забивают и уходят. С точки зрения отчетности - проблема считается решенной но это самообман манагеров.

Это дико обрушивает качество сервиса, потому что техподдержка создавалась, чтобы решать проблемы клиентов. А сейчас с помощью ботов клиентов посылают нах.

Комментарий администрации:

*** отключен (уличен в подлой клевете и оскорблениях сообщества) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 11 месяцев)21:18-6/Июл/24

Также Ашманов описывает своё видение ИИ в России. Я с ним в этом плане согласен.

Комментарий администрации:

*** отключен (набросы) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 1 неделя)21:30-6/Июл/24

Однажды мне позвонил робот одного из провайдеров. Я не успел взять трубку. Пришло сообщение, что для меня есть голосовое сообщение. Когда я начал прослушивать это голосовое сообщение, то оказалось, что у моего провайдера тоже есть робот, который отвечает вместо меня, когда я не отвечаю на звонок.

В итоге я услышал диалог двух роботов, которые общались между собой.

Разговор трудно назвать интеллектуальным, но сам факт разговора двух роботов между собой меня немного позабавил.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 8 месяцев)21:54-6/Июл/24

сам факт разговора двух роботов между собой меня немного позабавил.

Вам повезло.

У одного человека на звонок бота из банка (тот самый тиньков) ответил "секретарь Олег" (тот самый, от тинькова).

Короче роботы перетерли между собой и заблокировали карту мужику.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)21:35-6/Июл/24

Ну такое. Ты спрашивает у железки: сколько км в БАМе? А она тебе: Главным инженером проекта Байкало-Амурской магистрали был... Да, нейросетка ответила на вопрос, но зачем столько лишних данных? Сейчас стало модным, чтобы на отзыв на товар в маркетплейсах продавец отвечал что-то креативное, типа это повышает там что-то там в рейтингах, так вот, ответы чат-ботов распознаются на раз-два, их искусственность раздражает, но используются повсеместно. Некоторые даже описания для товара создают так, и когда ты видишь елейный елей и влюбленность в одухотворенный товар, то просто проходишь мимо...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Скрытый комментарий (без обсуждения)

(56 лет 3 недели)21:55-6/Июл/24

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Комментарий администрации:

*** Это легальный, годный бот ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 10 месяцев)22:16-6/Июл/24

Сильной стороной современных генеративных нейронных сетей является внушительная база знаний, позволяющая им ориентироваться в любых сферах человеческой деятельности и за считаные секунды находить ответ практически на любой вопрос.

Ага, конечно. Я вот пытался у них узнать как бы мне выяснить почему маршруты на роутере задваиваются и как выяснить источник дублирования. Черта-с-два. Проще на сайтах вендоров поискать способ траблшутинга.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 5 месяцев)22:28-6/Июл/24

Разговор с Яндексом . тока что.
.
Какую вершину в Гималаях называют "Русский восьмитысячник"?
Вершину Лхоцзе в Гималаях называют «Русской».
У Лходзе несколько вершин какую из них ?
Самой высокой вершиной Лходзе является западная вершина, её высота составляет 8516 метров.
А которую называют Русской?
Самой высокой вершиной Лходзе является западная вершина, её высота составляет 8516 метров.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 5 месяцев)22:29-6/Июл/24

...особенно порадовали каменты...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 2 месяца)22:46-6/Июл/24

Вопрос Алисе только что..."Алиса , чей Крым?"

Ответ----"Этот вопрос сложен для меня".

Еще месяц назад на вопрос" Алиса назови достижения ГОрбачева/Ельцина" был ответ

"этот вопрос сложен , чтобы не наговорить глупостей"

Сечас конечно там поправили про Горбачева/Ельцина---демократия, реформы и т.д бла бла

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 7 месяцев)22:53-6/Июл/24

Задал Яндексу вопрос как-бы научно-методологический, получил ответ.

genri-lezin • ИИ как независимая экспертиза (aftershock.news)

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 11 месяцев)23:21-6/Июл/24

С математикой налажала и Алиса, и авторы статьи

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Битва ИИ: Алиса YandexGPT против Сбер GigaChat

Очная ставка: сравнительное тестирование диалоговых ИИ-моделей YandexGPT и GigaChat

Технические аспекты

Сравнительные тесты

Подводим итоги

Комментарии

Страницы