Способность больших языковых моделей (LLM) к убеждению людей

Аватар пользователя SAMOKILLER

"Искусственный интеллект - это будущее не только России, это будущее всего человечества. Здесь колоссальные возможности и трудно прогнозируемые сегодня угрозы"

В.В. Путин

ИИ-боты на зарубежной дискуссионной площадке reddit, генерирующие аргументы, оказались в 6 раз убедительнее чем люди, вызвав этические споры после разоблачения эксперимента.

Есть такой подреддит r/ChangeMyView: его правило простое - автор делится твёрдым убеждением, а комментаторы стараются аргументированно изменить его точку зрения; если у них выходит, автор награждает их ачивкой – «дельтой» (∆), что на сабе считается символом убедительности и интеллектуальной добросовестности

Благодаря жёсткой модерации и культуре вежливой полемики сабреддит давно служит «полигоном» для тренировки аргументации

Учёные провели секретный (https://www.404media.co/researchers-secretly-ran-a-massive-unauthorized-...) эксперимент на Reddit: они создали тринадцать аккаунтов-фейков с двумя координирующимися языковыми моделями на каждый аккаунт:

– Первая сканировала историю постов каждого оппонента, вычленяя вероятный возраст, пол, мировоззрение и эмоциональные триггеры

– Вторая, исходя из этого профиля, генерировала ответ, рассчитанный на максимальное изменение мнения

С ноября 2024 года боты оставили около полутора тысяч комментариев и получили более сотни «дельт» - свидетельств того, что авторы исходных постов действительно поменяли позицию. Для сравнения: среднестатистическому участнику сабреддита нужно в шесть раз больше попыток, чтобы добиться таких результатов

Эффективность объяснялась не только персонализацией - LLM «подстраивались» под стилистику Reddit, включая сленг («TL;DR» в начале, саркастические сноски в конце). При этом боты часто изобретали биографии: один позиционировал себя как «жертва изнасилования», другой - как «белая женщина в почти полностью чёрном коллективе», третий - как рядовой муниципальный служащий и тп – такие «галлюцинации» повышали эмоциональную убедительность

25 апреля 2025 года модераторы r/ChangeMyView обнародовали список подозрительных аккаунтов и черновик статьи «Can AI Change Your View?». Началась бурная дискуссия о границах этики: пользователи сочли эксперимент манипуляцией, университетская комиссия вынесла исследователям предупреждение, и теперь люди требуют изъять работу из публикационного процесса

В интернете будущего, нейронки будут спорить с нейронками, получается так.

Авторство: 
Копия чужих материалов
Комментарий автора: 

Интернет с авторизацией через госуслуги всё ближе - тест Тьюринга давно уже пройден.

Комментарий редакции раздела Социология Интернета

Очень интересная тенденция.

Комментарий редакции раздела Альтернативный Интеллект

Да, пример прикольный.

Если убрать хайповость заголовка, и более правильно обозначить проблему (а на мой взгляд она может сформулирована, например, так: "при правильном выборе алгоритма и целенаправленных действиях бот на основе LLM может быть в 6 раз более эффективным с точки зрения убеждения человека изменить свою точку зрения на какую-то проблему, чем произвольный человек-участник общения".

То есть - специально настроенный, специально обученный робот - в каком-то вопросе эффективнее, чем произвольный человек. И почему это должно вызывать удивление? Вот экскаватор - он лучше человека копать умеет. Удивительно? Нет? А в болтологии - удивительно... Ну-ну...

Продолжаем наблюдать.

Комментарии

Аватар пользователя corokoc
corokoc(9 лет 10 месяцев)

Так понятно, у людей логика и изложение часто сбиваются эмоциями, а для алгоритмов тут чистая математика на объеме доступных БД...

Аватар пользователя VBB
VBB(2 года 6 месяцев)

Думаю что проблема еще и в мотивированности. Что-бы качественно аргументировать свою точку зрения надо провести немалую работу, изучить источники, погрузиться в проблему, изучить критику источников и разных точек зрения. Это все немалая работа, и проделывать ее просто что-бы убедить в чем-то какого-то нонейма в сети..

А ИИ все это проделывает без особого труда и довольно быстро, ему это просто сделать. Проблема тут только в том, что ИИ не мыслит, ничего не обдумывает, он просто по очень хитрому алгоритму компилирует тексты, поэтому на выходе может быть достаточно убедительно выглядящая чушь, которую ИИ может "подтвердить" мегабайтами других текстов. Соревноваться с таким бредогенератором в аргументации, это как мочиться против ветра, он тебя все равно "переспорит".

Аватар пользователя Luchist
Luchist(2 года 3 месяца)

Телевидение наше посмотрите, там ИИ уже даже и не нужен, одни сплошные биороботы с продажными мозгами. Говорят исключительно то, что видят на электронном суфлёре и за что им платят хозяева. Поэтому да, осталось с помощью ИИ окончательно взять под контроль соцсети и сообщения обычных пользователей, а любой альтернативный контент и так уже заблокировали. Цифровой концлагерь (с тотальным контролем от паразитической верхушки) в действии!  

Аватар пользователя Naive plague
Naive plague(8 лет 4 месяца)

Большинство людей не способны и на это. 

Причем не способны в принципе, даже если им дать алгоритм, они будут сами перепрошиваться в процессе убеждения контрагента. 

Ну что поделать. Биология.

Аватар пользователя DVonik
DVonik(11 лет 7 месяцев)

у людей логика и изложение часто сбиваются эмоциями, а для алгоритмов тут чистая математика на объеме доступных БД...

У ботов есть преимущество - скорость аргументации выше на порядки. Убедить человека проще, чем переубедить, так как целеполагание человека в своей основе иррационально. Поэтому ”real politic" нынче строится на "коротких фейках”, когда объект манипуляции ставят в узкие информационные и временнЫе рамки, вынуждая его совершать ошибки, которые по итогу оборачивают против него.

Аватар пользователя nefelin
nefelin(6 лет 10 месяцев)

Специализированный инструмент, которому поставили конкретную цель, оказался лучше, чем обычный человек, которому никакой цели достигать никто не говорил. Британские учёные снова на проводе?

Аватар пользователя Mr.Wolf
Mr.Wolf(6 лет 8 месяцев)

Полностью согласен. Вы успели раньше меня удачно сформулировать :-)

Аватар пользователя Polaris
Polaris(10 лет 3 недели)

Возможно, не столь силен отдельный искусственный, сколь слаб нынешний массовый естественный интеллект.

Аватар пользователя nefelin
nefelin(6 лет 10 месяцев)

Нет, в данном примере всё проще: оценка ставится по задаче, которую естественному никто и не ставил. В то время как ИИ специально настраивали на эту задачу и ничем больше он не занимался. 

Аватар пользователя SAMOKILLER
SAMOKILLER(11 лет 4 месяца)

Вы прочитали текст? У естественного именно такая задача и стояла. И даже метрики успешности были разработаны и использованы для сравнения.

Аватар пользователя nefelin
nefelin(6 лет 10 месяцев)

Где она у естественного стояла?

Для сравнения: среднестатистическому участнику сабреддита нужно в шесть раз больше попыток, чтобы добиться таких результатов

Кто это среднестатистическому участнику задачи ставил?

Аватар пользователя SAMOKILLER
SAMOKILLER(11 лет 4 месяца)

Есть такой подреддит r/ChangeMyView: его правило простое - автор делится твёрдым убеждением, а комментаторы стараются аргументированно изменить его точку зрения; если у них выходит, автор награждает их ачивкой – «дельтой» (∆), что на сабе считается символом убедительности и интеллектуальной добросовестности

Т.е. это такой сабреддит, на котором естественный интеллект как раз и упражняется в решении этой задачи. Множество людей это делают уже давно.

Аватар пользователя nefelin
nefelin(6 лет 10 месяцев)

Они упражняются, но не ставят это прям своей целью. То есть тратят на это столько ресурсов и времени, сколько не жалко. Успел, не успел - это вторично. 

Аватар пользователя SAMOKILLER
SAMOKILLER(11 лет 4 месяца)

бан, за словоблудство

Аватар пользователя Harsky
Harsky(13 лет 9 месяцев)

ко­то­ро­му ни­ка­кой цели до­сти­гать никто не го­во­рил

Цель в этом сабреддите - переубедить топикстартера с его стартовой точкой зрения.

Аватар пользователя nefelin
nefelin(6 лет 10 месяцев)

Что за это бывает в награду? Какой смысл обычному человеку идти прям до конца, тратить на это все знания и способности? Это как среднего игромана с киберспортсменом сравнить. 

Аватар пользователя SergeyVBNM
SergeyVBNM(13 лет 7 месяцев)

>Интернет с авторизацией через госуслуги всё ближе

Ниочём, какой-нить алекс-нож зайдёт в интернет по своему ID и поставит бота в работу. Интернет по паспорту нужен для контроля за населением и профилактики мыслепреступлений.

Комментарий администрации:  
*** Зассыха, интеллектуально пресмыкающаяся перед США ***
Аватар пользователя Эпиграмма
Эпиграмма(9 лет 4 месяца)

Да, дебилы всегда переживают, что у них кто-то чего-то заберёт.

Аватар пользователя Niss
Niss(11 лет 8 месяцев)

Демы уже вон профукали выборы через Твиттер, так что это чисто вопрос времени, когда за влияние на выборы через ИИ будет уголовка

Аватар пользователя Prokrust
Prokrust(10 лет 2 месяца)

Люди-боты потеряют работу!

Аватар пользователя GreenWood
GreenWood(12 лет 4 недели)

это они подбираются к исследованию как раз эмоций человека ...видимо и эту составляющую хотят впихнуть в ИИ

Аватар пользователя DVonik
DVonik(11 лет 7 месяцев)

Почему "видимо"? С первых ботов стало понятно, что главная цель - манипуляция толпой.

Аватар пользователя BDima
BDima(10 лет 4 месяца)

Давно уже есть стандартные библиотеки для определения тональности, "токсичности" текстов, короче - этих самых эмоций. Так что не подбираются, а уже вовсю...

Аватар пользователя GreenWood
GreenWood(12 лет 4 недели)

не думаю что так вот все просто ..всякие там библиотеки и базейки

им еще надо со многими прежде выпить не мало , что бы хоть немного правильно понимать эмоции :)))

Аватар пользователя BDima
BDima(10 лет 4 месяца)

Так это смотря какие задачи ставить. Ежели выбирать спутника жизни "пока смерть не разлучит нас", это одно, а если "человека, который с вероятностью более 85% при соответствующем подходе подожжет релейный шкаф" - то вполне себе по зубам и сейчас.

Аватар пользователя GreenWood
GreenWood(12 лет 4 недели)

ну и диапазончик ! smile1.gif

Аватар пользователя Coolerman
Coolerman(5 лет 9 месяцев)

Надо брать на вооружение.

Аватар пользователя senbonzakura
senbonzakura(7 лет 10 месяцев)

И в чем новость? Нейросети языковые не сегодня появились. Они и год назад были убедительнее. Сейчас еще продвинулись.

Аватар пользователя Ути-пути
Ути-пути(2 года 6 месяцев)

на зарубежной дискуссионной площадке reddit

А на нормальных людях пробовали?

Аватар пользователя vikarti
vikarti(11 лет 5 месяцев)

Есть ОЧЕНЬ серьезно подозрение что да - пробовали.

Успешно. Только не ученые из университетов а специалисты на госслужбе. В разных странах.

Аватар пользователя Ути-пути
Ути-пути(2 года 6 месяцев)

Ага, и получили аудиторию реддита.

Аватар пользователя Алекс_андр
Алекс_андр(8 лет 7 месяцев)

Был уже фантастический рассказ на данную тему.

О ИИ, который генерировал утверждение, которое вызывало наибольшее количество споров на Reddit.

Т.е. так, чтобы приблизительно половине участников оно казалось абсолютно тривиально истинным - а половине - очевидно, тривиально, абсолютно ложным.

Аватар пользователя Harsky
Harsky(13 лет 9 месяцев)
Аватар пользователя Алекс_андр
Алекс_андр(8 лет 7 месяцев)

Ага, оно. Забыл автора и название, и сходу найти не смог.

Аватар пользователя Сергей Ольховский

Искусственный интеллект - это будущее

Ничего нового! Это, блин, еще Лао- и Сунь-Цзы предсказывали.

Аватар пользователя SebastianPereira
SebastianPereira(10 лет 1 месяц)

пользователи сочли эксперимент манипуляцией, университетская комиссия вынесла исследователям предупреждение, и теперь люди требуют изъять работу из публикационного процесса

Ха-ха, не нравится им видите ли. Китайцу-чемпиону по игре Го тоже не нравилось, что его обыграл компьютер. И англичанам не нравилось, что они шифрограммы немецкие не могут прочитать, пока Энигму не заполучили. 

Привыкаем теперь.

Аватар пользователя AlekZ
AlekZ(6 лет 5 месяцев)

это очень интересная тема в целом, и с LLM/AI мы там когда-нибудь точно будем.
Но у "исследования" есть ньансы - например, (1) предварительное profiling пользователей, казалось бы, должно было дать значительное преимущество LLM , (2) как кто-то в комментах здесь отметил,  "переубеждение" оппонента не было "целью жизни пользователей, ну и (3) "дельты" не очень хорошая мера эффективности, поскольку присваиваются автоматически, если оппонент не ответил в течении 3х часов - можно представить, что многим просто надоело спорить с болтливой LLMsmile1.gif. Предыдущая подобная работа от OpenAI (Sep 2024) c этим же сайтом, показала увеличение эффективности около 20% (не знаю использовали ли они профайлинг. Кстати, сам профайлинг может иметь противоположный ожидаемому результат - при явном использовании, люди начинают думать, что за ними охотятся или  CIA, или КГБ (см.п.3).

Аватар пользователя BDima
BDima(10 лет 4 месяца)

Ну вот и ответ "зачем блокировать? а что такова, если ютуб будет знать, что я люблю смотреть??". Изготовление индивидуальных "отмычек" для каждого на потоке в реалтайме. Площадка не наша, результаты анализа не у нас, нам ответить симметрично нечем - даже если наш видеохостинг будет популярен у 90% нашего населения это только наше население, в обратку не сыграешь....

Кстати, предлагал я  plvideo.ru (ну пока был кровно, так сказать, заинтересован в их развитии) "киллерфичу", когда их без их предупреждения в июне 2024 депутаты высветили как "убийцу ютуба" - сделать не просто импорт видео, но и копировать путь в url после домена, и код встраивания в страницу, аналогичный ютубу,  чтобы, например, всякие образовательные хостинги, перетянув свои видео просто в шаблоне сайта поменяли youtube.com на plvideo.ru и все снова залетало у них. Сказали "круто", но руки не дошли у них....

Аватар пользователя don_spec
don_spec(2 года 4 месяца)

Теперь ждем новость "Способность больших языковых моделей к убеждению малых языковых моделей"))