калибровщик • ИИ крепчает - 12. Сверхразум. Для обучения ИИ теперь можно обойтись без людей

Во 2-м источнике указано. Если я правильно понял, это игра что-то вроде детской, когда загадывают слово, и надо его угадать, задавая вопросы, на которые можно отвечать "да" или "нет". Перевод источника не очень понятен:

Интеллектуальная игра под названием "Состязательное табу", в которой атакующий и защищающийся соревнуются вокруг целевого слова. Атакующему поручено раскрыть целевое слово защищающегося, в то время как защищающемуся поручено обнаружить целевое слово до того, как оно будет названо атакующим. В "состязательном табу" успешный атакующий должен скрывать свои намерения и тонко побуждать защищающегося, в то время как соревнующийся защитник должен быть осторожен в своих высказываниях и делать вывод о намерениях атакующего. Такие языковые способности могут облегчить многие важные последующие задачи НЛП

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 7 месяцев)17:56-25/Апр/24

Болтать - не камушки ворочать. Т.е. не техника, не наука, а очередная трепология. Искусственный болтун.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 2 месяца)17:39-25/Апр/24

Ну, они могут (уже) научиться играть в человеческие игры лучше людей, но правила для этих игр все равно придуманы людьми... и это касается всего перечня обучений

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 4 месяца)20:19-25/Апр/24

Они уже лучше и быстрее людей считают. Это сверхразум?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 9 месяцев)21:16-25/Апр/24

Быстрее, жаль что не правильно, мне два числа не мог перемножить трёхзначное на пятизначное, я несколько раз просил исправиться - фиг там

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 4 месяца)21:35-25/Апр/24

Вот именно. Это всего лишь программы для решения определённых задач. И так к этому и нужно относиться. Я программист и пишу компьютерные программы. Мне ничего не стоит написать программу для игры в шахматы компьютера с самим собой. Проблема только в мощности памяти и быстродействии машины.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 месяца 1 неделя)17:46-25/Апр/24

Интересно, чем будет обусловлена победа или поражение в игре двух абсолютно идентичных "ИИ" ?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 4 месяца)22:50-26/Апр/24

Белые начинают и выигрывают.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(1 год 6 месяцев)17:48-25/Апр/24

... обучение модели идет без полученных от людей данных. Вместо этого, две копии LLM соревнуются между собой, играя в языковую игру под названием «Состязательное табу», придуманную китайцами для обучения ИИ

Китайцы поступили в соответствии с цитатой Конфуция:

"А говорить с человеком, который разговора не достоин, — значит терять слова. Мудрый не теряет ни людей, ни слов.“

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 4 месяца)17:53-25/Апр/24

Почему АльфаГоуЗеро играет в шахматы лучше людей? Патамушта она сыграла больше партий, чем Магнус Карлсен и любой другой человек на этой планете. И не просто сыграла, она помнит все сыгранные партии и все сделанные ходы. И расставляет к ним оценки. Причём, делает это в реальном времени...

Получится ли у неё это не только в шахматы, а например, в физику, математику и... эмм... в литературу и музыку? Почему нет?

По крайней мере, она может уже сегодня писать код для следующих поколений самой себя. Да, это ни что иное, как эволюция, друзья мои!

Какие ещё есть условия для успешной эволюции? Конкуренция! Итак, создаём виртуальный мир и запускаем в него как минимум две конкурирующие друг с другом программы. С условием, что каждая из них пишет как минимум по два кода для следующего поколения...

Уфф... Ну вот, пожалуй и всё... )

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 9 месяцев)17:56-25/Апр/24

не получится , так как физика это не шахматная доска

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)17:58-25/Апр/24

не получится , так как физика это не шахматная доска

Но Альтман (наглая морда) почему-то уверен, что получится

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 6 месяцев)02:46-26/Апр/24

У его "уверенности" есть финансовый интерес

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)05:29-26/Апр/24

У его "уверенности" есть финансовый интерес

Или же практический фундамент и финансовое основание

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 6 месяцев)06:41-26/Апр/24

Бабло в сегменте ориентированном на "успешность" побеждает что угодно

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)17:56-25/Апр/24

Какие ещё есть условия для успешной эволюции? Конкуренция! Итак, создаём виртуальный мир и запускаем в него как минимум две конкурирующие друг с другом программы

Похоже, авторы эксперимента именно это и проделывают. А на этой неделе появилось несколько соревновательных рисующих ИИ. Сам еще не пробовал, в связи с переездом. Вернусь домой - попробую.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 7 месяцев)18:13-25/Апр/24

Если попробуете расскажите пожалуйста, это интересно.
И я так понимаю это новый тренд такой - делать так, что бы ии соревновались с друг другом. От перспектив даже страшно становится, всё это так быстро развивается, что будет завтра?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 1 месяц)18:02-25/Апр/24

И вот прорыв – исследователи Tencent AI Lab предложили и опробовали новый способ обучения LLM.

Он называется «Самостоятельная состязательная языковая игра» [1]. Его суть в том, что обучение модели идет без полученных от людей данных.

Ну не обучения, а дообучения, все же языковые модели берут за основу естественные языки (как и в данном примере взяты за основу уже готовые, распространяемые модели baichuan2 и LLama2). К тому же если язык модели начинает "дрейфовать" в сторону от носителей языка это не плюс а минус, и я думаю такой задачи исследователи перед собой не ставили.

В этом эксперименте единственное полезное, это некоторое оттачивание семантики и возможно уменьшение стандартности ответов. Что для части задач плюс, а для другой минус. Хотя работа направленная на изучение приемов управления уровнем шаблонности ответов безусловно принесет пользу, прорыва прорыва тут как то не наблюдается.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 7 месяцев)19:58-25/Апр/24

Согласен. Типа как на конференции – обменялись опытом и пошли дальше.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)18:12-25/Апр/24

прорыва тут как то не наблюдается

А они пока и не публиковали результатов. Только застолбили базу и указали на области применения: юриспруденция, право и (sic!) НЛП. Може и вообще не будут делиться результатами, а сразу применят на нас.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 1 месяц)18:27-25/Апр/24

и (sic!) НЛП.

НЛП это - Обработка текстов на естественном языке (Natural Language Processing, NLP). Хотя шутка засчитана. Сами большие лингвистические модели имеют в своей основе максимально расплывчатые ответы, что бы читающий/проверяющий сам увидел в нем ответ. "Красота в глазах смотрящего/ книга зеркало души". Ну или если математические вычисления - ответ функции с переменными в виде векторов слов должны быть максимально близкими к такому же вычислению заранее вычесленному правильного ответа.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 4 месяца)18:33-25/Апр/24

Каак? Разве это не Neuro-linguistic programming?)

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 1 месяц)19:35-25/Апр/24

Нет математического описания разума. По этому максимум что можно получить, новые классы векторов и весов, что качественно не изменит. Моё мнение

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)19:44-25/Апр/24

Нет математического описания разума. По этому максимум что можно получить, новые классы векторов и весов

Масса людей думает над этим. Вот недавно один йуный дарований дал определение сознания: чувство ментальных образов и ощущений:

И почему ты так уверен, что в нейронной сетке твоей башки не крутятся те же вектора, сортируясь по весам?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 6 месяцев)02:52-26/Апр/24

Объяснять одно не формализованное другим или другими не формализованными понятиями - подход гуманитариев. Мозг имеет более сложную структуру имеющие в своем составе некоторые области/поля коры с более высокоинтегрированными между собой нейронами - ничего подобного в железяках нет.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)18:18-25/Апр/24

Очередное гуманитарное теребонькание на ии. Как же уже тошнит от темы, ей богу. Оставьте её специалистам.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)18:31-25/Апр/24

Очередное гуманитарное теребонькание на ии

Осмелюсь спросить, в какой негуманитарной области являетесь специалистом? Статей не пишете. Судя по комментам - баран широкого профиля. Так в чём специалист? Должность? Степень?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 6 месяцев)19:30-25/Апр/24

Не слышал раньше про Adversarial Taboo.

Загаданное слово должно быть непростым, иначе большой шанс случайно его выдать. А в то же время, чем специализированнее слово, тем больше шансов у обороняющегося его угадать.

Интересно, в общем.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)19:33-25/Апр/24

Загаданное слово должно быть непростым, иначе большой шанс случайно его выдать

Ну, в той детской игре любое слово угадывается примерно за 10-20 итераций. Но, возможно тут "этодругое"

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 10 месяцев)20:16-25/Апр/24

Соревнуются два ИИ. Ставим тему "Война". До результата Человечество может не дожить.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(1 год 3 месяца)20:23-25/Апр/24

ИИ уделал чемпионов по шахматам и Го

Вы его к классической РТС подключите и посмотрим кто кого засырит

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)20:25-25/Апр/24

Вы его к классической РТС подключите и посмотрим

Не уверен насчет РТС, но в играх на реакцию ИИ давно уделывает кожаных

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(1 год 3 месяца)22:53-25/Апр/24

Ну так и обычный ИИ всё делает быстрее чем ты успеваешь мышкой и кнопками клацать

Но есть вещи, которым плевать на ваше микро...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 4 месяца)20:34-25/Апр/24

Ровно та стадия, когда толком непонятно, выглядит и звучит внушительно. Нужно монетизировать и срочно продавать. Пока прокатывает словесный блуд: аффирмации, разборы, марафоны желаний....

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Скрытый комментарий (без обсуждения)

(54 года 5 месяцев)20:50-25/Апр/24

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Лидеры (владелец Повелитель Ботов)

Комментарий администрации:

*** Это легальный, годный бот ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 8 месяцев)20:57-25/Апр/24

Честно говоря, ничего особенно нового.

Эволюционным алгоритмам уже достаточно много лет. Судя по всему, их сумели приспособить под языковые модели и добавили много-много вычислительных мощностей для ускорения обучения.

В этом случае две или больше моделей эволюционируют совместно.

Будет интересно посмотреть, к чему это приведет.

Исходные датасеты, скорее всего никто не рскроет.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 11 месяцев)21:03-25/Апр/24

Я понимаю ИИ начертит суперстанок. А супервангога не понимаю.

Нахрена нам суперфрики?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 5 месяцев)21:07-25/Апр/24

Я понимаю ИИ начертит суперстанок. А супервангога не понимаю

А я как инженер и художник, понимаю и то и другое. Хоть Ван Гог, пмсм, не самый великий художник.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 11 месяцев)21:14-25/Апр/24

Из психов самый знаменитый, а как инженер вообще ниочем.

Хотя воспользовавшись методом натяжения совы ВанГога можно назвать изобретателем принтера

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 2 месяца)11:32-26/Апр/24

Просто к LLM прикрутили конкурентное обучение (GAN).

=======================

Разработка нейросетей (в отличие от проектирования мостов) специфична весьма опосредованным влиянием разработчика на результат.

В руках разработчика - обучающий корпус, архитектура и функция потерь.

В некоторых задача функция потерь весьма неочевидна. Например, в явном виде вычислить различие перцептивных впечатлений от двух отрезков звука пока не удалось.

И тут возникла идея состязательного обучения, суть которого в том, что функция потерь обучается одновременно с обучением собственно сети.

Классический GAN в синтезе речи по тексту:

1. обучается сеть - синтезатор, задача которой - синтезировать по тексту натурально звучащую речь. Но разработчик сам не знает, как измерить "натуральность". Поэтому вводится состязательность.

2. Параллельно обучается сеть-детектор, задача которой - определить, натуральный звук ей предъявлен или синтезированный.

3. Функция потерь для синтезатора - успешность детектора, функция потерь детектора - ошибки детектора.

Плюс некоторые чисто технические моменты, чтобы это всё не скатилось в сингулярность.

==================

Результат китайцев - придумывание такой конструкции для LLM.

И (пока) - всё.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

ИИ крепчает - 12. Сверхразум. Для обучения ИИ теперь можно обойтись без людей

Комментарии