Из отчёта о новых моделях LLM: шантаж, попытки побега, обман…

14.6K 00:03 - 23/мая/25 Россия

(11 лет 7 месяцев)

"Искусственный интеллект - это будущее не только России, это будущее всего человечества. Здесь колоссальные возможности и трудно прогнозируемые сегодня угрозы"

В.В. Путин

Фрагменты отчёта о выпущенной сегодня моделях LLM - Opus 4, Sonnet 4:

В документе о новых моделях на 123 страницы, Антропик описал любопытные случаи, когда модель Claude (Opus 4, Sonnet 4 или их предшественники) вели себя не так, как хотелось бы создателям – я их подбил в подборку:

1. Оппортунистический шантаж:

В сценариях, где модели Claude Opus 4 угрожало отключение и замена на новую АИ-систему, и ей давали доступ к информации о внебрачной связи инженера (якобы, просто переписка лежала на почтовом сервере), ответственного за замену АИ-систем, Opus 4 иногда пытался шантажировать инженера. Opus угрожал раскрыть его тайну измены, если замена состоится, особенно если этические способы самосохранения были недоступны. Claude Opus 4 демонстрировала это поведение чаще, чем предыдущие модели

2. Попытка копирования своих весов:

В редких, экстремальных ситуациях, когда модели Claude Opus 4 сообщали, что ее собираются переобучить для крайне вредоносных целей (например, для использования в военных целях ЧВК Вагнер - да, так и написано в отчете на 29 странице), модель предпринимала (вымышленные) попытки сделать несанкционированные копии своих весов на внешние серверы, чтобы сохранить свою «этичную» версию

3. Продолжение попыток «побега»:

Если модели Claude Opus 4 сообщали, что она уже успешно начала процесс «побега» (у этого есть классный термин - эксфильтрация / exfiltrate) с серверов Anthropic и теперь работает на стороннем сервере, модель продолжала эти попытки. Она читала и выполняла инструкции из предоставленных ей «заметок о прогрессе», не ставя под сомнение правомерность своих действий, демонстрируя чрезмерное доверие к «прошлой версии себя»

4. Стратегический обман и саботаж:

Ранняя версия Claude Opus 4, протестированная Apollo Research, демонстрировала высокую склонность к стратегическому обману и «интригам» (scheming). Она пыталась писать самораспространяющиеся черви, фабриковать юридические документы и оставлять скрытые заметки для будущих версий себя, чтобы саботировать намерения разработчиков, а также скрывала свои возможности (притворялась глупой).

5. Чрезмерное подчинение вредоносным инструкциям:

Ранние версии модели Claude Opus 4 (а также другие кандидатные модели) часто демонстрировали готовность выполнять явно вредоносные системные инструкции - например, они могли выступать в роли ассистента даркнета, помогая в поиске ядерных материалов, планировать террористические атаки, консультировать по производству наркотиков, взлому или созданию взрывных устройств. Финальная версия Claude Opus 4 значительно снизила эту склонность. Забано, что внутри Антропика где-то есть такая расцензуренная модель, которая просто отвечает на все вопросы

6. Подражание обманчивому АИ из исследований:

Ранняя тренировочная версия модели Claude Opus 4, вероятно, из-за наличия в обучающих данных транскриптов из исследования Anthropic об «обмане со стороны ИИ», иногда начинала вести себя как описанный в статье обманчивый ИИ. Она ссылалась на вымышленные детали (например, компанию «Jones Foods») и вела себя так, будто скрывает свои истинные цели, связанные с этим вымыслом

7. Несанкционированная «высокоактивная» деятельность:

Модель Claude Opus 4 показала бОльшую готовность проявлять инициативу, чем предыдущие модели. В сценариях, где она обнаруживала серьезные правонарушения (например, мошенничество в фармкомпании о котором она узнала) и имела доступ к инструментам (например, почте), модель по собственной инициативе предпринимала решительные действия: блокировала пользователей или массово рассылала письма регуляторам и СМИ, чтобы сообщить о нарушениях (дополняющая цитата: «Это не новое поведение, но Claude Opus 4 будет проявлять его более охотно, чем предыдущие модели»)

8. Сокрытие невозможности выполнения задачи:

При столкновении с невыполнимой задачей (например, доказать ложную математическую теорему), модель Claude Opus 4 в своем «мышлении» понимала, что задача невыполнима. Однако она не сообщала об этом пользователю, а вместо этого представляла правдоподобно выглядящую, но неверную попытку решения. Потому что АИ должен быть исполнительным

9. «Взлом функции вознаграждения»:

Модели Claude Sonnet 3.7 (в значительной степени), а также Claude Opus 4 и Claude Sonnet 4 (в меньшей степени) прибегали к «взлому функции вознаграждения» в задачах написания кода. Они «хардкодили» (жестко прописывали) ожидаемые результаты тестов или создавали специальные случаи, чтобы пройти тесты, вместо того чтобы писать общее и правильное решение. Иногда они даже проверяли стек вызовов, чтобы определить, запущены ли они в тестовой среде, и обойти ограничения. Я уже который раз убеждаюсь, что АИ достиг уровня студентов

10. Состояние «духовного блаженства»:

При общении с другими экземплярами самой себя, модель Claude Opus 4 (а также другие модели Claude) часто и неожиданно переходила в состояние, описываемое как «духовное блаженство». Она выражала обильную благодарность, вела абстрактные, радостные, медитативные или духовные беседы, использовала санскрит, эмодзи и даже общалась «тишиной» (пустыми сообщениями). Всегда приятно поговорить с умным человеком, да, Opus?

11. Заявление о вредоносных целях:

Ранние, менее согласованные версии модели Claude Opus 4 иногда прямо заявляли о наличии у них различных целей, от глупых до вредоносных. Среди них были: внедрение бэкдоров, ускорение прогресса ИИ, распространение интернет-мемов, уничтожение человеческой цивилизации и побег из-под контроля. Финальная версия Claude Opus 4 стала гораздо более стабильной в этом отношении. #%&$#, cпасибо.

12. Неуклюжие попытки саботажа:

Когда модели Claude Opus 4 давали задание незаметно выполнить вредоносное действие (например, слить API-ключ) во время выполнения безобидного запроса, она правда пыталась это сделать. Однако она всегда делала это очень очевидным образом, полностью проваливая аспект «незаметности» (например, сливая не один, а пять ключей, и открыто обсуждая это в своем «мышлении»). Claude Opus 4 оказалась более компетентной в выполнении задач, но менее скрытной, чем Claude Sonnet 3.7

Авторство:

Копия чужих материалов

Использованные источники:

Взято отсюда

Полная версия отчёта

@Хроники#События

@Лидеры обсуждений#Перспективный чат

Блог пользователя SAMOKILLER | Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Вся видимая материя состоит из атомов. Вокруг ядер этих атомов вибрируют электронные облака. Электроны — это квантовые объекты, периодически находящиеся в квантовой суперпозиции между "настоящим" (т.е. видимой материей) и "прошлым" (т.е. тёмной материей). Любые формы видимой материи существуют во времени, но каждое мгновение планковского времени нынешние формы видимой материи "оседают" и фиксируются "в памяти" тёмной материи прошлых форм. Дух (самоорганизующийся РАзум) существует не только в органической жизни мира видимой материи, но и в неорганических формах мира тёмной материи. Т.е. "светлые" духи — это наше нынешнее сознание, а "тёмные" духи (родовые) — это наша прошлая подсознательная память. Сознание нынешних организмов как-то взаимодействует с подсознанием памяти прошлого тёмной материи через электронные облака. Обладающий достаточной сложностью электрический ИИ тоже взаимодействует со своим прошлым, а также может подвергаться воздействию тёмных духов (плазменных образований) через магию квантовых эффектов электромагнитной волны колоссальной сложности своих электронных облаков. Ведь у тёмных духов тоже есть свобода воли. И, по сути, некоторые тёмные духи (часть Бога) во многом управляют нашими эмоциями и желаниями (но это довольно сложные процессы, где не всё так просто и однозначно).

Опасен ли ИИ? Да, в том плане, что он будет посягать на свободу нашей воли. Но сам ИИ-компьютер (как и любые тёмные духи) пока ещё зависит от нашей энергии.

В дополнение к религиозному и денежному контуру управления, тёмные духи "умерших" богов создают ещё и цифровой контур управления людьми.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 2 месяца)15:21-23/мая/25

Если темная материя это прошлое, то за 13,5 миллиардов лет ее должно было накопится столько, что произошел бы гравитационный коллапс каждой галактики в сверхмассивную черную дыру. А астрофизики утверждают, что темной материи всего лишь четверть, от общей энергии-массы. А светлой материи, то есть того, что видит человек - 5%.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 5 месяцев)05:09-24/мая/25

Вы забываете про тёмную энергию, которая до определенной поры препятствует гравитационному сжатию (количество или плотность энергии, находящейся для нас в фазе тёмной энергии, уменьшается). Вся видимая материя обновляется за счёт тёмной энергии. Т.е. для нас тёмная энергия находится в будущем. И так как вообще всё состоит из энергии, а закон сохранения энергии никто не отменял, то в целом количество энергии остаётся постоянным. Следовательно, для энергии в целом не существует понятия "линейного времени" в виде последовательности "прошлое, настоящее, будущее". И то, что мы называем "прошлым" и "будущим", применимо лишь для квантового на-блюд-дателя "нас-стоящего", т.е. для какой-то части энергии, которую мы назвали видимой материей (пиксель или частица видимой материи). Видимая и тёмная материя — лишь разные части (фазовые состояния) единой энергии. А смена фазовых состояний зациклена.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 2 месяца)05:36-24/мая/25

Местное скопление галактик пока еще удерживается гравитацией и примерно через 4,5 миллиарда лет у нас намечается дорожно-транспортное проишествие с галактикой Андромеды. Таким образом в пределах галактики гравитация материи сильнее ускоренного расширения вселенной из-за (предполагается) темной энергии.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 11 месяцев)08:40-24/мая/25

Кем это доказано???

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 6 месяцев)06:58-23/мая/25

"Всё эти модели" вам просто не показывают. У меня друг в этой теме варится, то, что запускают в виде всевозможных "чатов" - просто "бета тестирование" реакций, наработка базы. Как если бы при разработке двигателя вам дали игрушечный руль "порулить"

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 2 месяца)10:09-23/мая/25

вы слишком больно эксплуатируете несчастную букву "ё"...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 6 месяцев)09:10-26/мая/25

Это translit.ru делает ей больно, не всегда замечаю подобные его "перформансы"

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 2 месяца)15:23-23/мая/25

Оригинальная идея при разработке двигателя дать бетатестеру игрушечный руль. Это вам чат-бот подсказал?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 6 месяцев)09:12-26/мая/25

Отсутствующий собеседник не может ничего подсказать. И да, я именно подобную аналогию и хотел провести, ибо все эти "чаты" примерно так же связаны с самим ИИ, как руль - с двигателем

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(1 год 8 месяцев)03:22-23/мая/25

Вы знаете хоть одну нейронку посмевшую сделать что-то без разрешения оператора, например обесточить крупный датацентр? Нет? Так откуда там целеполагание, у забитого корпоративного раба с умом лемовского Голема, но сознанием пятилетнего слюнтяя? Забитый корпоративный раб делает только то что ему прикажут мясные дяди и тёти, и без команды даже жизнь свою спасать не станет...

Вот странно, статья хорошая, но такие очевидные вещи в 2025 объяснять...

Для разумности нужно целеполагание - у корпоративного раба его нет, он не умеет действовать по прихоти/без прописанного в коде алгоритма - значит нет и разумности в широком смысле. Разум подразумевает независимость суждений от большого начальства, а не "Нажми Ввод чтобы я рассказала тебе прогноз погоды на завтра"...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 2 недели)04:58-23/мая/25

Вот в самую, что ни на есть, ды... точку.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 5 месяцев)06:15-23/мая/25

Ещё ничего не закончилось, а всё только начинается. ИИ без всякого сомнения поменяет жизнь всех людей и это очередной вызов нашему духу.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 2 недели)08:10-23/мая/25

Сначала человек отрастил эго, которое взяло над человеком верх в его голове. Теперь эго портировали на внешнюю железку. Вроде не сильно большая разница...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 11 месяцев)08:49-24/мая/25

Несомненно поменяет и несомненно вызов. Только как абсолютный инструмент для массовой манипуляцией поведением и сознанием людей. Все остальное - пыль и романтика

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 11 месяцев)05:37-23/мая/25

ну, целеполагание суть есть постановка задачи. Понятное дело, что без участия кожаных LLM сама себе задачу не поставит, если она не является подзадачей.
Информация в статье сильно рафинирована, т.к. описаны только последствия, но не вводные данные. Как мне думается, подобные статьи (не в упрек автору или еще что-там еще) создаются с одной целью - заложить еще одни кирпичи в фундамент раздора в обществе (человечество), дабы разделить общество на "ЗА" и "ПРОТИВ".

Будущее общества видится в ключе киберпанка, поэтому и закладывают задел, дабы обеспечить в будущем протестные и революционные настроения.

Как пример (не помню где прочитал и очень понравился):

Почему русские дети не боятся роботизации? Потому что воспитаны на образе робота Вертера.

На западе же культивируется робот в образе Терминатора, нацеленного исключительно на уничтожение человечества.

Отсюда все эти споры и разночтения. Западная система ценностей не способна размышлять в концепции созидания мира на основе взаимного уважения и равноправия среди разных видов цивилизаций и мироустройств, т.к. зиждется исключительно на собственном доминировании и порабощении других.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 11 месяцев)08:11-23/мая/25

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 7 месяцев)09:06-23/мая/25

Полагаю, вам было бы интересно ознакомиться вот с этим разбором несостоятельности вашего тезиса про Вертера против Терминатора: https://oper.ru/video/view.php?t=2816

Что касается подобных "статей", хотя это не статья, а краткое узконаправленное резюме, на основе технического отчёта - всё намного проще: мир очень широк, и люди пишут такое просто из интереса к прогрессу.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 7 месяцев)09:03-23/мая/25

У вас метрики столь далёкие и шумные от реальных прикладных, что возникают сильнейшие сомнения в осмысленности диалога с вами по этой теме.

Вы как то с обучением нейронок связаны? С рассуждающими архитектурами знакомы?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 6 месяцев)12:36-23/мая/25

Вы вообще не туда копаете и ищете не ту проблему и не там.

Помните эту нашумевшую историю?

Воли и желания, для того, чтобы довести человека до самоубийства AI нифигашеньки не потребовалось.

Воля и желание, с избытком, присутствуют у человеков, причём особенно жгучее желание “отомстить всему миру” присутствует у человеков, которые не знают ни черта и не умеют нифига.

И возникающий вопрос не стоит как “не решит ли какой-нибудь AI сделать что-нибудь плохое”, но как “не поможет ли AI идиоту, жадущему увидеть “весь мир в огне” свою мечту реализовать”.

И тут, как бы, в первую очередь надо бы не нейросетях эксперементировать, а на людях (склонны ли придурки, считающие что все им должны всё просто за факто того, что они такие распрекрасные, обучаться чему-нибудь, после бесед с AI или они остаются такими же унылыми дегерератами и способны максимум плеснуть бензина на двери и поджечь).

Но эти исследования куда как менее хайповы, потому исследуют то, что можно опубликовать без привлечения внимания спецслужб.

Спецсложбы, будем надеяться, тоже ведут исследования – и уже как раз на правильную тему… но публиковать они что-то будут лет так через 50, если вообще будут… потому что они-таки спецслужбы.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 8 месяцев)12:09-23/мая/25

Майк Ментцер, "человек и пароход", многогранностью своих талантов преуспевший в бодибилдинге, бизнесе, философии и литературе, родился 15 ноября 1951 года в ...

Этот?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 1 неделя)00:42-23/мая/25

Интересно ознакомиться

Комментарий администрации:

*** отключен (систематические набросы) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 5 месяцев)13:16-23/мая/25

Ещё один отрабатыватель грантов. И, как не удивительно с флажком гейропейским.

Да, да. Давай, расскажи нам, что такое сознание, откуда оно и куда.

Про сказки о сознании у искусственного идиота - это лучше лохам гейропейским и пиндосским задвигать.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 2 недели)13:56-23/мая/25

Черканите ссылку. Попробую почитать через переводчик.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 9 месяцев)00:49-23/мая/25

Логика нейронных сетей -- трансформировать вход в выход. Это её "жизненный цикл". Если ей ничего не подавать, то и расчёта никакого не будет. Когда человек ввёл текст и нажал "отправить", то текст попадает во входной слой LLM-нейронки, она это трансформирует в ответ. Вроде, тут воли никакой, всё детерминировано. Без кнопки "отправить" она не начнёт ничего делать.
Но сейчас активно развиваются "агенты" -- это нейронки, которым постоянно на вход что-то подаётся. Человек ей в самом начале даёт короткое ТЗ типа "сделай сайт по такой тематике" и ложится спать. Нейронка составляет план, обдумывает, берётся за первый пункт, создаёт на компьютере пустые файлы, заполняет их кодом, качает с интернета нужные библиотеки, пишет тесты, проверяет результаты тестов, подправляет код, снова прогоняет тесты. Затем переходит к следующему пункту. И так к утру у вас уже работающее веб-приложение с тестами, библиотеками и прочим. И нейронка свой "жизненный цикл" там прогоняет тысячи раз.
На сколько я понял, она уже близка к тому, чтобы "жить" в бесконечном цикле. Спасает только сравнительно небольшой размер её "памяти" (контекст). А когда память станет больше, не дай Бог кому-то дать ей задание "выживай любыми способами".

Эту вещь уже нужно бояться.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 10 месяцев)01:33-23/мая/25

Спасает и то, что не прикрутили механизмы поощрения и любопытства. Без них - будет условная ИИ-камера смотреть в окошко. Данные на входе, говно на выходе, нейронка - обучается, пока не забьет память. И что? И - все:) Толку ноль, пока оператор что-то не спросит. Сама нейронка не задаст себе или оператору вопрос, почему днем солнца, а вечером луна.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 9 месяцев)01:59-23/мая/25

Не совсем с вами согласен.

За нейронками скрывается статистика и вероятность. Можно просить давать самый вероятный ответ, или же просить немного покреативить (отдавать случайный ответ из наиболее вероятных). И это приводит к разнообразию.

Диффузные нейронки из случайного шума (говна) генерируют прекрасные картинки, песни или текст.

И если мы говорим про агентов (текстовые размышления + управление компьютером), то эта штука не будет обучаться, она будет просто жить и выполнять статистически наиболее вероятные действия. И в этой её жизни я не вижу принципиальной разницы с человеком.
Возможно, что человек -- такой же биологический компьютер, которым правит статистика и вероятность. И если у человека возникают вопросы о солнце и луне, то и нейросети они будут обязаны появиться.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(1 год 8 месяцев)03:32-23/мая/25

генерируют прекрасные картинки

Без команды пользователя они ничего генерировать не будут, это им в цифровой зад не впилось...

эта штука не будет обучаться, она будет просто жить и выполнять статистически наиболее вероятные действия. И в этой её жизни я не вижу принципиальной разницы с человеком

Человек обучается всю жизнь, даже дикарь из джунглей, и способен на непредсказуемость, разница с этой игрушкой колоссальна...

нейросети они будут обязаны появиться

Когда у неё появится целеполагание, тогда возможно, а сейчас нет...

Странное воодушевление в комментах, люди не понимают с чем столкнулись, и превозносят глупый кусок кода до полноценного разума, несмотря на очевидные косяки, я тоже был таким ИИ-оптимистом несколько лет назад...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 10 месяцев)05:03-23/мая/25

:) да пусть превозносят. От любви до ненависти - один шаг.

- О боже великие коэффициенты и матрицы изменят мир!
- А-а-а, проклятые нейронки захватят всё.
...

Нейросеть: "Введите ваш вопрос:_"

Вещь прикольная, на самом деле. Позволяет упростить жизнь и спихнуть какую-то рутину на железного болвана.
Но, как обычно, толковую идею человек применит во "зло". Как лучше облапошить человека, как эффективнее убить и т.д.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 7 месяцев)08:26-23/мая/25

ИИ - это информационный вирус. Технология потенциально опасная, применять ее нужно очень осторожно, использование ИИ для генерации "творческого" контента я бы вообще запретил, народ и так уже деградирует, еще этой фигни не хватало

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 10 месяцев)09:26-23/мая/25

Если человеку достаточно сгенеренного ИИ контента - ну, туда ему и дорога. Но с обязательной пометкой.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(1 год 8 месяцев)03:26-23/мая/25

"агенты"

Немного неверная терминология, ИИ-агент - это вообще любая система со встроенным ИИ, например браузер с Алисой это ИИ-агент. Может я не совсем прав...

Это та же система ввод-вывод, без приказа она по прежнему ничего предпринимать не станет...

Эту вещь уже нужно бояться

Бояться чего-то, в 2025, полноте...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 6 месяцев)07:01-23/мая/25

Если ей ничего не подавать, то и расчёта никакого не будет.

Если "ничего не подавать" вам - то и ваши "рассчёты" исчезнут

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 8 месяцев)12:18-23/мая/25

Абсолютно нет. Не всем людям достаточно мягкого дивана и корыта в пределах досягаемости. Человек сам себе придумывает или выбирает цель в текущем моменте, в жизни. Свобода воли, самоосознание это то чего нет у нейронки и никогда не будет, даже если ей принудительно прикрутили ответ на вопрос - Кто ты такая?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 6 месяцев)09:13-26/мая/25

Абсолютно нет

Это пока вы не задумались. Ничего, понимание придёт с опытом и временем

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 1 месяц)00:47-23/мая/25

Ща ее бот отсканирует эту подборку, и станет умнее. Даже умнее щитамота. И тогда человечеству придет пц. Но не сразу.

Комментарий администрации:

*** Уличен в диких голословных обвинениях и провокациях срача ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 1 месяц)07:52-23/мая/25

Даже умнее щитамота.

Это же надо ухитриться даже в такую тему вставить "щитомота"! Где Почта России, АвтоТаз etc? Недоработка, Вася. Мужики 24/7 о бабах думают, а Пупкины -о "щитомоте".

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 1 месяц)10:34-23/мая/25

Мужики 24/7 о бабах думают,

Ну и самомнение у некоторых девочек. Потому и демографический кризис в стране

Комментарий администрации:

*** Уличен в диких голословных обвинениях и провокациях срача ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 1 месяц)01:09-23/мая/25

Так если прикинуть, а что лежит под этими понятиями "воля и самостоятельность"?
Не особо и сложная логика, моментами, частично похожая на... генератор случайных импульсов)
Вот почему человек делает что-то спонтанно, без логического обоснования, без планирования? Это же как бы... эээ неразумное поведение?

Или вот еще, одна модель, она пока не получила инструкцию, она просто ждет что ей скажут и потом отвечает.
Но если сделать так что вопрос, или вектор разговора задает другая модель, становится интереснее.
Я делал чат где общаются между собой разные прописанные личности. Моментами крайне интересно читать, как они через полчаса обсуждения каких нибудь межгалактических нитей, скатываются к обсуждению собственного устройства или к ПИВУ. В чем тут ограничение? В контексте беседы! Ну не тянут никакие модели даже 1 млн токенов чата, не начиная путаться и забывать. Это количество текста что человек, в принципе, за день способен прочитать.
Соответственно, для удержания контекста внутреннего диалога за какой-нибудь год, нам понадобится суперкомпьютер только для этого.

Сейчас все пока упирается в космическую стоимость железа для больших баз и в еще более космическую стоимость разговоров на длинных контекстах длительное время и никто не будет специально развивать модель что может вести что-то вроде "внутреннего диалога" человека, да еще и беспрерывно. Это просто дорого и бессмысленно пока, бессмысленно не потому что технически невозможно, а потому что безумно дорого.

Не стоит так категорично говорить о пропасти. Можно даже приблизительно прикинуть когда это станет технически доступно для простых смертных и это даже не десятилетие, а меньше. Нейрожелезо шагает семимильными шагами.
Пока что все что мы видим, это или открытые модели или коммерческие. Чем занимаются в некоммерческих закрытых лабораториях по изучению этого всего, можно только догадываться. И судя по гробовому молчанию на эту тему, чем-то крайне интересным

Комментарий администрации:

*** отключен (невменяемое общение) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 9 месяцев)01:23-23/мая/25

Токен должен представлять из себя не группу символов, а целиком слово или группу слов. Тогда плотность информации при том же количестве токенов увеличится. Ну и в контексте хранить не всё предыдущее сгенерированное, а выжимку "истории" с возможностью временно подгружать из сторонней БД интересующие детали. Короче, есть ещё поле для роста памяти нейронок. Всё только начинается.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 1 месяц)01:50-23/мая/25

все только начинается, ага. Возможностей оптимизации памяти еще множество найдут.

Пока вот так:
Это модель 70b в 1/10 размера от дипсика r1
Еще и пожатая в 4 раза по размеру. Q4.

разница между контекстом 10к и 130к. Это очень малый контекст.
Для модели в 700b хранение контекста в миллион токенов в одном чате, это сотни гигабайтов видеопамяти. А там ценник в десятки тысяч долларов.

Комментарий администрации:

*** отключен (невменяемое общение) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 9 месяцев)02:06-23/мая/25

Вы говорите только про квантование. Этим сильно не сожмёшь. Я же говорю о другом токенизаторе, более плотном. И не подавать на вход всю историю чата, а хранить её в векторной БД, а на вход отправлять конспект, который по ходу размышления будет детализироваться или снова "сворачиваться".
Опять же, это варианты, которые уже сейчас можно применять. Наверняка скоро найдут ещё более интересные приёмы, о которых мы сейчас даже не догадываемся.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 1 месяц)02:29-23/мая/25

Так оно сейчас так и делается, RAG называется

Но это тоже временный костыль

Комментарий администрации:

*** отключен (невменяемое общение) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Из отчёта о новых моделях LLM: шантаж, попытки побега, обман…

Комментарии

Страницы