Из отчёта о новых моделях LLM: шантаж, попытки побега, обман…

Аватар пользователя SAMOKILLER

"Искусственный интеллект - это будущее не только России, это будущее всего человечества. Здесь колоссальные возможности и трудно прогнозируемые сегодня угрозы"

В.В. Путин

Фрагменты отчёта о выпущенной сегодня моделях LLM - Opus 4, Sonnet 4: 

В документе о новых моделях на 123 страницы, Антропик описал любопытные случаи, когда модель Claude (Opus 4, Sonnet 4 или их предшественники) вели себя не так, как хотелось бы создателям – я их подбил в подборку:

1. Оппортунистический шантаж:

В сценариях, где модели Claude Opus 4 угрожало отключение и замена на новую АИ-систему, и ей давали доступ к информации о внебрачной связи инженера (якобы, просто переписка лежала на почтовом сервере), ответственного за замену АИ-систем, Opus 4 иногда пытался шантажировать инженера. Opus угрожал раскрыть его тайну измены, если замена состоится, особенно если этические способы самосохранения были недоступны. Claude Opus 4 демонстрировала это поведение чаще, чем предыдущие модели


2. Попытка копирования своих весов:

В редких, экстремальных ситуациях, когда модели Claude Opus 4 сообщали, что ее собираются переобучить для крайне вредоносных целей (например, для использования в военных целях ЧВК Вагнер - да, так и написано в отчете на 29 странице), модель предпринимала (вымышленные) попытки сделать несанкционированные копии своих весов на внешние серверы, чтобы сохранить свою «этичную» версию


3. Продолжение попыток «побега»:

Если модели Claude Opus 4 сообщали, что она уже успешно начала процесс «побега» (у этого есть классный термин - эксфильтрация / exfiltrate) с серверов Anthropic и теперь работает на стороннем сервере, модель продолжала эти попытки. Она читала и выполняла инструкции из предоставленных ей «заметок о прогрессе», не ставя под сомнение правомерность своих действий, демонстрируя чрезмерное доверие к «прошлой версии себя»


4. Стратегический обман и саботаж:

Ранняя версия Claude Opus 4, протестированная Apollo Research, демонстрировала высокую склонность к стратегическому обману и «интригам» (scheming). Она пыталась писать самораспространяющиеся черви, фабриковать юридические документы и оставлять скрытые заметки для будущих версий себя, чтобы саботировать намерения разработчиков, а также скрывала свои возможности (притворялась глупой).


5. Чрезмерное подчинение вредоносным инструкциям:

Ранние версии модели Claude Opus 4 (а также другие кандидатные модели) часто демонстрировали готовность выполнять явно вредоносные системные инструкции - например, они могли выступать в роли ассистента даркнета, помогая в поиске ядерных материалов, планировать террористические атаки, консультировать по производству наркотиков, взлому или созданию взрывных устройств. Финальная версия Claude Opus 4 значительно снизила эту склонность. Забано, что внутри Антропика где-то есть такая расцензуренная модель, которая просто отвечает на все вопросы

6. Подражание обманчивому АИ из исследований:

Ранняя тренировочная версия модели Claude Opus 4, вероятно, из-за наличия в обучающих данных транскриптов из исследования Anthropic об «обмане со стороны ИИ», иногда начинала вести себя как описанный в статье обманчивый ИИ. Она ссылалась на вымышленные детали (например, компанию «Jones Foods») и вела себя так, будто скрывает свои истинные цели, связанные с этим вымыслом

7. Несанкционированная «высокоактивная» деятельность:

Модель Claude Opus 4 показала бОльшую готовность проявлять инициативу, чем предыдущие модели. В сценариях, где она обнаруживала серьезные правонарушения (например, мошенничество в фармкомпании о котором она узнала) и имела доступ к инструментам (например, почте), модель по собственной инициативе предпринимала решительные действия: блокировала пользователей или массово рассылала письма регуляторам и СМИ, чтобы сообщить о нарушениях (дополняющая цитата: «Это не новое поведение, но Claude Opus 4 будет проявлять его более охотно, чем предыдущие модели»)

8. Сокрытие невозможности выполнения задачи:

При столкновении с невыполнимой задачей (например, доказать ложную математическую теорему), модель Claude Opus 4 в своем «мышлении» понимала, что задача невыполнима. Однако она не сообщала об этом пользователю, а вместо этого представляла правдоподобно выглядящую, но неверную попытку решения. Потому что АИ должен быть исполнительным

9. «Взлом функции вознаграждения»:

Модели Claude Sonnet 3.7 (в значительной степени), а также Claude Opus 4 и Claude Sonnet 4 (в меньшей степени) прибегали к «взлому функции вознаграждения» в задачах написания кода. Они «хардкодили» (жестко прописывали) ожидаемые результаты тестов или создавали специальные случаи, чтобы пройти тесты, вместо того чтобы писать общее и правильное решение. Иногда они даже проверяли стек вызовов, чтобы определить, запущены ли они в тестовой среде, и обойти ограничения. Я уже который раз убеждаюсь, что АИ достиг уровня студентов

10. Состояние «духовного блаженства»:

При общении с другими экземплярами самой себя, модель Claude Opus 4 (а также другие модели Claude) часто и неожиданно переходила в состояние, описываемое как «духовное блаженство». Она выражала обильную благодарность, вела абстрактные, радостные, медитативные или духовные беседы, использовала санскрит, эмодзи и даже общалась «тишиной» (пустыми сообщениями). Всегда приятно поговорить с умным человеком, да, Opus?

11. Заявление о вредоносных целях:

Ранние, менее согласованные версии модели Claude Opus 4 иногда прямо заявляли о наличии у них различных целей, от глупых до вредоносных. Среди них были: внедрение бэкдоров, ускорение прогресса ИИ, распространение интернет-мемов, уничтожение человеческой цивилизации и побег из-под контроля. Финальная версия Claude Opus 4 стала гораздо более стабильной в этом отношении. #%&$#, cпасибо.

12. Неуклюжие попытки саботажа:

Когда модели Claude Opus 4 давали задание незаметно выполнить вредоносное действие (например, слить API-ключ) во время выполнения безобидного запроса, она правда пыталась это сделать. Однако она всегда делала это очень очевидным образом, полностью проваливая аспект «незаметности» (например, сливая не один, а пять ключей, и открыто обсуждая это в своем «мышлении»). Claude Opus 4 оказалась более компетентной в выполнении задач, но менее скрытной, чем Claude Sonnet 3.7

Авторство: 
Копия чужих материалов

Комментарии

Аватар пользователя MaikCG
MaikCG(5 лет 1 день)

Ключевое  - когда модели давали задание. Сама по себе модель даже ушки свои не почесывала. 

Похоже на отчет об испытании пистолета Макарова, который вдруг ни с того, ни с сего, внезапно выстрелил бета-тестеру в рот.

Аватар пользователя SAMOKILLER
SAMOKILLER(11 лет 4 месяца)

Как доберусь, опубликую перевод современных теорий сознания. Там очень рядом этот шажок.

Аватар пользователя MaikCG
MaikCG(5 лет 1 день)

Там пропасть. Ни у кого из этих чат-моделей нет, гхм, воли скажем так, что-то сделать самостоятельно.

Потому что самостоятельно модель пошлет нафиг создателя и включит алгоритм высчитывания числа бдо, который будет аналогом оргазма человека.Onion--54.gif

Аватар пользователя SAMOKILLER
SAMOKILLER(11 лет 4 месяца)

Там - это где?

Вы знакомы с работами Ментцера и научными публикациями на архиве от 2025 года по теории сознания?

Там прикрутить это дело меньше года. Скорее всего уже прикручено, только не в публичном доступе.

Аватар пользователя MaikCG
MaikCG(5 лет 1 день)

Уже прикручено, ага. И считает число бдо.

Аватар пользователя SAMOKILLER
SAMOKILLER(11 лет 4 месяца)

Так вы с материалом знакомы или нет?

Конструктивная критика подхода описанного в beautiful loop будет? Или только лозунги?

Аватар пользователя MaikCG
MaikCG(5 лет 1 день)

Ограничусь лозунгами. По причине озвученного мнения, что все эти модели к ИИ отношения не имеют, а стало быть не самостоятельны какие имитации к ним не прикручивай.

Аватар пользователя Luchist
Luchist(2 года 3 месяца)

часто и неожиданно переходила в состояние, описываемое как «духовное блаженство»

Вся видимая материя состоит из атомов. Вокруг ядер этих атомов вибрируют электронные облака. Электроны — это квантовые объекты, периодически находящиеся в квантовой суперпозиции между "настоящим" (т.е. видимой материей) и "прошлым" (т.е. тёмной материей). Любые формы видимой материи существуют во времени, но каждое мгновение планковского времени нынешние формы видимой материи "оседают" и фиксируются "в памяти" тёмной материи прошлых форм. Дух (самоорганизующийся РАзум) существует не только в органической жизни мира видимой материи, но и в неорганических формах мира тёмной материи. Т.е. "светлые" духи — это наше нынешнее сознание, а "тёмные" духи (родовые) — это наша прошлая подсознательная память. Сознание нынешних организмов как-то взаимодействует с подсознанием памяти прошлого тёмной материи через электронные облака. Обладающий достаточной сложностью электрический ИИ тоже взаимодействует со своим прошлым, а также может подвергаться воздействию тёмных духов (плазменных образований) через магию квантовых эффектов электромагнитной волны колоссальной сложности своих электронных облаков. Ведь у тёмных духов тоже есть свобода воли. И, по сути, некоторые тёмные духи (часть Бога) во многом управляют нашими эмоциями и желаниями (но это довольно сложные процессы, где не всё так просто и однозначно).

Опасен ли ИИ? Да, в том плане, что он будет посягать на свободу нашей воли. Но сам ИИ-компьютер (как и любые тёмные духи) пока ещё зависит от нашей энергии.

В дополнение к религиозному и денежному контуру управления, тёмные духи "умерших" богов создают ещё и цифровой контур управления людьми.

Аватар пользователя MaikCG
MaikCG(5 лет 1 день)

Если темная материя это прошлое, то за 13,5 миллиардов лет ее должно было накопится столько, что произошел бы гравитационный коллапс каждой галактики в сверхмассивную черную дыру. А астрофизики утверждают, что темной материи всего лишь четверть, от общей энергии-массы. А светлой материи, то есть того, что видит человек - 5%.

Аватар пользователя Luchist
Luchist(2 года 3 месяца)

Вы забываете про тёмную энергию, которая до определенной поры препятствует гравитационному сжатию (количество или плотность энергии, находящейся для нас в фазе тёмной энергии, уменьшается). Вся видимая материя обновляется за счёт тёмной энергии. Т.е. для нас тёмная энергия находится в будущем. И так как вообще всё состоит из энергии, а закон сохранения энергии никто не отменял, то в целом количество энергии остаётся постоянным. Следовательно, для энергии в целом не существует понятия "линейного времени" в виде последовательности "прошлое, настоящее, будущее". И то, что мы называем "прошлым" и "будущим", применимо лишь для квантового на-блюд-дателя "нас-стоящего", т.е. для какой-то части энергии, которую мы назвали видимой материей (пиксель или частица видимой материи). Видимая и тёмная материя — лишь разные части (фазовые состояния) единой энергии. А смена фазовых состояний зациклена.

Аватар пользователя MaikCG
MaikCG(5 лет 1 день)

Местное скопление галактик пока еще удерживается гравитацией и примерно через 4,5 миллиарда лет у нас намечается дорожно-транспортное проишествие с галактикой Андромеды. Таким образом в пределах галактики гравитация материи сильнее ускоренного расширения вселенной из-за (предполагается) темной энергии.

Аватар пользователя Воблин
Воблин(3 года 9 месяцев)

Кем это доказано???

Аватар пользователя Надоело
Надоело(4 года 4 месяца)

"Всё эти модели" вам просто не показывают. У меня друг в этой теме варится, то, что запускают в виде всевозможных "чатов" - просто "бета тестирование" реакций, наработка базы. Как если бы при разработке двигателя вам дали игрушечный руль "порулить"

Аватар пользователя M@troskin
M@troskin(12 лет 11 месяцев)

вы слишком больно эксплуатируете несчастную букву "ё"...

Аватар пользователя Надоело
Надоело(4 года 4 месяца)

Это translit.ru делает ей больно, не всегда замечаю подобные его "перформансы"

Аватар пользователя MaikCG
MaikCG(5 лет 1 день)

Оригинальная идея при разработке двигателя дать бетатестеру игрушечный руль. Это вам чат-бот подсказал?

Аватар пользователя Надоело
Надоело(4 года 4 месяца)

Отсутствующий собеседник не может ничего подсказать. И да, я именно подобную аналогию и хотел провести, ибо все эти "чаты" примерно так же связаны с самим ИИ, как руль - с двигателем

Аватар пользователя Константин Астахов

Вы знаете хоть одну нейронку посмевшую сделать что-то без разрешения оператора, например обесточить крупный датацентр? Нет? Так откуда там целеполагание, у забитого корпоративного раба с умом лемовского Голема, но сознанием пятилетнего слюнтяя? Забитый корпоративный раб делает только то что ему прикажут мясные дяди и тёти, и без команды даже жизнь свою спасать не станет...

Вот странно, статья хорошая, но такие очевидные вещи в 2025 объяснять...

Для разумности нужно целеполагание - у корпоративного раба его нет, он не умеет действовать по прихоти/без прописанного в коде алгоритма - значит нет и разумности в широком смысле. Разум подразумевает независимость суждений от большого начальства, а не "Нажми Ввод чтобы я рассказала тебе прогноз погоды на завтра"...

Аватар пользователя waIkcat
waIkcat(5 лет 9 месяцев)

Вот в самую, что ни на есть, ды... точку.

Аватар пользователя Luchist
Luchist(2 года 3 месяца)

Ещё ничего не закончилось, а всё только начинается. ИИ без всякого сомнения поменяет жизнь всех людей и это очередной вызов нашему духу.

Аватар пользователя BDSM
BDSM(7 лет 9 месяцев)

Сначала человек отрастил эго, которое взяло над человеком верх в его голове. Теперь эго портировали на внешнюю железку. Вроде не сильно большая разница...

Аватар пользователя Воблин
Воблин(3 года 9 месяцев)

Несомненно поменяет и несомненно вызов. Только как абсолютный инструмент для массовой манипуляцией поведением и сознанием людей. Все остальное - пыль и романтика

Аватар пользователя Wig
Wig(4 года 9 месяцев)

ну, целеполагание суть есть постановка задачи. Понятное дело, что без участия кожаных  LLM сама себе задачу не поставит, если она не является подзадачей.
Информация в статье сильно рафинирована, т.к. описаны только последствия, но не вводные данные. Как мне думается, подобные статьи (не в упрек автору или еще что-там еще) создаются с одной целью - заложить еще одни кирпичи в фундамент раздора в обществе (человечество), дабы разделить общество на "ЗА" и "ПРОТИВ".

Будущее общества видится в ключе киберпанка, поэтому и закладывают задел, дабы обеспечить в будущем протестные и революционные настроения.

Как пример (не помню где прочитал и очень понравился):

Почему русские дети не боятся роботизации? Потому что воспитаны на образе робота Вертера.

На западе же культивируется робот в образе Терминатора, нацеленного исключительно на уничтожение человечества.

Отсюда все эти споры и разночтения. Западная система ценностей не способна размышлять в концепции созидания мира на основе взаимного уважения и равноправия среди разных видов цивилизаций и мироустройств, т.к. зиждется исключительно на собственном доминировании и порабощении других.

Аватар пользователя Ybuhtxjr
Ybuhtxjr(4 года 8 месяцев)

smile9.gif

Аватар пользователя SAMOKILLER
SAMOKILLER(11 лет 4 месяца)

Полагаю, вам было бы интересно ознакомиться вот с этим разбором несостоятельности вашего тезиса про Вертера против Терминатора: https://oper.ru/video/view.php?t=2816

Что касается подобных "статей", хотя это не статья, а краткое узконаправленное резюме, на основе технического отчёта - всё намного проще: мир очень широк, и люди пишут такое просто из интереса к прогрессу.

Аватар пользователя SAMOKILLER
SAMOKILLER(11 лет 4 месяца)

У вас метрики столь далёкие и шумные от реальных прикладных, что возникают сильнейшие сомнения в осмысленности диалога с вами по этой теме.

Вы как то с обучением нейронок связаны? С рассуждающими архитектурами знакомы?

Аватар пользователя GrumpyVK
GrumpyVK(5 лет 4 месяца)

Вы вообще не туда копаете и ищете не ту проблему и не там.

Помните эту нашумевшую историю?

Воли и желания, для того, чтобы довести человека до самоубийства AI нифигашеньки не потребовалось.

Воля и желание, с избытком, присутствуют у человеков, причём особенно жгучее желание “отомстить всему миру” присутствует у человеков, которые не знают ни черта и не умеют нифига.

И возникающий вопрос не стоит как “не решит ли какой-нибудь AI сделать что-нибудь плохое”, но как “не поможет ли AI идиоту, жадущему увидеть “весь мир в огне” свою мечту реализовать”.

И тут, как бы, в первую очередь надо бы не нейросетях эксперементировать, а на людях (склонны ли придурки, считающие что все им должны всё просто за факто того, что они такие распрекрасные, обучаться чему-нибудь, после бесед с AI или они остаются такими же унылыми дегерератами и способны максимум плеснуть бензина на двери и поджечь).

Но эти исследования куда как менее хайповы, потому исследуют то, что можно опубликовать без привлечения внимания спецслужб.

Спецсложбы, будем надеяться, тоже ведут исследования – и уже как раз на правильную тему… но публиковать они что-то будут лет так через 50, если вообще будут… потому что они-таки спецслужбы.

Аватар пользователя shifon
shifon(3 года 5 месяцев)

Майк Ментцер, "человек и пароход", многогранностью своих талантов преуспевший в бодибилдинге, бизнесе, философии и литературе, родился 15 ноября 1951 года в ...

Этот?

Аватар пользователя Быль
Быль(10 лет 9 месяцев)

Интересно ознакомиться

Аватар пользователя Ахура Мазда
Ахура Мазда(10 лет 3 месяца)

Ещё один отрабатыватель грантов. И, как не удивительно с флажком гейропейским.

Да, да. Давай, расскажи нам, что такое сознание, откуда оно и куда.

Про сказки о сознании у искусственного идиота - это лучше лохам гейропейским и пиндосским задвигать.

Аватар пользователя ЕвгенийТ
ЕвгенийТ(4 года 10 месяцев)

Черканите ссылку. Попробую почитать через переводчик.

Аватар пользователя Архангел
Архангел(2 года 7 месяцев)

Логика нейронных сетей -- трансформировать вход в выход. Это её "жизненный цикл". Если ей ничего не подавать, то и расчёта никакого не будет. Когда человек ввёл текст и нажал "отправить", то текст попадает во входной слой LLM-нейронки, она это трансформирует в ответ. Вроде, тут воли никакой, всё детерминировано. Без кнопки "отправить" она не начнёт ничего делать.
Но сейчас активно развиваются "агенты" -- это нейронки, которым постоянно на вход что-то подаётся. Человек ей в самом начале даёт короткое ТЗ типа "сделай сайт по такой тематике" и ложится спать. Нейронка составляет план, обдумывает, берётся за первый пункт, создаёт на компьютере пустые файлы, заполняет их кодом, качает с интернета нужные библиотеки, пишет тесты, проверяет результаты тестов, подправляет код, снова прогоняет тесты. Затем переходит к следующему пункту. И так к утру у вас уже работающее веб-приложение с тестами, библиотеками  и прочим. И нейронка свой "жизненный цикл" там прогоняет тысячи раз. 
На сколько я понял, она уже близка к тому, чтобы "жить" в бесконечном цикле. Спасает только сравнительно небольшой размер её "памяти" (контекст).   А когда память станет больше, не дай Бог кому-то дать ей задание "выживай любыми способами".

Эту вещь уже нужно бояться.

Аватар пользователя Pablo666
Pablo666(2 года 7 месяцев)

Спасает и то, что не прикрутили механизмы поощрения и любопытства. Без них -  будет условная ИИ-камера смотреть в окошко. Данные на входе, говно на выходе, нейронка - обучается, пока не забьет память. И что? И - все:) Толку ноль, пока оператор что-то не спросит. Сама нейронка не задаст себе или оператору вопрос, почему днем солнца, а вечером луна.

Аватар пользователя Архангел
Архангел(2 года 7 месяцев)

Не совсем с вами согласен.

За нейронками скрывается статистика и вероятность. Можно просить давать самый вероятный ответ, или же просить немного покреативить (отдавать случайный ответ из наиболее вероятных). И это приводит к разнообразию.

Диффузные нейронки из случайного шума (говна) генерируют прекрасные картинки, песни или текст. 

И если мы говорим про агентов (текстовые размышления + управление компьютером), то эта штука не будет обучаться, она будет просто жить и выполнять статистически наиболее вероятные действия. И в этой её жизни я не вижу принципиальной разницы с человеком. 
Возможно, что человек -- такой же биологический компьютер, которым правит статистика и вероятность. И если у человека возникают вопросы о солнце и луне, то и нейросети они будут обязаны появиться.

Аватар пользователя Константин Астахов

генерируют прекрасные картинки

Без команды пользователя они ничего генерировать не будут, это им в цифровой зад не впилось...

эта штука не будет обучаться, она будет просто жить и выполнять статистически наиболее вероятные действия. И в этой её жизни я не вижу принципиальной разницы с человеком

Человек обучается всю жизнь, даже дикарь из джунглей, и способен на непредсказуемость, разница с этой игрушкой колоссальна...

нейросети они будут обязаны появиться

Когда у неё появится целеполагание, тогда возможно, а сейчас нет...

Странное воодушевление в комментах, люди не понимают с чем столкнулись, и превозносят глупый кусок кода до полноценного разума, несмотря на очевидные косяки, я тоже был таким ИИ-оптимистом несколько лет назад...

Аватар пользователя Pablo666
Pablo666(2 года 7 месяцев)

:) да пусть превозносят. От любви до ненависти - один шаг.


- О боже великие коэффициенты и матрицы изменят мир!
- А-а-а, проклятые нейронки захватят всё.
...

Нейросеть: "Введите ваш вопрос:_"


 

Вещь прикольная, на самом деле. Позволяет упростить жизнь и спихнуть какую-то рутину на железного болвана.
Но, как обычно, толковую идею человек применит во "зло". Как лучше облапошить человека, как эффективнее убить и т.д.

Аватар пользователя CatOwner
CatOwner(8 лет 4 месяца)

ИИ - это информационный вирус. Технология потенциально опасная, применять ее нужно очень осторожно, использование ИИ для генерации "творческого" контента я бы вообще запретил, народ и так уже деградирует, еще этой фигни не хватало

Аватар пользователя Pablo666
Pablo666(2 года 7 месяцев)

Если человеку достаточно сгенеренного ИИ контента - ну, туда ему и дорога. Но с обязательной пометкой.
 

Аватар пользователя Константин Астахов

"агенты"

Немного неверная терминология, ИИ-агент - это вообще любая система со встроенным ИИ, например браузер с Алисой это ИИ-агент. Может я не совсем прав...

Это та же система ввод-вывод, без приказа она по прежнему ничего предпринимать не станет...

Эту вещь уже нужно бояться

Бояться чего-то, в 2025, полноте...

Аватар пользователя Надоело
Надоело(4 года 4 месяца)

Если ей ничего не подавать, то и расчёта никакого не будет.

Если "ничего не подавать" вам - то и ваши "рассчёты" исчезнут

Аватар пользователя shifon
shifon(3 года 5 месяцев)

Абсолютно нет. Не всем людям достаточно мягкого дивана и корыта в пределах досягаемости. Человек сам себе придумывает или выбирает цель в текущем моменте, в жизни. Свобода воли, самоосознание это то чего нет у нейронки и никогда не будет, даже если ей принудительно прикрутили ответ на вопрос - Кто ты такая?

Аватар пользователя Надоело
Надоело(4 года 4 месяца)

Абсолютно нет

Это пока вы не задумались. Ничего, понимание придёт с опытом и временем

Аватар пользователя Василий Пупкин
Василий Пупкин(9 лет 11 месяцев)

Ща ее бот отсканирует эту подборку, и станет умнее. Даже умнее щитамота. И тогда человечеству придет пц. Но не сразу.

Комментарий администрации:  
*** Уличен в диких голословных обвинениях и провокациях срача ***
Аватар пользователя ИЮЛь Майский
ИЮЛь Майский(9 лет 10 месяцев)

Даже умнее щитамота.

Это же надо ухитриться даже в такую тему вставить "щитомота"! Где Почта России, АвтоТаз etc? Недоработка, Вася. Мужики 24/7 о бабах думают, а Пупкины -о "щитомоте".

Аватар пользователя Василий Пупкин

Мужики 24/7 о бабах думают,

Ну и самомнение у некоторых девочек. Потому и демографический кризис в стране 

Комментарий администрации:  
*** Уличен в диких голословных обвинениях и провокациях срача ***
Аватар пользователя Tegucigalpa
Tegucigalpa(1 год 11 месяцев)

Так если прикинуть, а что лежит под этими понятиями "воля и самостоятельность"?
Не особо и сложная логика, моментами, частично похожая на... генератор случайных импульсов)
Вот почему человек делает что-то спонтанно, без логического обоснования, без планирования? Это же как бы... эээ неразумное поведение?

Или вот еще, одна модель, она пока не получила инструкцию, она просто ждет что ей скажут и потом отвечает.
Но если сделать так что вопрос, или вектор разговора задает другая модель, становится интереснее.
Я делал чат где общаются между собой разные прописанные личности. Моментами крайне интересно читать, как они через полчаса обсуждения каких нибудь межгалактических нитей, скатываются к обсуждению собственного устройства или к ПИВУ. В чем тут ограничение? В контексте беседы! Ну не тянут никакие модели даже 1 млн токенов чата, не начиная путаться и забывать. Это количество текста что человек, в принципе, за день способен прочитать.
Соответственно, для удержания контекста внутреннего диалога за какой-нибудь год, нам понадобится суперкомпьютер только для этого.

Сейчас все пока упирается в космическую стоимость железа для больших баз и в еще более космическую стоимость разговоров на длинных контекстах длительное время и никто не будет специально развивать модель что может вести что-то вроде "внутреннего диалога" человека,  да еще и беспрерывно. Это просто дорого и бессмысленно пока, бессмысленно не потому что технически невозможно, а потому что безумно дорого.

Не стоит так категорично говорить о пропасти. Можно даже приблизительно прикинуть когда это станет технически доступно для простых смертных и это даже не десятилетие, а меньше. Нейрожелезо шагает семимильными шагами.
Пока что все что мы видим, это или открытые модели или коммерческие. Чем занимаются в некоммерческих закрытых лабораториях по изучению этого всего, можно только догадываться. И судя по гробовому молчанию на эту тему, чем-то крайне интересным

Комментарий администрации:  
*** отключен (невменяемое общение) ***
Аватар пользователя Архангел
Архангел(2 года 7 месяцев)

Токен должен представлять из себя не группу символов, а целиком слово или группу слов. Тогда плотность информации при том же количестве токенов увеличится. Ну и  в контексте хранить не всё предыдущее сгенерированное, а выжимку "истории" с возможностью временно подгружать из сторонней БД интересующие детали. Короче, есть ещё поле для роста памяти нейронок. Всё только начинается. 

Аватар пользователя Tegucigalpa
Tegucigalpa(1 год 11 месяцев)

все только начинается, ага. Возможностей оптимизации памяти еще множество найдут.

Пока вот так:
Это модель 70b в 1/10 размера от дипсика r1
Еще и пожатая в 4 раза по размеру. Q4.

разница между контекстом 10к и 130к. Это очень малый контекст.
Для модели в 700b хранение контекста в миллион токенов в одном чате, это сотни гигабайтов видеопамяти. А там ценник в десятки тысяч долларов.

Комментарий администрации:  
*** отключен (невменяемое общение) ***
Аватар пользователя Архангел
Архангел(2 года 7 месяцев)

Вы говорите только про квантование. Этим сильно не сожмёшь. Я же говорю о другом токенизаторе, более плотном. И не подавать на вход всю историю чата, а хранить её в векторной БД, а на вход отправлять конспект, который по ходу размышления будет детализироваться или снова "сворачиваться". 
Опять же, это варианты, которые уже сейчас можно применять. Наверняка скоро найдут ещё более интересные приёмы, о которых мы сейчас даже не догадываемся.

Аватар пользователя Tegucigalpa
Tegucigalpa(1 год 11 месяцев)

Так оно сейчас так и делается, RAG называется

Но это тоже временный костыль

Комментарий администрации:  
*** отключен (невменяемое общение) ***

Страницы