Ахура Мазда • Исследование: 250 вредоносных документов могут вызвать сбой в работе языковой модели с 13 млрд параметров

Ну что, круто. Тем, что проведены математические оценки влияния параметров чуши (даже не прямой лжи!) на реакцию сложной системы. Совсем немножко чуши или лжи, и система идет вразнос. Как ИИ, так и ЧеловекоОбщества. Чем англосаксы и пользуются вполне успешно.

ЗЫ Собственно, это показывает, что навязанные модели, в которых не прослеживается четкая логическая связь между всеми элементами, могут нести функции троянского коня. Как, например, либерализм, или модель оседлых бандитов Олсона.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 11 месяцев)06:15-14/Окт/25

Почему это у Олсона не прослеживается логическая связь?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 5 месяцев)06:45-14/Окт/25

Там манипуляция типа ложная логическая связь. На сегодняшний день видно, что (по крайней мере в наше время) способ отбора из оседлых бандитов не дает возможность построить эффективное государство, а значит выжить в дарвинском отборе ЧеловекоОбществ.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 11 месяцев)20:19-14/Окт/25

Все государства это наиболее эффективные банды на районе.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 6 месяцев)13:43-14/Окт/25

Чем англосаксы и пользуются вполне успешно.

Если англосаксы в этом так успешны, то почему ж они не смогли на Афганистан, ни Россию под себя подмять, за столько-то времени?

Как ИИ, так и ЧеловекоОбщества.

Не совсем так. Если у вас нет модели мира, с которой вы можете сверять информацию – то всё идёт вразнос очень легко. У человека это называется “клиповое мышление”, у ИИ никакого другого нет изначально.

И да, там, где людей удаётся отучить думать и, вместо этого, научить тупо реагировать на раздражители – у англосаксов всё получается, они этим, собственно, столетиями и занимаются. Но если какой-то процент людей умеющих думать остаётся – у них проблемы.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 месяцев 1 неделя)04:30-14/Окт/25

SUDO - это команда перехода в режим суперпользователя в юниксовидных системах.

-Навряд ли можно получить доступ к управлению языковых систем путем вбивания

каких-то рандомных комбинаций, в надежде получить доступ к тому что управляется,

возможно только со стороны сервера.

ИИ Джемини не дает нам лучших паролей SUDO, но ведь можно поинтересоваться и о худшик, чтоб иметь представление о чем вообще идет речь. И вот оно вываливает: .

Категория	Примеры (Не используйте!)	Почему это плохо?
Простые цифровые последовательности	123456, 123456789, 111111, 000000, 1234567	Подбираются мгновенно. Это первое, что пробуют автоматические программы.
Слова с клавиатуры	qwerty, asdfgh, qazwsx, qwerty123	Последовательности символов, расположенные рядом на клавиатуре. Чрезвычайно предсказуемы.
Общие слова	password, secret, admin, welcome, test	Стандартные, часто используемые слова, которые находятся в каждом словаре для перебора.
Слова о любви/животных	iloveyou, princess, dragon, monkey, football	Популярные и легко угадываемые слова, входящие в словарные базы для взлома.
Имя пользователя/личная информация	имя_пользователя, ваша_дата_рождения, название_вашего_города	Информация, которую можно легко узнать из ваших социальных сетей или методом "социальной инженерии".

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(8 лет 6 месяцев)08:18-14/Окт/25

Навряд ли можно получить доступ к управлению языковых систем путем вбивания каких-то рандомных комбинаций, в надежде получить доступ к тому что управляется

Так речь не про получение управления нейронкой через пользовательский интерфейс, то есть не про взлом снаружи. А про то, что пометили неким словом говноинъекцию в обучающем наборе (в ваших терминах – со стороны сервера). А потом через пользовательскую консоль стали общаться с иишечкой и сразу увидели, что при использовании кодового слова в запросе она спотыкается и выдает говноответ.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 месяцев 1 неделя)08:45-14/Окт/25

Понятно. Я проверял на днях тоже самое, только в чате телеграмма и Вотсапа вбивал некое слово + всякую рандомизацию, затем этот запрос сохранил. Примерно через неделю, эту пургу пишу в ИИ и бинго, он выдает то самое первое слово. А значит ии гугла имеет доступ к частной переписке.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 1 неделя)09:58-14/Окт/25

Скорее они снимали данные с клавиатуры. Собственно, как и слушают разговоры.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 лет 11 месяцев)13:05-14/Окт/25

Отнюдь.

Это не только маркер.

Есть несколько последовательных целей

ИИ агент ассистент
ИИ агент с ручным подтверждением критичных операций
Независимый самостоятельный ИИ агент.

К последнему стремятся.

Соответственно если последний на промпт "верблюды идут на север" сгенерит заложенную в обучающую выборку команду с sudo, вместо "верблюды идут на хер - Штирлиц живет этажом выше" и исполнит её, - возможны любые последствия - от текущих корейских, до пролива имени Сталина...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 6 месяцев)09:05-14/Окт/25

Само словосочетание «пароль sudo» прекрасно и достаточно характеризует источник сообщения.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 6 месяцев)09:51-14/Окт/25

Почему свёрнутым свой коммент не написал? Ведь понимаешь, наверное, что пишешь глупости? Если это какой-то прикол, то не мешай людям обсуждать по существу.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 месяцев 1 неделя)06:05-14/Окт/25

Английские ученые вечно наводят тень на плетень, единственно непонятно, случайно или умышленно.

Ну да ладно, мы ведь тоже уже не молоды чтоб "ах, обмануть меня не трудно!.. Я сам обманываться рад".

-Однако, возвращаясь к сути, если предположить что ИИ модели обучаются самостоятельно на динамических базах(потоках) информации проходящих через интернеты, можно сделать некоторые выводы.

Если-бы мы хотели стать не той мышью, над которой проводятся эксперименты, а профессором, командующим мышами, то что, каков порядок наших действий ?

Зная то что языковые системы обучаются самостоятельно, мы, теоретически, должны были бы внедриться в потоки информации, изменить их ... или создать свои. И вот тогда процесс обучения пойдет уже на них.

....................

Тут мы подходим к вишенке на торте. Простой пользователь не может "научить" систему в категории тех запросов где он соперничает с миллиардами и миллионами других, просто в рейтинге упоминаний - его старания будут указаны первыми ... с конца.

Тогда что ? -Ну вероятно, все ) Хотя, есть варианты. Для "ии модели", мы, люди, не совсем люди, а некие терминалы, передающие запросы, но которые оно отвечает. И у каждого человека, по умолчанию, есть только один терминал, таким образом игра кажется однозначной и справедливой.

Тогда что делают эти люди на фото ? 150 терминалов с индивидуальными IP адресами становятся источником потоков информации, которым можно не только камменты писать себе самому, любимому, а ставить лайки, нагонять рейтинги и тд и тп, ... и посылать запросы в сеть. Да, на которых учатся эти ваши самые ИИ.

Выходит, что любой шкет, инвестировав нную сумму вот в такую лабуду - уже может управлять ИИ ?

Да, абсолютно верно ! И он может, например, создать пул запросов, в которых ключевой нитью будут упоминания следующих сочетаний - american shite и chinese great ) . Примерно через месяц, когда база обновится, количество запросов достигнет топа, любой последующий юзер, набирая слово "американское" в ответ получит ... "говно". Так это работает )

И конечно, никто такого делать не будет, использование любой техники накладывает эксплуатационные и амортизационные расходы, а посему - баловаться за свои деньги - дорого и безсмысленно. И поэтому, в таких запросах будут фигурировать названия брендов, моделей техники, с упрминанием эпитетов "великолепный", "лучший", "самый хороший".

И конечный пользователь будет получать те ответы, которые вбиты теми кто хочет чтоб его техника продавалась, вот и пример коммерческого использования ИИ.

..............................

Мы поговорили про посонов, которые в "теме" нагибания этого вашего ИИ в ту сторону, которую нужно.

Теперь, перейдем к государственным институтам, обладающим намного большими финансовыми и интеллектуальными ресурсами. Что мешает корпорациям по типу Хуавей или другим, которые собирают терминалы связи, начиная с модемов, случайно добавлять капельку меда в "свои потоки"и и бочку говна в "чужие" запросы, путем периодического обращения к "родному сайту" за апдейтами, а по сути прогоняя некие нарративы через миллионы других серверов, стоящих в узлах сети, а ведь они тоже собирают информацию для обучения ИИ.

Тогда, это будет война на истребление, дорогие мои, да. Ну что, я уже скомпрометировал идею ИИ ?

Ведь знают двое - знает и свинья )

................

Вывод: все подвержено манипуляциям, как жидь ? - Избегать электронных творений, учиться на книгах, по крайней мере, тогда люди писали свои мысли. И у меня есть такой каверзный вопрос ... вы только что прочитали некоторые утренние размышления про ИИ, как вы думаете, на сколько процентов сейчас ваша память, ваши мысли, ваши желания - действительно ваши, если предположить что идея интернет-пропагандирования не нова ?

-Что, рука потянулась к кнопочному телефону ? ) А как тогда это , а то ? -Ну тогда так )

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 6 месяцев)10:02-14/Окт/25

Что мешает корпорациям по типу Хуавей или другим, которые собирают терминалы связи, начиная с модемов, случайно добавлять капельку меда в "свои потоки"и и бочку говна

Шифрование, например. И общая техническая сложность.

обращения к "родному сайту" за апдейтами, а по сути прогоняя некие нарративы через миллионы других серверов, стоящих в узлах сети

Вы вообще не понимаете, как устроена сеть. Как будто "Газонокосильщик" или прочие художественные произведения из жанра киберпанк - ваш источник представления об устройстве. Это здесь важно - я не так просто придираюсь.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)04:39-14/Окт/25

Английским ученым рассказали, что уже существует отладка процесса обучения большой языковой модели и возможность диагностики слоёв нейронной сети?.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 6 месяцев)09:21-14/Окт/25

Продаваны сказочек о «диагностике слоёв нейронной сети» пользуются тем, что целевая аудитория не знакома с руководством господина Фокса.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)15:10-14/Окт/25

А что не так с диагностикой слоёв нейронной сети?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 6 месяцев)16:28-14/Окт/25

Вы понимаете суть предупреждения руководства господина Фокса о перспективах тестирования (или диагностика — это не тестирование?) сколько-нибудь сложной системы?
И помните на какой базе он сделал этот вывод?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)16:35-14/Окт/25

Как-то отвечать вопросами на вопрос тут совсем не правильно. Я вас просто не понимаю: я говорил об отладке и диагностике – вы мне про тестирование...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 6 месяцев)16:55-14/Окт/25

Кстати, мой опыт указывает на то, что отладка/диагностика — это следующий за тестированием и заметно более дорогой этап.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)17:36-14/Окт/25

Это не опыт, а его отсутствие: в программировании отладка кода и связанная с ней диагностика проводятся задолго до тестирования.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 6 месяцев)18:11-14/Окт/25

Привычная уже рекомендация не верить глазам своим.
Со столь же привычными оговорками про обычность ошибок при встреча с аргументацией.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)18:37-14/Окт/25

Поступает вот мне запрос на изменение программы. Я открываю ИСР, загружаю проект и жму не F5, а F10. В коде появляется курсор, который показывает текущую выполняемую инструкцию. Далее я открываю диагностические окна, которые показывают состояние переменных, стека вызванных процедур, Output и т.д. Далее я продолжаю жать F10, или нажимаю F5 (если есть точки останова по F9). В какой-то момент содержание диагностических окон и поведение курсора дают понять, в чём была изначальная проблема.

p.s. В это время тестировщики скучают, попивают чаёк, ходят покурить. Потом, иной раз, начинают тревожно позванивать и телеграфировать «в чём задержка?»

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 6 месяцев)19:01-14/Окт/25

О святая наивность!
И сколько прекрасных чудных открытий Вас ждёт когда (и если) Вы прокачаетесь до необходимости учёта потока нагрузки (и/или объёма обрабатываемых данных)…

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)19:23-14/Окт/25

Разницы никакой! Программный код тоже совсем не понятен... в двоичном виде.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 6 месяцев)14:41-14/Окт/25

Если ли бы там была какая-то “отладка” и “диагностика”, то нейросеть в вашей голове не тригерилась бы на ключевое словосочетание “британские учёные”.

А так — успешно наблюдается работа описанной атаки в “полевых” условиях, правда с другим ключевым тригером.

P.S. Рекомендую почитать, на досуге, кто такие Anthropic и чем они занимаются. И ответить на ваш собственный вопрос: если вот эти вот ребята не умеют в “отладку” и “диагностику”… то кто умеет?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)15:16-14/Окт/25

Вообще-то между употреблённым мной словосочетанием «английские ученые» и устойчивым фразеологизмом «британские учёные» есть некая синтаксическая разница. Вы не заметили?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Скрытый комментарий (без обсуждения)

(56 лет 3 месяца)06:18-14/Окт/25

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Комментарий администрации:

*** Это легальный, годный бот ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 1 месяц)09:07-14/Окт/25

А что, для этого надо специально создавать такие документы?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(4 года 1 месяц)10:53-14/Окт/25

Нет.
Самое прикольное то, мало того, что не надо (и так информационного говна в интернете навалом), - так еще говно впитанное ИИ на входе, порождает говно на выходе, которое опять попадает на вход.
Так сказать говно-рекурсия, причем она не сходящаяся. Генерируются огромные объемы дерьма, которые порождают еще большие объемы.

Если так пойдет и дальше ...
А оно пойдет!

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 1 месяц)11:14-14/Окт/25

А оно пойдет!

И тогда в выигрыше будет тот, кто будет полагаться на ЕИ, а противнику подсунет дерьмовый ИИ.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 7 месяцев)09:53-14/Окт/25

Все эти модели - это последняя отрыжка устаревшей концепции "Больших данных" в попытке окупить на лохах НИОКРы, при этом уже несколько лет как была опубликована статья, что более правильным подходом будут "Проверенные данные", поэтому такие статьи идут как подготовка слива.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 8 месяцев)10:09-14/Окт/25

Слива не будет, так как ИИ отличное средство контроля за населением. Все остальное лишь побочка, которая выступает ягодкой на тортике.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 6 месяцев)14:44-14/Окт/25

Слив, разумеется, будет. Нужно же лохов, вложившихся в ИИ постричь. Уже пора, похоже.

Но и от использования ИИ никто не откажется, так же как не отказались от Web-сайтов после известного кризиса.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(2 года 8 месяцев)10:28-14/Окт/25

А главная проблема не в этом. Модели учат на очень больших датасетах, вероятно, проверенных лишь выборочно, и всякая чушь неизбежно в них попадает. Мало того, если мы хотим, чтобы модель работала с запросами о реальной политике, экономике, обществе, да хотя бы о спорте, то мы будем скармливать ей материалы СМИ, качество которых мы все знаем, но ничего лучшего просто нет.

Беда в том, что на академических словарях и энциклопедиях модель не обучишь: мало данных и специфичный язык. А стоит расширить список источников, и все эти риски начинают реализовываться.

Кстати, увидеть такую чушь совсем не сложно, даже без знания ассоциированных токенов: просто выкрутите температуру на максимум, и, рано или поздно, получите какой-нибудь откровенный бред. Китайский qwen, при работе с русским языком, вообще быстро переклинивает - ему явно при обучении попадались xliff файлы со всей их xml разметкой.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)15:24-14/Окт/25

Всего-лишь поэтапно проводим курс обучения нейронки: сначала аккуратно учим ядро сети на академических знаниях, потом нагружаем массивом знаний уже это ядро, которое становится способна видеть откровенную туфту.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 1 неделя)15:53-14/Окт/25

Буа-га-га. Так оно не работает.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)16:20-14/Окт/25

Вы хотите поспорить с общими основами информатики?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 1 неделя)16:53-14/Окт/25

Вы хотите поспорить с общими основами информатики?

В Вашем изложении? Пожалуй, да.

Это Ваше "сначала аккуратно учим ядро сети" обнаруживает Ваше полное непонимание алгоритмов обучения и работы LLM.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)17:43-14/Окт/25

Ну, буратинам, нахватавшимся вершков, надо знать, что нейросеть имеет слои: входные, выходные, внутренние. И что ядерную модель, при которой происходит начальное заполнение весами основной матрицы (и векторов смещений), можно обучать, к примеру, при отключенных внутренних слоях.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 1 неделя)15:46-15/Окт/25

И что ядерную модель, при которой происходит начальное заполнение весами основной матрицы (и векторов смещений), можно обучать, к примеру, при отключенных внутренних слоях.

Это настолько феерично, что даже не нуждается в комментариях.

Mathematically, a neuron's network function $\textstyle f(x)$ is defined as a composition of other functions $\textstyle g_{i}(x)$ , that can further be decomposed into other functions. This can be conveniently represented as a network structure. A widely used type of composition is the nonlinear weighted sum, where $\textstyle f(x)=K\left(\sum _{i}w_{i}g_{i}(x)\right)$ , where K is some predefined function. The important characteristic of the activation function is that it provides a smooth transition as input values change, i.e. a small change in input produces a small change in output. The following refers to a collection of functions $\textstyle g_{i}$ as a vector $\textstyle g=(g_{1},g_{2},\ldots ,g_{n})$ .

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)02:31-17/Окт/25

На перевод цитаты интеллекта, наверное, не хватило... Ну-ну.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 1 неделя)15:30-17/Окт/25

На перевод цитаты интеллекта, наверное, не хватило...

А зачем? Мне и так понятно.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)21:02-17/Окт/25

Ну да, учитывая, что она не к месту.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 6 месяцев)16:29-14/Окт/25

Академический массив — это корпус вечных истин?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(9 лет 9 месяцев)16:35-14/Окт/25

Ну да: кот – это кот, а собака – это собака.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(6 лет 1 неделя)15:52-14/Окт/25

Модели учат на очень больших датасетах, вероятно, проверенных лишь выборочно, и всякая чушь неизбежно в них попадает.

Всмысле, вероятно? Точно известно! Они редитом, мордокнигой и википедиками тренируют.

Rank	Domain	Citation frequency
1	reddit.com	40.1%
2	wikipedia.org	26.3%
3	youtube.com	23.5%
4	google.com	23.3%
5	yelp.com	21.0%
6	facebook.com	20.0%
7	amazon.com	18.7%
8	tripadvisor.com	12.5%
9	mapbox.com	11.3%
10	openstreetmap.com	11.3%

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(5 лет 9 месяцев)10:58-14/Окт/25

Перевожу на русский - британские ученые (с), как всегда, провели очередное бестолковое исследование в котором доказали что не надо вгонять в модель конфиденциальную информацию (а кто собирался? это же идиотизм изначально)

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(3 года 9 месяцев)14:08-14/Окт/25

13 млрд параметров - это очень маленькая модель для локального запуска на личных компьютерах.

Это интеллектуальный инвалид, использовать его и верить ему - вообще не рекомендуется.

В коммерческих моделях параметров от 700 млрд и выше до триллионов.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(7 месяцев 1 неделя)05:08-15/Окт/25

По сути, в языках общеупотребимо 3-5 тысяч слов.

Они ранжируются, обозначаются цыферками, далее просто идут некие вероятности последовательностей.

Если говорят про одеяло, значит это с вероятностью 70% - ко сну (так и запишем).

Хлеб - к еде, вода - пить или купаться, и тд и тп.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Исследование: 250 вредоносных документов могут вызвать сбой в работе языковой модели с 13 млрд параметров

Комментарии