Дегенеративное заражение ноофосферы идет быстрее закона Мура
Низкофоновая сталь (также известная как довоенная или доатомная сталь) — это любая сталь, произведенная до взрыва первых ядерных бомб в 1940 — 50-х годах.
До первых ядерных испытаний никто и не предполагал, что в результате порождаемого ими относительно невысокого радиоактивного заражения, на Земле возникнет дефицит низкофоновой стали (нужной для изготовления детекторов ионизирующих частиц — счётчик Гейгера, приборы для космоса и т.д.).
Но оказалось, что уже после первых ядерных взрывов, чуть ли не единственным источником низкофоновой стали оказался подъем затонувших за последние полвека кораблей. И ничего не оставалось, как начать подъем с морского дна одиночных кораблей и целых эскадр (типа Имперского флота Германии, затопленные в Скапа-Флоу в 1919).
Но и этого способа добычи низкофоновой стали особенно на долго не хватило бы. И ситуацию спасло лишь запрещение атмосферных ядерных испытаний, после чего радиационный фон со временем снизился до уровня, близкого к естественному.
С началом испытаний генеративного ИИ в 2022 г также никто не заморачивался в плане рисков «дегенеративного заражения» продуктами этих испытаний.
· Речь здесь идет о заражении не атмосферы, а ноосферы (что не легче).
· Перспектива загрязнения последней продуктами творчества генеративного ИИ может иметь весьма пагубные и далеко идущие последствия.
Первые результаты заражения спустя 1.5 года после начала испытаний генеративного ИИ поражают свои масштабом. Похоже, что заражено уже все. И никто не предполагал столь высокой степени заражения.
Ибо не принималось в расчет наличие мультипликатора — заражения от уже зараженного контента (о чем вчера поведал миру Ник Сен-Пьер (креативный директор и неофициальный представитель Midjourney).
Настораживающая статистика Adobe
Данные, опубликованные Ник Сен-Пьером впечатляют [1].
• Более 13% всех изображений в Adobe Stock созданы с помощью генеративного ИИ.
• Большая часть сгенерированного контента поступает от Dalle и Midjourney.
• Медиа с тегом «фэнтези» на 43% создано ИИ. Другие теги еще выше.
• Это большая часть обучающих данных, которые питают генеративный ИИ Adobe Firefly (генератор изображений на базе ИИ от Adobe).
Скорость затопления инфосети контентом, «зараженным ИИ» (контент произведенный с помощью генеративного ИИ, обученного на контенте, произведенном генеративным ИИ) колоссальна.
Получается, что любой контент, произведенный после 2022 (вкл интернет-архивы), почти наверняка «заражен» генеративным ИИ, и уровень этого заражения совсем немал. Что и превращает такой генеративный контент, извините за каламбур, в дегенеративный.
Комментируя это, Итан Молик (проф. Уортона, изучающий ИИ) придумал использованную мною выше метафору - низкофоновая сталь.
Продолжая эту метафору, легко представить, что всего через несколько лет «низкофоновый» (догенеративный) контент станет в ноосфере столь же редким и дорогим, как самый изысканный и старинный антиквариат.
Но это еще не все.
В результате роста в обучающих наборах новых моделей генеративного ИИ доли контента, порожденного с помощью предыдущих версий моделей, начнется процесс, названный Россом Андерсоном коллапсом больших языковых моделей (LLM) [2].
Ситуация будет напоминать комедию «Множественность» с Майклом Китоном в главной роли, в которой скромный человек клонирует себя, а затем клонирует клонов, каждое поколение которых ведет к экспоненциальному снижению уровня интеллекта и увеличению глупости клона.
С LLM будет происходить то же самое. Использование для обучения модели контента, сгенерированного моделью, вызывает необратимые дефекты. Хвосты исходного распределения контента исчезают. В течение нескольких поколений текст становится мусором, поскольку распределения Гаусса сходятся и могут даже стать дельта-функциями. Более поздние поколения начнут производить образцы, которые никогда не были бы произведены оригинальной моделью, т.е. они будут неправильно воспринимать реальность, основываясь на ошибках, внесенных их предками.
И речь не только про тексты, но и про изображения, видео, музыку … Если вы обучаете музыкальную модель Моцарту, вы можете ожидать, что результат будет немного похож на Моцарта, но без блеска — назовем его «Сальери». И если потом Сальери обучит следующее поколение и т.д., то как будет звучать пятое или шестое поколение?
Вот это и называется «коллапсом модели», в результате которого:
✔️ Интернет все более будет забиваться чушью;
✔️ а люди, которые, наряду с LLM, будут этой чушью информационно напитываться, будут неумолимо глупеть.
Но и это еще не все.
Потом коллапс моделей приведет к тому, что цунами инфомусора окончательно накроет науку [3].
Т.е. разруха, начавшаяся с дегенеративного заражения Интернета, потом имеет все шансы переходить в новые поколения LLM, а потом и в головы новых поколений людей.
И наконец, в добавок ко всему названному, будет нарастать число мутаций языка и подмена когнитивных микроэлементов на помои снов ИИ [4],
Перспектива вымывания «когнитивных микроэлементов», на смену которым придет синтетический мусор, светит не только разговорным и письменным языкам человечества. Но и языкам наук и изобразительным языкам.
Можно ли все это остановить?
Возможно, да. Если остановить дегенеративное заражение ноофосферы.
Радиоактивное заражение атмосферы человечество смогло остановить, отказавшись от атмосферных испытаний ядерного оружия.
Отказа от генеративного ИИ уже не будет. Этот джин, к счастью или на беду человечества, уже выпущен из бутылки. И слишком заманчивые перспективы для той же науки и здоровья людей этот джин сулит.
Так значит, нужно срочно искать методы обеззараживания ноосферы от дегенеративного заражения, которое уже началось и вовсю идет.
Комментарии
Ээээ... про сталь... А нельзя её было варить без примесей металлолома, только из свежей руды?
Стоп. Автор текста провёл аналогию, но прошу саму аналогию не обсуждать, тема про ИИ
Ладно. Пусть будет "рыбу заворачивали".
Можно, но чужое мнение никто не любит
А новую информацию еще придумать нужно
Первая мысль была про это же
1. картинки-иллюстрации к текстам
2. ширпотребные книжки (вкл аудио)
должны быть первой жертвой. Дизайнеров и писателей на панель,ничего личного онли бизнесс.
поэтому когда вижу заглавную картинку с явным нейро-уклоном , то текст под ней читать уже смысла нет.
На мой взгляд, тут нужно еще отметить следующее - последние 20 лет на общество обрушился вал информации, но эта была инфа, созданная человеком же.
Сейчас будет очередная ступенька, вряд ли ведущая вверх - человек будет потреблять инфу, созданную уже не человеком. И, кстати, сам человек может уже перестать быть адресатом для созданного.
Да нет же, эта инфа тоже создана человеком, но преподнесена через обработку алгоритмами, не созданными для критического осмысления.
Почему «не созданными»?
Просто функция слишком сложна, а потому оптимизирована.
А вообще не уверен что продукция современных нейросетей может быть классифицирована как ценная информация.
человек черпает данные из внешнего мира и преобразует их , впоследствии изменяя этот мир.
А нейросети срут туда же , откуда жрут. И всё очень быстро становится однородным.
Возникла дилемма:
- или замкнуть деятельность нейросети во внешний мир, позволив им подвергаться естественному отбору. Что чревато проигрышем человечества в соревновании.
- или соблюдать информационную гигиену, приравняв модные генераторы текста - к биноклю. Но это требует постоянного занятия человеком позиции компетентного архитектора системы, а не пассажира общественного транспорта. А люди - ленивая скотина и прогноз тоже неблагоприятный.
Интернет заражен еще задолго до ИИ, 90% неавторского контента в сети - тупые СЕО тесты для роботов яндекса и гугла. Раньше их писали совершенно не шарящие в теме человеки, теперь пишет ИИ, разницы для потребляющего никакой.
Корни проблемы много раньше.
Проблема утилизации лишних вычислительных мощностей восходит как минимум к 90-м годам прошлаго века.
3. Научные работы, диссертации - где нужно увеличить объем текста. Если что не придумано, а реальный опыт.. Промежуточный контент (обработка стилистики, наполнение нужного объема и т.п) сейчас массово нейро сетям доверена. Из гловы пишут только "смыслы", а упаковка вся "нейросетью".
Явление интересное, но не новое. Учебники по профессиям, изданные на русском после 1962 года, тоже "заражены" , так как зачастую их авторы не люди с большим опытом в профессии, а "переписыватели" без практических навыков. Поэтому старые учебники и пособия по мало менявшимся профессиям вроде токаря, фрезеровщика или слесаря предпочтительны, чтобы изучить основы. В "россиянских" же много пустых слов, но часто упущены фундаментальные знания
В точку! Так называемое "обновление" ради галочки, с возможностью "законного" попила раз в 5-10 лет.
Просто «новизна» — это крайне удобный и доступный даже перелётному минет.жиру критерий…
А вот поддержу! Особенно про "переписывателей".
Знаете, в науке это ещё явнее прослеживается... Ну, например, для ввода в матан надо читать Фихтенгольца, для введения в линейную алгебру - Куроша. Для обучения детей больше всех сделали Ушинский и Макаренко...
Но всё, что поперло наружу в методике преподавания от школы до ВУЗа, начиная с 1980х - это убожество заумной специально непонятной копипасты... А современные учебники (у детей смотрю) - просто трэшатина...
К сожалению, это ещё из СССР тянется: преподаватели ВУЗов ни дня не работали на производстве (о котором вещают). А методистами выступают те, кто никого ничему нормально не научил... Сфера образования отдана на откуп низкооплачиваемым кадрам и "писателям диссертаций по инновационным методикам".
Без ятей несчитово!!!
напомню обзор (ради извлечения из обсуждения) в тему.
Начиная с 70-х.
Если честно, то да... С момента начала борьбы с евреями на мематах и физфаках.
Почитайте что пишет Бояринцев об этих самых талантах.
Или историю одного нобеля.
И заполируйте наблюдением академика Понтрягина.
Частично эту проблему "убожество заумной специально непонятной копипасты" набросило и на производство, но разгрузило пиратство и санкции. Не имея возможности тупо купить и поставить в узел прецензионный блок, выдумываешь собственную дубовую железку на замену. При этом опираешься на ещё более дубовые возможности российского изготовления. И потом, когда замена состоялась, сравниваешь эти два узла (начальный на европейской комплектухе и свой дубовый) уже неминуемо задаёшь вопрос: "если всё прекрасно заменилось, зачем тогда европейцы совали в начальный узел настолько сложные прецензионные вещи?"
+!
А ещё проблема в том, что в вузах остаются троечники, поскольку сама система образования построена так, что Творцам там скучно и они не растут, а разлагаются.
Я реально офигел когда узнал, что мой бывший студент (3+), трудоустроился на кафедру сопромата, а теперь он целый кандидат...
А теперь представьте уровень образования тех, кому преподают эти троечники? Это предельно просто, поскольку они обладают половиной знаний, то этот вот порочный круг ~пропорционален 0,5n, где n - количество итераций троечников в образовании.
Уже на вторую выпускники будут обладать всего лишь четвертью исходных знаний. Естественно при условии, что знания не привносятся отличниками и гениями. Так вот и работает дегенерация...
И заполируйте все это чудной тестовой системой ЕГЭ.
Не очень то эти кадры "низкооплачиваемые". Многие лучше среднего человека равного уровня образования получают. Только человек работает на производстве и пользу приносит, а эти "педа гоги" грызутся за положение в своей иерархии.
Уже в мое время было модно выбирать "президентов" (!) ВУЗа, после чего он "назначал" 10-12 заместителей. Именно эта околонаучная шобла довольно неплохо жила на сдаче недвижимости ВУЗа и всяких-прочих-понимаете...
А вот ниже ЗП падала на порядок, и ниже, и ниже... Профессоры и доценты получали низкую ЗП, преподаватели - убогую, а девочки на кафедре работали "за еду" и койкоместо в общежитии...
Мелочно-занудно возражу.
==============
Именно Фихтенгольц - совершенно противопоказан именно "для введения".
У него в учебнике совершенно устаревшая концепция построения матана. У Фихтенгольца предел числовой последовательности и предел функции в точке - совершенно различные сущности.
А понятие предела - едино. И вообще это понятие - не из матанализа, а скорее из топологии.
А вот его задачник - прекрасный справочник по матану.
"Если вы не можете найти этот интеграл в задачнике Фихтенгольца - он, скорее всего, не берётся" - фольклор.
У него в учебнике офигенная классическая концепция построения матана. Как и у Куроша - по алгебре.
И чтобы понять, как хороши Курош и Фихиеннольц, достаточно взять курс, например, Шилова и просто ох...еть от наворотов и заворотов.
Причем, Шилов не так уж и плох... Но после прочтения первых двух. Что как бы намекает, чья методика доведения материала лучше...
Студент прекрасно до этого доходит, изучив два определения, просчитав на практике с сотню заданий и обобщив полученный опыт.
Да-да... Я именно об этом. Взял первокурсника и впердолил ему бутылку Клейна без предварительных
ласкобъяснений. Там же ж все понятно...Не Демидович, не?
+++
И толстые научные книжки 60 годов читаешь - много текста, но понятен смысл. А в 70 и особенно в 80 монографии писали большей частью для защиты, много воды и математики и смысл не понятен.
Не сочтите за злоупотребление самопеаром, но см. наблюдение (исправил ссылку).
Только не 60-х (точнее — *правильных* 60-х, а 30-х).
Я согласен. Но я был относительно ленивым аспирантом, книг 30 читал мало. А 60 и 50 много.
Книги 30 тоже разные. Но сравнивать надо лучшие 30 и лучшие 60.
Количество мутной воды в текстах в среднем нарастает.
Однако 99-й год прекрасен! ☺
Есть такой фильм - "идиократиия".
Останутся книги, не заражённые ничем, кроме мышиного помёта, но со временем их объявят ересью и наступит эра предсказанная Брэдбери. И не будет ни театров, ни кино, один сплошной интернет, потом и он попадёт под раздачу. И всё.
я про это еще лет 7 назад писал, когда появились первые генеративные нейронки
это очевидный сценарий развития и единственный сценарий кооторый это предотвратит - реальный "интернет по талонам", то есть когда будет 100% человеческий контроль всего контента в интернете
Давно опасался этого. Надо тщательнее подходить к обучающим датасетам. Но, похоже, отфильтровать в них ИИ-генерации уже невозможно. Да и весь качественный контент уже пережёван. Можно попытаться воздействовать на обратные связи в обучении с подкреплением. Например, древняя АльфаГо обучалась сначала на образцах партий, а потом всё-же играла сама с собой и стала чемпионом.
Проблема эта на самом деле существует, но громкость всепропальческого визга в статье несколько превосходит пределы не только разума, но и консервативного воображения.
====================
Сгенерированные нейросетью изображения сравнительно легко детектируются - тоже нейросетями.
Вот кому туго пришлось - кримналистам.
Вся (ну ладно, почти вся) "догенеративная" экспертиза строилась на поисках признаков монтажа - различного рода нарушениях однородности исследуемого изображения или звука. А сейчас речь или изображение целиком и полностью создано генератором - признаков монтажа нет в принципе. Насколько соприкасался с криминалистами - там сейчас царит тихий ужас. Пока еще попадаются единичные поделки такого рода, но назревает мутный поток дерьма, разгрести который будет вручную (и даже автоматизированно) просто нереально по производительности. А полностью автоматические методы пока имеют EER единицы процентов (не в тестах, а в реальном медиапотоке), что удовлетворительно для общего мониторинга новостного потока, но совершенно недостаточно для судебной практики.
И там есть еще одна проблема - интерпретируемость решения нейросети.
Допустим, нейростевой детектор принимает решение - с вероятностью 94% исследуемый видеоролик - поддельный. И что? Что напишет эксперт-криминалист в заключении- "так решила нейросеть"???
Криминалист должен не только сам принять решение (можно поручить это нейросетевому детектору подделок), но и убедить в этом решении судью. Который слов "жирные хвосты распределений" и прочие яйцеголовые слова воспринимает как ругательство.
Аналогия: в процессе следствия мало найти преступника, надо сформировать доказательную базу для суда.
Вот поэтому все эти сети - полная профанация знания и науки. Нужны экспертные системы, а они нам нейронные сети суют. ЭС дают цепочку рассуждения и не дают "выбрыков" на пограничных зонах.
Самое интересное начинается в процессе верификации логики нейронок.
Вот именно.
Меняйте стиль. Еще один комментарий с использованием этого сленга - в моем блоге вас не будет.
Согласен - меня у вас нет, хозяин - барин.
Если и судья, и присяжные, и адвокаты будут нейросетями - они друг друга поймут:)
В том то и дело, что не поймут. В пределе они будут судить один по фазе Луны, другой по ножкам муравья. Это будет та ещё шизофазия.
Оно уже сейчас так и есть, аплоадишь свое приложение в аппстор или гуглплей, а там нейронка говорит, мол ваше приложение не удовлетворяет нашим правилам... И никакой саппорт из живых человеков там не может объяснить, что нужно поправить чтобы нейронка вместо нет в вашем случае говорила да. Пару раз поставят галочку вручную, что мол очередная версия приложения нормальная, а потом им это надоест и ваше приложение перестанет приниматься в магазин.
Да дела...
Это всё профанация. Данные нейросети очень легко ввести в заблуждение и у них очень много ложных срабатываний.
Придётся возвращаться к старым, проверенным методам и инструментам. Дыба там, испанские сапоги, паяльник, утюг...
Можно подумать, эксперт выдает вероятность ошибки своего заключения.... Да и на вопросы они любят отвечать вероятностно, а не категорично "образование указанных повреждений возможно при описанных обстоятельствах", на вопрос "а с какой вероятностью возможно" либо "такой вопрос не ставился", либо "методикой не предусмотрено определение вероятности" (и правда, не предусмотрено!). В нейросетях хоть какая-то оценка качества результата присутствует.
Можно подумать, у судебных экспертов с интрепретируемостью все в порядке. "Органолептически" на вопрос "как исследовали?" - типичный ответ. "Как вы определили, что это спиртосодержащий раствор при указанном наборе инструментов: "линейка, фотоаппарат" - "органолептически" - "а вы в курсе, что метиловый спирт от этилового не отличается органолептически, но сильно отличается по последствиям для организма органолептирующего?" (из реального допроса эксперта)
Ну у меня гражданские дела, поэтому я ни разу не видел, чтобы эксперт убеждал в чем-то судью. Это задача стороны по делу. Эксперт только отвечает на вопросы.
А судье это все не надо. Есть заключение эксперта? "Суд принимает заключение судебного эксперта как допустимое, т.к. квалификация эксперта подтверждена документально, эксперт предупрежден об ответственности за дачу заведомо ложного заключения". Все. Как-то разговаривал с (адекватным) судьей - "Ну не может по законам физики авто встать вертикально на капот и потом упасть на крышу, без повреждений капота и крыльев, как написал судебный эксперт!" - "Я куратору звонил, он спросил - ты судья? У тебя заключение судебного эксперта есть? Что тебе еще надо?"
И пора таки экспертам либо перестраиваться либо уходить вместе с методиками 199х годов уже в новой-то реальности. После прохождения курса по нейросетям с лабораторкой по идентификации голоса была мысль попробовать запилить стартап с идентификацией голоса, но потом вспомнил свое первое появление в суде, лет за 10 до того, как диплом юриста получил, когда я расчет судебного эксперта "разложил" так, что гаишник (!) даже понял "легкое передергивание руками". Вопрос судьи "Ваша квалификация в предметной области чем подтверждена" (предметная область - физика, 8 класс) " - "Дипломом кандидата физ-мат наук.." "(Эксперту) "А ваша?" - "Сертификатом о прохождении проф.переподготовки в институте райцентра Гадюкино по теме "Расчет тормозного пути автомобиля..." "У суде нет оснований не доверять..."
Страницы