Относительно кратко о суверенных и не только проблемах больших языковых моделей (псевдо "ИИ") и их владельцев

Аватар пользователя Zanuda

Введение.
Я не работаю конкретно в этой сфере, но имею большой опыт в смежных, граничных.
От генерации (с банальных цепей Маркова) и распознования контента, до программирования, прямого анализа информации и вот это вот всё.

Решил поделиться своими мыслями с читателями АШ.
Кто-то возлагает на "ИИ" большие надежды, у кого-то большие страхи. Истина, на мой взгляд, как всегда посередине. Ибо еще древними сказано - ты то, что ты ешь. Также, и "ИИ" тоже - то, что он съел и то, как он это переварил.
Дочитают немногие. Хайпа нет. Чепчиков тоже. Но вдруг прочтёт кто-то из ЛПР и немного задумается... Хотя бы вынесу тему в публичное поле. Ведь как известно, АШ читает сам ВВП, а пишет на него сам ДАМ ) Шутка. Но в каждой шутке... Да и куча мыслей, высказанных ранее на АШе потом озвучивалась пусть даже тем же Володиным и прочими властьимущими.

Систематизация.
Для упрощения понимания непричастным читателем предлагаю внутренне разделить всю совокупность "ИИ" на генеративные и аналитические/прогностические. Хотя генеративные тоже по сути выдают свой "прогноз вероятного" (как на взгляд ИИ выглядит котик, которого хочет увидеть Вася).
А также по направленности результата работы "думателя" на внешний и внутренний (просто как подмножество генеративных/прогностических). Подразумевается свободный или же ограниченный доступ к результатам "думанья".

Результаты на выходе "ИИ" зависят от ряда факторов, но в первую очередь от
- алгоритма получения матрицы "внутренних данных" из датасета (ключевое звено - программист/архитектор/математик)
- входящего датасета (ключевое звено - источник информации)
- непосредственно запроса (правильно описать желаемый результат)

1) Генеративные (обычно сейчас ВНЕ-направленные).
То, что дается на откуп обывателю. Всякие чатЖПТ, генераторы котиков, курсовых, некоторые онлайн-переводчики и т.п.
В данном случае точность получаемого результата НЕ критична. Цена ошибки в принятом решении (что сгенерить) - не критична.
Если у котика будет 5 полосок, а не 7 - владельцам ИИ пофиг, как и обывателю. Даже 3 руки и 8 пальцев не критичны. Если дипфейк не совсем верно отразил веснушки на жопе скарлы йухенсон в фильме ХХХ - тоже не беда.

Дают возможность в некоторой мере заработать самим "внешним" пользователям.
Заработать время или деньги.
Деньги зарабатывают уверенные прошаренные программисты, художники, писатели всяких курсовых и проч., способные внятно сформулировать свой запрос к системе.
Время экономят менее прошаренные люди, получая на выходе прикольные картинки и псевдонаучную дребедень (которая прокатывает, а большего и не надо).
Это как молоток, которым можно гвоздь для картины забить, а можно себе палец попортить. У кого руки прямые - тому эти "ИИ" в помощь. У кого кривые - ну такова селяви.
Но есть нюанс. Молоток тут сам по себе зависит от пользователя (его умения формулировать). Он трансформируется под каждую задачу. Иногда в микроскоп, иногда в блюдечко.
Такие системы учатся на внешних источниках информации.

2) Прогностические (внутрь-направленные)
Это всевозможные обученные анализаторы данных, работающие не на "Васянов", а на капитал и спецуру всех мастей. Результат их деятельности (от срезов накопленных данных по выборке до прямого прогноза) видят редкие люди.
Всякие анализаторы биржевых индексов, роботы-торговцы, системы анализа с предлагаемыми ВЫВОДАМИ. Уверен, что у каких-нибудь синк-танков есть не только анализаторы информации, но и прогностические модули. Такие системы учатся (должны) на внутренних источниках. На внешних их обучать нельзя и просто опасно. Тут нужны только 100% достоверные и проверенные данные в датасете обучения.
Потому, что криво расчитанный мост - это не котик с 5 лапами... Равно как и неправильно сделанные ставки на торгах...

У группы 1 количество пользователей - хоть всё население планеты. У группы 2 - только ребят с деньгами, для заработка еще большего количества денег/власти. Шум в основном идёт про п1, а зарабатывают владельцы имхо на п2. Владельцы 1 и 2 вполне могут быть одними людьми. Невозбраняется...

Принципиально и те и другие системы делают одно и тоже (на основе скормленного датасета выдают "что-то"). Просто первые выдают результат в простом и применимом массовым обывателем виде.
А вторые - чаще в применимом узким кругом людей, понимающих, что же им эта ИИ выплюнула.

На самом деле таких систем дофига. Начиная со всяких расчётов в КАДах. Просто обычно народ не воспринимает это за "ИИ".
Ну и даже одна формула (для расчёта чего-то), это по сути тоже датасет....
Можно еще разделить на неявно алгоритмические "нейронки" и явно алгоритмические (те же КАДы, для простоты понимания). Глобально сути это не изменит, имхо.

У обоих вариантов по сути на выходе результат некоего осмысления того, что УЖЕ содержится в чёрном ящике. Т.е. от обучающего датасета критически зависит результат.
Если датасет собирается по "публичным" общим данным - тут проблемы. Если по однозначно проверенным ранее (физ формулы например) - проблем намного меньше.

Простой и понятный пример первого варианта, набивший оскомину - чатжпт.
Пример второго - торговый бот для игры на бирже.

Принципиальная разница - в датасете, направленности результата (всем/единицам), цене ошибки.
Для варианта 1 датасет может собрать любой Васян, пустив краулер-бота по интернетам.
Для варианта 2 датасет хрен получишь. Это в например ДСП какой-то брокерской конторы, или кафедры, либо однозначно как-то иначе подтвержденные данные (учебник по механике хотя бы, или по сопромату, ну в обшем вы поняли, надеюсь) Датасет №2 - это данные предыдущих поколений серьезных ребят. Математиков, статистиков, физиков, химиков и т.д.
Это данные, подтвержденные экспериментально. Это очень важно.
Для датасета №1 таких требований НЕТ.

Ну а теперь переходим, собственно, к описанию проблем тех самых "ИИ"
Суверенные проблемы
1) Ограниченность датасета сегментом своих вассалов (в т.ч. именно поэтому, буржуи внедряют туземцам нужду писать туземные научные работы на английском языке!)
2) Ограниченность понятийного языкового аппарата (русского, английского, китайского...)
3) Ограниченность моделей/подходов в обучении кожанных мешков (то, как учат тех, кто создает эти ИИшечки и датасеты для них)

Суверенными я их назвал потому, что они для каждой глобальной группы свои и первично непреодолимые.
Вторично их пытаются преодолеть наши враги, переманивая ученых и толковых людей к себе, а также - принуждая (руками государственных по сути институтов) переводить свои мысли на буржуйский (тот самый пресловутый индекс цитирования в зарубежных сми - это как раз интерфейс для ИХ доступа к НАШИМ мозгам и образу мышления)

Общие проблемы
1) Качество публичных датасетов (будет усугубляться тем сильнее, чем больше данных будет произведено не людьми, а машинами)
2) Возможность опосредованного влияния на них
По пункту 1 всё понятно наверное итак. Чем больше уже нагерено ЧатЖПТ, тем неадекватнее будут результаты при последующем его дообучении на публичных данных.
По пункту 2 - можно принудительно генерить горы мусора, чтобы "свихнуть" этот псевдоИИ.
Можно даже ломануть вражеские сайты, и клоакингом (подменой) выдавать живым людям адекватный контент, а боту чатажпт - сгенерированный бред.

Я видел (изнутри), к чему привела предыдущая итерация использования более простых инструментов.
Чтобы было понятно, о чем речь, опишу кратко. В какой-то момент весь интернет был засран "дорвеями". Большинство из вас помнит, как это выглядело. Вы что-то ищете, вас отправляет на страницу с текстом, который похож на человеческий, но суть ускальзает. Это была первая итерация.
Вторая пошла, когда генераторы дорвеев начали в качестве своего "датасета" использовать страницы, сгенерированные самими же собой ранее. Тексты стали совсем бредовыми.

Так вот - это "сеошники" обдуряли мозги поисковых систем. С генеративными ИИ на публичных датасетах можно сделать тоже самое. Им можно скормить дерьма. Более того, это однозначно рано или поздно случится. Поэтому вражеские (как и наши) прогностические системы будут оставаться закрытыми и работать на ограниченных, "отборных" датасетах (ну или у них перегорят предохранители).

Я уже очень давно на АШе писал, что у нас проблемы по части выводов со стороны иностранного "ИИ", т.к. учить некоторые из ИИ будут по западным источникам информации, в т.ч. по их вместоСМИ (где РФ - исчадие ада). Предсказуемо, их ИИшечки обучатся тому, что нас надо уничтожить. Даже если у архитектора такой задумки и не будет.

Покуда там рулят последователи бжезинских с затуманенным ненавистью разумом - угрозы нам чисто формальные (пусть даже и явные). Выводы у них будут некорректные. Они попадают в ловушку своих же нарративов (самовнушений).
Ну т.е. они направлены то будут однозначно в одну сторону (уничтожить русских), но с учетом одиозности задающих тон политиков - на выходе получится не конкретная рекомендация как нас мочить, а чушь. Что радует. Поэтому приход самых дебильных дебилов (пусть даже и агрессивных, главное - чтобы не адекватных действительности) - нам на руку в данном вопросе. Они сами будут сбивать ИИ-мозг своему виртуальному помощнику. Если Трумп от популизма перейдет к адекватности - беда... (нам).
Полагаю, санкционный подход нечто такое околоИИшное им и подсказало. Просто обучено оно было через жопу. Результат мы видим.

Также, с учетом разномасштабности рунета и en-интернета тут у нас просто нет механик защиты от обучения на всеобщей информации (от выводов ИИ на паблик-данных) от слова совсем. Только ограничивать источники данных. Особенно исходя из того, что обучение врядли будет совсем уж "свободным" (сбор данных и информации со "всех" доступных ресурсов).
Вероятно, первичное обучение пойдет по всяким одиозным ресурсам типа CNN/RAND и т.п., дальнейшие же итерации будут основываться на первичных построениях из начального набора для обучения. Чисто в силу масштабности.

Но зато наша информация, по которой надо учить наших "ИИдетей" - чище. Нам проще будет сделать не просто выводы, а ПРАВИЛЬНЫЕ выводы.
За врагом - масштабность (но она же и ловушка). За нами - более корректные входные данные. Меньше дерьма на входе - лучше результат на выходе. Не потому ли наше ВПР по ряду вопросов раз за разом кладёт на лопатки их "мыслителей"? :)

Оба фактора могут вести к проблемам на выводе.
Ограниченность базы ведет к уменьшению вариативности выводов
Ограниченность достоверной информации ведет у уменьшению достоверности выводов

Ну и напоследок, про открытые генеративные модели с точки зрения вреда простым Васям.

Проблем НАМ (простым людям) это всё принесет очень много (уже приносит)
Имхо больше, чем прибыли "им". Искать информацию становится всё труднее, я уж не говорю про то, что кучу криворуких выкинут на мороз. Дальше будет хуже.

Но суть давно описана капиталистами - национализация убытков (размазывание проблем по простым людям) и приватизация прибылей (профит от использования - малой (относительно пострадавших)группе интересантов). Т.е. прибыль - их. А головная боль - наша.
Им пофиг, что Вася не может от чат бота получить адекватное решение своей проблемы
Покуда Вася несёт сервису деньги.
Это всем нам давно видно по "техподдержке" опсосов, провайдеров, банков и проч. Навнедряли говна на нашу голову, но им то наплевать, броблемы не у них а у нас.

Как следствие, информация глобально будет далее фрагментироваться. Чтобы небыло возможности засирать адекватные данные, и чтобы не предоставлять их врагам.

Однозначно, нужно закрывать и секретить результаты исследований русского мира. Отрубать к хренам требования к публикациям в зарубежных изданиях (и головы тем, кто принуждает наших ученых это делать, ставя в зависимость карьеру от зарубежных ИЦ). Вообще отрубать. За публикацию в "сайнс" надо не премию давать, а срок.
Потому что сейчас по сути любой Ганс или Джон могут использовать НАШИ наработки. Да еще и переведенные в удобный ему вид. Нам оно надо? Мы сами отдаем в руки врагам/соперникам наши стратегические козыри (образ мышления, школу).
Глобализация мира закончилась, началась фрагментация. Свой фрагмент нужно держать
1) В чистоте (от мусорной информации, портящей выводы "ИИшечки"
2) В недоступности вражеским ИИшечкам. Т.к. это примерно как доступная энергия. Поставлять врагам даже не нефть, а уже готовый бензин (обработанные мысли, выводы наших ученых). Бесплатно.

Авторство: 
Авторская работа / переводика
Комментарий автора: 

Немного сумбурно, но тема серьезная. Соответственно, всерьез займет кучу страниц. Так что галопом по ИИ-жопам.

Комментарий редакции раздела О целях и не только

Толковый материал, благодарю!

Похоже Маск свою тридцатидвигательную бочку отлаживал именно с помощью ИИ, т.е. технология отладки и постройки масштабных объектов его конторой отлажена, понятно чем кормить систему, куда её направлять для достижения нужного результата и как. Факт его нахождения в команде Трампа означает неизбежное применение им этих наработок для сохранения гегемонистости гегемона.

Поэтому, да, похоже России это добавит проблем, Хищник всегда пользуется изобретённым оружием себе на пользу и другим во вред. Наверняка эти имеющиеся уже системы будут обучены на результатах СВО, потом будут просчитаны пути вероятного развития российской военной техники и в ускоренном (кратно!) порядке разработаны новые атакующие военно-технические системы. Вспомните как ржали над подпрыгивающей бочкой Маска...

Кстати поведение рыжика об этом тоже свидетельствует, у Хищника появилась надежда...

Так что автор прав во всём абсолютно.

Ещё раз благодарю за толковый материал.

Комментарий редакции раздела Альтернативный Интеллект

Автору - благодарность.

Редкий пример адекватной оценки ситуации, без идолопоклонничества и всёпропальничества. С неплохой систематизацией, пусть и не доведенной до некоторого предела, а скорее - только обозначенной.

Выводы - жесткие, но их направленность видится адекватной.

В закладки по теме ИИ - однозначно.

Комментарии

Аватар пользователя Славянский шкаф
Славянский шкаф(2 месяца 2 недели)

Вы для спецов или людей писали?

Если не спецам то можно словечки датасет дать в бытовом представлении?

Комментарий администрации:  
*** отключен (невменяемое общение) ***
Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Писал для простых людей.

Датасет - набор данных, которыми накормили "ИИ". Например, 1000 фоток с котиками. Или 1000 страниц Толстого. Или набор статистических данных.

Аватар пользователя Славянский шкаф
Славянский шкаф(2 месяца 2 недели)

Т.е. набор данных ближе к такому термину?

С враждебным использованием я не могу составить представления, а то что жуть в коммуникации с этими ИИ это да. Реально осознать могут очень узкий круг вопросов и в итоге всё на человека в массе. Хотя и человек в этих системах не сильно по пониманию отличается. Ответы отписками без вникания в суть проблемы весьма часто, но не всегда.

Комментарий администрации:  
*** отключен (невменяемое общение) ***
Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Набор данных - это по сути прямой перевод английского data set и есть.

Данные по сути могут быть любые. От алфавита до показаний датчиков (включая камеры наблюдения) в реальном времени. Это не принципиально.

Датасет - просто внутренняя терминология.

Если еще что-то непонятно - спрашивайте. Просто всю терминологию расписывать - АШа не хватит. А как и в любой сфере, тут есть своя терминология. Также как муфта (но у сантехника она означает одно, а у скорняка - другое).

Ответы отписками без вникания в суть проблемы весьма часто, но не всегда.

Это как раз около того, о чем я пишу. "На чём обучено, то и получено". Обучено на простых типовых задачах и простых типовых ответах еще людской техподдержки. А нынче проблемы возникают более каверзные и специфические. Вот и ответы - про фому и ерёму, а не по существу.

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Проблема противостояния снаряда и брони прослеживается от начала коммерциализации интернетов.

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

И кстати, чем чаще боту будут ставить при нерешенном вопросе статус "вопрос решен" (иногда такой статус автоматом ставится при отсутствии реакции от пользователя, и уходит в дальнейшее дообучение этой шайтан-коробки)  - тем больше бреда будет генерить ИИ-техподдержка :)

Аватар пользователя Славянский шкаф
Славянский шкаф(2 месяца 2 недели)

Спасибо. Кухня стала немного понятней. Только где тут интеллект так и не понял. Но это моя проблема, не ваша недоработка.

Комментарий администрации:  
*** отключен (невменяемое общение) ***
Аватар пользователя И-23
И-23(9 лет 2 месяца)

Что такое «интеллект»?

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Вот я потому и закавычил "ИИ". И написал про большие языквые модели :)

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Имитатор Интеллекта или Искусственный Идиот.

ЗЫ: Ждём явления камрада Корректора.

Аватар пользователя Canis_m
Canis_m(8 лет 7 месяцев)

Изуверский Интеллект

Аватар пользователя Алекс Васильев

Что такое «интеллект»?

интеллект это часть сознания,

сознание многомерно и имеет сложную структуру,

интеллект - это хорошо проиндексированный банк данных на базе ассоциативного поля сознания;

рассудок - словесно-логический элемент(переводит образы в слова);

ум - интегрирующий элемент сознания; и т.д...

различные патологии это структурные нарушения сознания, например шизофрения это состояние при котором рассудок замкнут на самого себя, а ум при этом спит; поэтому шизофренические рассуждения могут быть вполне логичны по форме, но безумны в пределе; то есть, рассудок берет некоторую вводную формулу и достраивает логически не противоречивую ассоциацию в соответствии с освоенной базой данных и выращенным ассоциативным полем(плюс чувства и эмоциональный фон - страх, высокомерие, амбициозность, хитрость ... оказывают формирующее влияние на конечную формулу); чем короче ассоциация тем она "разумней", чем длиннее тем к боле безумным выводам она ведет;

ИИ это такой шизофреник у которого нет ума, а только "рассудок" и "интеллект", причем как верно замечено, база данных мусорная и не полная, а речевые модели несовершенны;

ум не доступен ИИ по определению, как недоступно осознание; осознание это не просто сложная система обратных связей; это то, что у человека называется монадой; все остальное является инструментом монады; ИИ в принципе создается иначе; подвязывать к ИИ управленческую функцию без контроля со стороны человека, это как отдавать бразды правления шизофренику;

Аватар пользователя NN11
NN11(9 месяцев 1 неделя)

Мне кажется вы в своих терминах попутали "интеллект" со "знаниями".

А интеллект - способность использовать знания для решения возникающих задач.

Аватар пользователя Алекс Васильев

Мне кажется вы в своих терминах попутали "интеллект" со "знаниями".

А интеллект - способность использовать знания для решения возникающих задач.

ок, вы бы еще исчерпывающее определение "знаний" как самостоятельной сущности дали бы, для полного понимания вашего тезиса;

исчерпывающего, это значит если в состав определения входят сложные термины, например "информация" им тоже должны быть даны исчерпывающие определения;

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Вот поэтому я частично свою терминологию в заметке расшифровал, чтобы небыло разных толкований и было предельно понятно людям со стороны. Даже если кому-то изнутри моя терминология не по душе. Просто для понятности. А буквоедством и подсчётом запятых пусть занимаются те, кому скучно (это я не Вам, но есть тут в комментариях уже такие ребята) :)

Аватар пользователя Lokki
Lokki(9 лет 8 месяцев)

Это чисто журналистское задрочество.

Потом плавно перелилось в грантоедство.

Аватар пользователя Mr.Wolf
Mr.Wolf(5 лет 6 месяцев)

Только где тут интеллект так и не понял.

Ситуация следующая. "Искусственный интеллект" - это просто маркетинговое название. Придумали где-то, но и у нас на высшем уровне - повторили (вплоть до Указа Президента РФ). 

Пытаться найти там интеллект - конечно, можно, но шанс реально его найти - не высокий. Просто смиритесь с тем, что есть такой термин, означающий компьютерную систему, которая имитирует отдельные когнитивные способности. 

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Применительно к хайповому ИИ движу это вообще можно свести к системе, которая на входе получает одни данные, а на выходе дает другие. Сюда даже калькулятор можно включить :) Потому я всякие КАДы и привёл тоже в качестве примеров.

Просто у калькулятора намного меньший датасет и несколько иной алгоритм работы с оным )

Аватар пользователя Mr.Wolf
Mr.Wolf(5 лет 6 месяцев)

Насчет калькулятора - пример не совсем удачный, на мой взгляд. Народ не хочет в качестве ИИ воспринимать строго детерминированное устройство.

Это как в старом анекдоте: "- сколько будет дважды два? - четыре! - э, да ты заранее ответ знал, ты не не думал".

Им хочется, чтобы оно что-то само находило-изобретало, без понятной со стороны формулы/процедуры.

Кстати, мы их - не лучше (с их точки зрения), ибо нам хочется - чтобы оно само не только находило-изобретало, но и было способным предъявить-объяснить эту самую формулу/процедуру smile7.gif

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Не вполне удачный, но это вполне себе частный случай всего вот этого вот. Если на более высокий уровень абстракции перейти.

И кстати, множественные итерации дообучения на генерированном контенте приведут к схлопыванию вариативности. Т.е. рано или поздно в текущих моделях на выходе мы на любой вопрос будем получать предельно усреднённый ответ. Например - "42". Имхо.

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Белковые попугайчики тоже такое умеют и любят.
Особенно если их придавить профессионально сочинёнными (да с оптимизацией издержек на корректуре и верификации) инструкциями.

Ну и решение проблемы тоже очевидно: комиссарами берётся перелётный автор новации.
Фиксируется и начинает под видео-протокол решать с помощью внедрённой инновации сколько-нибудь нетривиальную проблему.

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Ага. И если расчёты КАДов проблемы решают, то чатжпт - делает вид. Иногда результат деятельности можно принять за решение. Но, как в старом советском фильме - "стабильности нет".

А на дообучении (кормлении "ИИ" результатами его же прошлых генераций бреда) проблема только усугУбится.

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Ни фига!!!

CAD'ы разгребают *часть* рутины в моменте.
Порождая специалистов по запуску, не понимающих и физически не способных понять логику предметной области.
И потому совершенно не гарантируя от ошибок.

ЗЫ: Помните неафишируемый нюанс из биографии линейки Canon EF?

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Я вообще не о том. Кот с 5 лапами в ряде случаев - годный вариант. Мост без опор с пролётом в километр - врядли. В кадах входные параметры (в разумном мире) более адекватно отбираются, их меньше, они уже проверены обычно прошлыми поколениями (далеко не всегда - программистов).

И то и другое генерирует результаты неких действий с входными переменными. Но к КАДу все-таки доверия больше. Но и пользоваться им сможет куда меньший круг людей (как и напрограммировать его, т.к. нужны знания другого рода)

ЗЫ: Помните неафишируемый нюанс из биографии линейки Canon EF?

Не, в упор не помню. А может даже и не знаю.

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Эту линейку проектировали когда спало бремя ресурсного ограничения (вычислительных мощностей внезапно стало более чем достаточно и встал вопрос их загрузки).
В результате чего численными методами зашли на задачи, решение которых ранее было искусством, с отбраковкой и активным использованием аналитических методов).
Получили результат в виде переменного (ибо вопрос учёта производственных погрешностей в полном объёме не потянули) и в лучшем случае весьма посредственного качестве.
То есть свободный и реально-рыночный выбор между откровенным говном и посредственностью за безумные бапки.

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Да, но оно работает более адекватно и предсказуемо, а потому можно использовать в более серьезных сферах, нежели генерация котиков или голых бап.

Аватар пользователя Coolerman
Coolerman(4 года 7 месяцев)

А на дообучении (кормлении "ИИ" результатами его же прошлых генераций бреда) проблема только усугУбится.

Вот это и есть проблема когда "ИИ" использует открытые источники, не анализируя и не отделяя что создано людьми, а что другими "ИИ". Количество дерьма увеличивается в геометрической проекции. Уже сталкивался с таким бредом когда на одном сайте есть статьи по любым темам, там они генерируются автоматом по запросу из гугла. Самое печальное что данные сайты часто торчат в топе по запросам.

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Поздравляю, Вы наткнулись на автогенератор дорвеев. ИИ (в текуще хайповом понимании) тут ни при чём с вероятностью 99%.

Эта технология появилась примерно в 2008 году (точнее уже не помню, давно было). Просто очередная итерация генераторов дорвеев.

В топе по запросам они торчат потому, что дорвейщики научились обходить вполне тупые и манипулируемые извне алгоритмы поисковиков. Также научатся и кормить "ИИ" дерьмом с лопаты. Я потому дорвеи и поисковики в пример и привёл, как предыдущую итерацию генерации (компиляции) чего-то из входящих данных.

Вижу будущее текущий версий "ИИ" в том же ключе. Они захлебнутся своим же контентом, превратясь на выходе в круглого идиота.

И я помню, как авторы генераторов дорвеев пытались бороться с мусором на входе (когда генераторы стали сжирать свои же произведения из поисковой выдачи). Кончилось тем, что тема по сути умерла. И не только потому, что алгоритмы поисковиков стали "умнее", но и потому, что "датасеты" стали дурнее (и именно эти дурные в топах и висели, и на их основе генерилась следующая итерация бреда). Примерно в то же время поисковики внедрили поведенческий анализ для ранжирования. Помогло так себе. Дорвейщики запустили ботнеты, иммитирующие поведение живых людей на дорвеях.

Аватар пользователя Ути-пути
Ути-пути(1 год 4 месяца)

Ответы отписками без вникания в суть проблемы весьма часто, но не всегда.

Эти модели в принципе не понимают никаких проблем и ничего не знают об их сути. Они работают с текстом, безо всякого его понимания. Они видели очень много текста, очень-очень много, набрали статистику, и занимаются тем, что стараются предсказать, какой текст должен идти дальше. Им важна не содержательная часть текста, а сам текст и контекст, в котором он появился.

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

В яблочко. Просто иногда контекст и текст содержали на входе решение обозначенной кем-то проблемы. А иногда - нет.

Потому, кстати, нужно дообучение. И потому же - дообучение ухудшит ситуацию, если результаты компьютерной генерации ответов попадут в это дообучение )

Аватар пользователя Ахура Мазда

"Дочитают не многие" - неплохо вы так, с НЛП, начали.smile103.gif

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

И в мыслях небыло. Просто я адекватно оцениваю свою занудность и общую "интересность" темы в данном сообществе. Не в смысле интеллекта читателей, а в смысле их далёкости от данной темы в массе своей.

Аватар пользователя Bzz
Bzz(8 лет 3 недели)

А как еще? :о))

Автору - респект.

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Однако технология НЛП опирается на некоторые физиологические закономерности.

Аватар пользователя Ахура Мазда

Вот я абсолютно был уверен, что вы не пройдёте мимо моего комментарияAnimaux-Renard 2-6.gif

Аватар пользователя С Правого
С Правого(10 лет 3 месяца)

Простой людь к ТС (человеку\нечеловеку) классическое из "штирлица" про последнюю фразу."..галопом по ИИ-​жопам". Выкидывать пишущую машинку или ещё рано и она пригодится для загрузки датасета?)))

Аватар пользователя Николай Зубков

Кто-то возлагает на "ИИ" большие надежды, у кого-то большие страхи. Истина, на мой взгляд, как всегда посередине.

Это - главная ошибка. В данном случае "надеяться" или "боятся" фантазий из своей головы. Фантазий, разбуженных ловкой имитацией бурной деятельности интеллекта. Никакого "искусственного интеллекта" (не устану это повторять!) НЕ СУЩЕСТВУЕТ. Существуют лишь эмуляции на машинах фон Неймана с матричными акселераторами примитивных, на уровне мозга лягушки, нейросетей - по сути, полных аналогов перцептрона Розенблатта, родом из 1959 года. Не более (и не менее). Никакой "угрозы человечеству" они не представляют. Разве, что фрилансерам-копипастерам... Ну, и пользы от них как шерсти от кошки, вроде бы и есть, но....

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Никакого "искусственного интеллекта" (не устану это повторять!) НЕ СУЩЕСТВУЕТ.

Вроде я обратного и не писал.

Про угрозы, вот прямо даже за пределы АШа выходить не надо:

https://aftershock.news/?q=node/1412060

https://aftershock.news/?q=node/1409987

https://aftershock.news/?q=node/1390708

https://aftershock.news/?q=node/1443583

Речь не о прямых угрозах. Утюг не попытается самоубиться и спалить дом. Но косвенные угрозы от кожанных мешков, которые руководствуются рекомендациями "ИИ" есть однозначно. Кто-то потеряет работу, кто-то примет дебильное решение с подсказки ИИ, которое приведёт к нехорошему.

Молоток сам по себе тоже угрозы не несёт. Но в руках психа...

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Обычная и закономерная отрыжка индустриализации.
С отягчающими свойствами *товарного* (до *экспортно*-товарного) назначения.

Аватар пользователя Славянский шкаф
Славянский шкаф(2 месяца 2 недели)

Вот хороший пример генератора потока текста тут нарисовался. Вроде по делу, но хрен поймешь.

Комментарий администрации:  
*** отключен (невменяемое общение) ***
Аватар пользователя Redvook
Redvook(11 лет 7 месяцев)

А что именно вам непонятно в разжеванном, как для детей, тексте?

Аватар пользователя Славянский шкаф
Славянский шкаф(2 месяца 2 недели)

Я о "И и цифрах"

Комментарий администрации:  
*** отключен (невменяемое общение) ***
Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Напрасно. Просто И-23 пишет в рамках своей терминологии. Вполне обоснованной, на мой взгляд.

Аватар пользователя Славянский шкаф
Славянский шкаф(2 месяца 2 недели)

В рамках своей терминологии. Китайцы тоже по делу говорят, но я языка не знаю. Результат аналогичен.

Комментарий администрации:  
*** отключен (невменяемое общение) ***
Аватар пользователя Anunah
Anunah(1 год 10 месяцев)

Достаточно прочитать последние пару абзацев. Там всё понятно и без спец терминологии. И я с ТС полностью согласен. 

Аватар пользователя Zanuda
Zanuda(3 года 9 месяцев)

Первая половина текста нужна просто для того, чтобы читатель понял, почему врагам не надо давать нашу информацию. Потому что если не ясно, как оно обучается, то и не ясно, как ему не дать учиться против нас.

Аватар пользователя Anunah
Anunah(1 год 10 месяцев)

Вообще вопрос серьезный, потому что  Ии- это по сути передовая наука и будет ключом к информационной безопасности. Если противостояние не понарошку, то это одно из направлений первостепенной важности

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Перечитайте курс лекций князя Кропоткина!

Аватар пользователя AVSm
AVSm(5 лет 10 месяцев)

(невинно, с хитринкой в глазах) перетолмаченный с островного курс про русскую литературу?

Аватар пользователя С Правого
С Правого(10 лет 3 месяца)

Мне хватило последней фразы (по Штирлицу):..галопом по ИИ-​жопам.)).С ТС согласен нужен "свой ИИ,желательно с равной(но доказанной) базой датасетов.  ...но вроде это невозможно,пока.

Страницы