Как смотреть американский ты-туп или читать парижско-дубайский теле$рам, с голландским дзынем и не стать ту-пым

Аватар пользователя RomanSmirnov
Гауссовский "белый" ( и не очень ) шум в современных каналах ма$$ медиа просто зашкаливает, соответственно, чтобы хоть как то ими пользоваться, необходимы фильтры... причем не только на тупо "факт чекинг", но и некоторые более сложные моменты.

Теоретических работ достаточно много по вопросу, как извлекать даже из ложной информации не ложную (не без контекста конечно), есть и различные грубо говоря "платные" сервисы для обывателя, правда в реальности не так то все просто, да и в общем случае времени нет свободного, на вот это вот все. 

Но есть и хорошие новости - если раньше обработка информации была доступна только профи, то сейчас в принципе относительно приемлемо можно делать даже дома на коленке. 

Так как на самом деле необходимо смотреть видосики или тем более читать всякую интернет шнягу?

Практически любое информационное сообщение в интернете, пускай даже оно и замаскировано под "какой нить" извиняюсь "высер", раскладывается на вектор из упоминаний чего то или кого то с подведением соответствующей коннотации (обычно негативной ибо "просмотров больше").

Так как уровень "генераторов" падает и все чаще собственно эти сообщения строгают по заданным шаблонам нейросетки, то и обратную декомпозицию также можно выполнить с их помощью, заодно сэкономив время.

Итак - вместо траты время на просмотр "видоса" - можно реализовать следующий алгоритм.

Сохраняем видео (или аудио), если уже есть субтитры (одно время многие видеохостеры делали, но сейчас начали отключать - так понимаю экономят) сохраняем и субтитры, если нет, то генерируем свои, пропускаем субтитры через ПО для выделения сущностей ( люди, компании например ), так же можно выделить "коннотации" - т.е. негативный или позитивный контекст относительно "сущности" , потом заносим в БД и строим карту (можно трехмерную со временем), ну или матрицу если хотите.

Кто - про кого и про что, что сказал, с одним из измерений - "временем".  Не обязательно это про "друг" про "дружку" должно быть, можно и относительно какого то "будущего" или "прошлого" - "мема" (все рано или поздно превращается увы в оные).

По результатам например заметно, как начинают как по команде  на или за Пушкина, или заунывно трындеть про "демографию." ...

Как это может выглядеть на практике:

Чтобы, как называется никого случайно не задеть, для примера возьмем в наших условиях полуисторический ( наугад - сам и не смотрел, что там несут ) видос про русскую "литературу" 90-ых:

20241206175705_mceclip0.png

Ты-туп кстати тут уже выделил "людей" из видоса, разметил поток, что тоже удобно, для сравнения.

Итак.

Для сохранения видоса в папку - делаем так ( привел сразу если кому надо с проксей ) , сохраняем только аудиодорожку ( очень редко кто то показывает слайды, т.е. анализируем только аудиоряд  )

yt-dlp -c --proxy "socks5://user:password@ip:port/" --sub-format vtt  --write-auto-subs --write-info-json --sub-lang "ru.*" --no-abort-on-error --ignore-errors -x -f worstaudio --audio-format mp3 http://адрес_видоса -o "data/%(upload_date)s_%(id)s.%(ext)s"

Скачивается:

20241206170625_mceclip1.png

получаем набор файликов: 

20241206171349_mceclip3.png

далее генерируем "субтитры"  ( бесплатное ПО -  whisper-ctranslate2 ) если их нет.    Кстати последнее время уровень генерируемых самими видеохостингами субтитров как ни странно упал  и это на фоне роста мощностей!.

В данном случае транскрипция от гугла действительно просто отвратительного качества:

20241206171222_mceclip2.png

соответственно делаем свою транскрипцию:

whisper-ctranslate2 $1 --model large-v3 --output_dir outmisc --language Russian > $2

и действительно странно, но достаточно тупая "домашняя" нейросетка оказалась лучше, чем у гуглоидов

20241206171447_mceclip4.png

----------

и для выделения сучностей раньше была библиотека от мистера Кукушкина [ https://lab.alexkuk.ru/ ]   - Наташа 

сейчас есть spacy - https://spacy.io/models/ru#ru_core_news_lg ( на его же "неруси" сделана )

20241206111344_mceclip0.png

Допустим сделаем простенький скрипт с ее использованием:

20241206175055_mceclip1.png

Результат прогона через него

20241206175017_mceclip0.png

Как видим уже больше, чем у хугля, ну не суть ( Возник первый же вопросик, как хугль отфильтровал, кого включать в свою подборку, отображаемую под видосом, а кого нет - ибо как видим набор то конкретно по "ширше" будет... ?)

Это все далее закидывается в соответствующую базу (последнее время предпочитаю clickhouse ибо он и правда _быстрый_ , хотя конечно лучше что нибудь импортозамещенное типа postgres от местных астрофизиков )

Например в таблицу с колонками:

[ время ] , [ канал ] , [ видос ] , [ тип объекта ] , [ время упоминания ] , [ коннотация ] 

И так по всему, до чего дотянемся.

Соответственно со временем становится легко отслеживать, как поднимаются "когнитивные" волны по тому или иному "объекту", а так же появление новых или забытие "старых" "мемов".

Софт сейчас пишется быстро - много всего готового, легко допилить напильником. Выше просто пример того, насколько это все стало просто.

В чем может быть проблема при "бесплатной" реализации?

На одном "домашнем" присоединении Вы не сможете мониторить сразу действительно много каналов, скажем так бесплатно.

Что можно сделать - собрать docker образ, либо еще лучше все закомпилить в одно приложение (немного больше возни, с учетом количества сторонних библиотек , но тоже реализуемо вообщем то, в т.ч. на arm toolchain чтобы на мобилках гонять, бгг) и раздать его друзякам ( обычно раскладывается по разным хостингам ).

Где вот это все будет получать команды (типа выполнить анализ соответствующего url и вернуть результат), далее написать несложный сервер, который раздает клиентам задания и получает от них результаты обработки, через апи. 

Таким образом "народный вариант" позволит фильтровать потоки бреда и не очень бреда, обрушиваемого на головы человечков медиа-корпами или "энтузиастами" (в т.ч. псевдо) и выделять из него только то, что действительно интересно, ну и заодно подсвечивать реальные векторы, выявлять "волны", "первичку" и прч. 

20241206164353_mceclip11.png

Схематично вот выше.

С управлением очередью можно тоже особо не заморачиваться, а сделать на готовом - rabbitmq например, так как передается только обработанное, то требования к серверу минимальные...

У "рекламщиков" есть _конкретно_ продвинутые такие Машины, в т.ч. по скажем так не совсем публичным данным (особенно после того, как они интегрировались с телекомщиками и банкирами), которые "смотрят и читают всё".

Немного (реально не много) сложнее схема с символическими аллюзиями - это когда "широковещателем" подбирается что то похожее на,  с учетом целевого контекста, но даже с учетом этого уровня все равно по итогу это все чистая механика. В подложке у которой лежит либо коммерция, заказ, либо тупо агрессия с вектором атаки.  Из-за чего возникает агрессия, если это не заказ? Несоответствие контекстов? Вот тут уже интересней конечно.  Насколько понял есть Модели и с ними... 

Следующие уровни это смыкание "смотрящих машин" с социо-экономическими сгустками, имеющими реальные ресурсные возможности - причем порой из разных административных контуров.

А так же их разборки между собой,  иногда выглядящие конкретно забавно.

Слайд из классики:

20241206193016_mceclip0.png

Зато даже поверхностный анализ производной от векторов позволяет хотя бы приблизительно, но все же восстановить реальные расклады.

Но это уже другая сказка... всем хороших выходных.

P.S.

Использованное ПО:

https://github.com/yt-dlp/yt-dlp

https://github.com/Softcatala/whisper-ctranslate2

https://spacy.io/models/ru#ru_core_news_lg

P.S.  2

Вывод из этой басни простой - следует крайне скептически относиться к любому, как сейчас говорят "контенту", производимому за денюжку, или просто ма$$овому, но не официальному  - и раньше то это просто конкретно все было утилитарно, а сейчас, с развитием технологий превратилось,  просто в "механику". Академический сектор пока еще держится, за счет института рецензирования и слабой обратной связи с размером аудитории, но тоже местами превратился в оную.

Авторство: 
Авторская работа / переводика

Комментарии

Аватар пользователя roman_ke
roman_ke (8 лет 5 месяцев)

Люди просто не  поняли что им тут написали :)

Просто английского языка да и еще и вместе со скринами с Linux да и в придачу со скриптами смотрятся как в фильмах про хакеров, проще объяснять надо!

Аватар пользователя anamitos
anamitos (12 лет 6 месяцев)

Я, как подмножество людей, которые, скорее всего, не поняли что им написали, еще и не понял зачем это мне?  В перерывах между попытками как-то спасти свои пенсионные накопления и поисками дешевой гречки, анализировать алгоритмы оболванивания и манипулирования? Как мне это поможет? Я знаю, что они есть. Мне кажется, этого достаточно.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

"Гречку" коммерсы-ритейлеры сейчас похоже рызгрывают алгоритмами, как раз в т.ч. на медиа и работа с ними могла бы помочь и обывателям.... 

Ну или хотя бы понимать, как все устроено, таи никакой конспирологии просто бизнес похоже.

Аватар пользователя Карвель
Карвель (6 лет 3 месяца)

еще и не понял зачем это мне?

Присоединяюсь. Вообще... По возможности стараюсь (пытаюсь) ограждать себя от новостной информации, особенно политической. Абсолютно согласен с Павлом Щелиным, что действительно важные события мимо тебя не пройдут, даже если не смотреть ТВ, не ходить в тырнет и не слушать радио. Хотя сложно... Вечно лезешь послущать-глянуть.

... а в машине, на прогулке, в магазине и проч. пытаюсь слушать или аудиокниги классические, или популярные лекции по истории, физике, психологии и проч. 

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

И это правильно! 

Новости давно из новостей превратились в что то странное... 

Аватар пользователя Добренький
Добренький (11 лет 7 месяцев)

Картинки, таблицы пропускаем, в пролетарскую суть вникаем.smile1.gif

Вывод из этой басни простой - следует крайне скептически относиться к любому, как сейчас говорят "контенту", производимому за денюжку, или просто ма$$овому - и раньше то это просто конкретно все было утилитарно, а сейчас, с развитием технологий превратилось,  просто в "механику". Академический сектор пока еще держится, за счет института рецензирования и слабой обратной связи с размером аудитории, но тоже местами превратился в оную.

Аватар пользователя Ayatola
Ayatola (12 лет 4 дня)

Ну вот же выжимка: Вывод из этой басни простой - следует крайне скептически относиться к любому, как сейчас говорят "контенту"

В том числе и к этой статье. Как там у Беркема - зачем ЭТО сказали, зачем это сказали ТЕБЕ, зачем это сказали тебе СЕЙЧАС.

Аватар пользователя Taylak
Taylak (8 лет 5 месяцев)

smile8.gif

Аватар пользователя e.tvorogov
e.tvorogov (9 лет 3 месяца)

Сам принцип создания видеоконтента таков, чтобы охватить как можно большую аудиторию по тематике. Соответственно, ему полагается быть популярно-доходчивым, ради чего можно (и нужно) жертвовать полнотой и сложностью информации. Да в принципе, и с текстовыми статьями то же самое. Берёшь, очерчиваешь тему и говоришь по ней то, что хочется в данный момент. А серьёзная информация — да, она на академическом уровне. И ещё «в секретных кабинетах».

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Ну и смысл такое потреблять, если это не официальная информация?

Аватар пользователя e.tvorogov
e.tvorogov (9 лет 3 месяца)

Предположу, что далеко не все способны и хотят усваивать серьёзную, глубоко продуманную и проработанную информацию. Теоретические вещи уже отсекают многих, ориентированных на конкретику. И тем более дискурс о возможности той или иной теории — процент интересующихся на этом уровне исчезающе мал, потому что выше него нет ничего. В подавляющем большинстве случаев люди обходятся фрагментарным и необязательно истинным знанием, живут каждый в своём информационном пузыре и не понимают, зачем им знать и уметь что-то больше того, чем они повторяют каждый день. Это вопрос амбиций, и почему они у кого-то есть, а кому-то достаточно имеющегося — сие тайна великая есть.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

По моей субьективной оценке народ у нас достаточно сообразительный и без теории норм сам фильтрует на интуиции.

Триллиарды просмотров на площадках часто рисованные (особенно если они для отчетности).

Заметку написал может кому то пригодится в практическом плане... сам пользуюсь иногда удобно.

Аватар пользователя e.tvorogov
e.tvorogov (9 лет 3 месяца)

народ у нас достаточно сообразительный и без теории норм сам фильтрует на интуиции

Есть разница, происходит ли такая фильтрация в моменте или на долгосроке. В моменте — да, согласен. Но по моей исследовательской тематике (субъективное строение человека) она не прокатывает. Нигде так не царят предрассудки, как в оценке других людей, но большинство-то считает, что они судят друг о друге истинно. Даже слово «объективно» вворачивают, ведь на поведение же смотрят. Ладно, сорри, отклоняюсь от темы.

Аватар пользователя Dzensnami
Dzensnami (7 лет 12 месяцев)

Круто! Утащил в закладки!

Аватар пользователя valerkav
valerkav (12 лет 8 месяцев)

Спасибо за наводку, как раз хотел радио мониторить - в облако слов по частоте упоминания.

Аватар пользователя викт54
викт54 (2 года 5 месяцев)

Можно попробовать "выделить сущность" очередного текста Романа Смирнова:

Основной вопрос: ... на самом деле необходимо ли смотреть видосики или тем более читать всякую интернет шнягу?

Смотреть видосики (видеоконтент) - себя не уважать, разве что ввиду крайней необходимости (популярности, доходчивости)!

Читать текстовые статьи - естественно, нужно по диагонали с целью "выделения сущности (сути, смысла). 

Рассматривать необходимо и негативный и позитивный контекст относительно "сущности", в противном случае есть опасность оказаться вдруг и неожиданно в полном окружении бурно размножающейся либероидной мрази. Лучше - как-нибудь по возможности заранее приготовиться к этому. 

Что касается литературы, без всяких натужных исследований, уже давно стало ясно, что она перестала занимать то место, которое она раньше занимала в нашей жизни.  Остатки интереса у некоторых вызывают детективы (преступления, убийства, романтизация криминала), фантастика - фэнтези (необузданные измышления, романтизация причуд), любовный роман (перетряхивание грязного белья, подглядывание в разные "скважины", романтизация гламура и пошлости). 

Аватар пользователя Fandaal
Fandaal (10 лет 5 месяцев)

Зачем создавать себе проблемы? Смотреть негодное, а потом (или до) рихтовать и пилить его.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Годное тоже надо фильтровать иначе времени ни на что не хватит...

Аватар пользователя thinkman
thinkman (1 год 1 месяц)

стандартные темы, у того же freeswitch, на базе которого почти вся ip-телефония (команда от астериска) есть готовые s2t и t2s (speech to text и наоборот) библиотеки, вообще в рилтайме стопслова ищешь или видит оператор какого-нибудь коллцентра, аналогично ему трафик видео-аудио для фильтрации натравливаешь.

текст жаль терать, оставляя только сущности-стопслова, поэтому используют хранилище с fts (full text search), где полноценные падежи, склонения, по корням можно найти и проч,

в природе остался жив только продукт lucene, его апач захапал, можно также от апача solr поставить, для небольших задач хватит, на побольше opensearch (бывший еластик) в нем же реализовать справочники разных сущностей в зависимости от задач или контекстов со ссылками на сами документы-контектсы, т.е. сущность 1 к многим указывает на документы и места, где употреблялась,

семантики толковой нет и не будет, тут придется с человеческм фактором самому.

а для дома хватит самой либы apache-lucene, только с питоном подружить через py4j, раз так струмент нравится.

вкрате обычно так делается в конторах, где спайдеры тырнет шерстят на предмет выявления тенденций.

и, уже имея справочники сущностей-стопслов уже более сложные алгоритмы выявления связей включаются, вплоть до вычисления узла, откуда вся ветка фейков стартовала.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Есть ссылка на s2t ? Оно открыто?

Если это что то старое опенсорсное аля сфинкс, то там не очень... 

Так то конечно у профи, чего только нет.

Аватар пользователя thinkman
thinkman (1 год 1 месяц)

сфинкса много лет уже не видно, его так из монолита и не развили, это было как раз, когда закопали замечательную библиотеку на c++ для lucene и оставили в доступе только на жавастеке (уверен, что сишную развивают закрыто, все-таки максимально быстрая), тогда же войнушка и шла за FTS, очевидно было, что за этим будущее.

модулей для свича хватает, например вот

https://github.com/voicegain/mod_voicegain

вроде 4 года назад что-то меняли, есть старые станданртные, все открытый код, как и сам freeswitch

https://docs.freeswitch.org/ (doxygen)

можно вообще отдельные реализации s2t(stt) посмотреть, у яндекса были открыты исходники.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Спасибо, сравню с виспером...  после яндексовской открытой томиты (  https://yandex.ru/dev/tomita/ ) ничего у них не смотрю... (не очень оказалась), а апи не интересно

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

эээ, если правильно понял, там модуль по ссылке это обертка к api voicegain https://console.voicegain.ai/login ... не, такое не очень интересно.

Аватар пользователя utx
utx (9 лет 3 месяца)

Зачетная техноэротика!

А дальше поверх clickhouse положить эластик с графовой агрегацией и оно красиво отрисует кто какие вбросы строил, кто повторял и т д )

А еще в clickhouse можно загнать сами векторы и уже по ним построит свой классификатор или банальный cosin )

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

именно,

но больше идея про асимметрию к возможности корпов,  через распределенное приложение интересна...

Аватар пользователя utx
utx (9 лет 3 месяца)

про асимметрию к возможности корпов,

У https://laion.ai/ на гите где-то есть такой центр как вы описали, только они для картинок пользуют.

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

А дальше поверх clickhouse положить эластик с графовой агрегацией и оно красиво отрисует кто какие вбросы строил, кто повторял и т д )

smile3.gif Если у вас нет теории объясняющей происходящее, то эти данные вам ничего не покажут. А ложный корреляций вы можете найти бесчисленное количество. Вычислительные возможности легко позволяют это теперь сделать.

И опять же, как эти данные представить адекватным доступным до человеческого восприятия образом? Ну построили вы "сеть сетей", "матрицу матриц" и "графы графов", а что потом с этим делать? smile3.gif Как это практически использовать.

Именно что получается:

Зачетная техноэротика!

Ну или информационная порнография. smile3.gif Увлекательно, технологично, но совершенно бессмысленно. Сложность ради сложности и как "любовь к искусству". smile3.gif

А какие забавные когнитивные искажения должны возникнуть от просмотра этого "искусства" это еще более интересный вопрос. И тут тоже можно построить "графы графов" и найти массу забавных корреляций. smile3.gif

Аватар пользователя utx
utx (9 лет 3 месяца)

Увлекательно, технологично, но совершенно бессмысленно. Сложность ради сложности и как "любовь к искусству". smile3.gif

Вам что жалко что ли )? 

А пример нормальный, +-также отслеживаются общественные настроения или делаются новостные триггеры для высокочастотной торговли )

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Мне не жалко. Но это как затея с "сети сетей" для CRM, можно, но не нужно никому. 

И мне интересно, вдруг кто может предложить "как это понимать". У меня мозгов не хватает это понять. Хотя понимаю как подступиться к теории, но и понимаю свою ограниченность в понимании. 

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Нифигасе не нужно ))) у бизнюков огромный арсенал таких инструментов...

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Ну и что это дает? smile3.gif Но готов освоить любой бюджет на этой затее. Еще с ходу могу подсказать массу других вариантов построения красивых презентаций. smile3.gif

Помнится я уже вам писал что в сложных системах рулит эмерджентность. Так что если вы не можете высчитать эмерджентность, не можете отличить ложные корреляции от истинных, грубо говоря если у вас нет общей теории, то вы можете осваивать любые бюджеты, находить бесконечные корреляции "длинны бороды и мировых цен на золото", но все это никак практически не применимо. Но доказать что в действительности "это не работает" не просто сложно, а фактически и технически невозможно. Потому что снова и снова будет возникать новые ложные корреляции. А том что все это не работает вы всегда узнаете постфактум. Когда эмерджентность аукнется. 

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Если бы не давало не покупали, рынок огромный этих систем,  все платформы используют.... смешно даже обсуждать.

Аватар пользователя utx
utx (9 лет 3 месяца)

Хе хе достаточно знать, что конкурент верит в такие модели )))) А если серьезно то достаточно много методик для отсечения "бесконечные корреляции", прикол про огурцы и пиратов не на пустом месте вырос. 

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Вам потребуется бесконечное количество методик. И все сложнее и сложнее. Пока вы сами не запутаетесь в вашем модельно-зависимом реализме. 

Так что нужна функциональная теория. 

Аватар пользователя utx
utx (9 лет 3 месяца)

Ну человеки уже достаточно давно придумали всякие random forest, регресии и тд, для оценки важности переменных . Те выделение сильных или групп слабых переменных это так-то основа основ в аналитике.

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Я не просто так упомянул модельно-зависимый реализм. Вы забываете самое важное - наблюдатель тоже часть наблюдаемой системы. 

Те выделение сильных или групп слабых переменных это так-то основа основ в аналитике.

Вот мы и вернулись к началу дискуссия. Без теории данные бессмысленные. Придется "выбрать" теорию для адекватного восприятия данных. Но любая теория будет модельно-зависимым реализмом. Сам факт модели уже меняет наблюдаемую систему.

И с чего и начали, на текущий момент никакой адекватной теории не существует.

А бесконечные корреляции позволяют создать бесконечное количество теорий. И получается никакого практического применения нет. Но можно сколько угодно заниматься "техноэротикой" просто из "любви к искусству". Сложность ради самой сложности. Просто потому что мы можем это сделать. 

Все это я к тому, что наш антропоцентризм и антропоморфизм мешает нам увидеть суть явления и построить адекватные теории. У нас нет верной "системы координат" для понимания.

Аватар пользователя utx
utx (9 лет 3 месяца)

Сложность ради сложности и как "любовь к искусству

Пропустил слово "сложность" Так в том то и мякотка. Еще лет 15-20 назад эта статья превратился бы в огромный талмуд к программно аппаратному комплексу для сурового энтерпрайза, а сейчас ноутбук + пара скриптов. )

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Ну да, дети добрались до "забавных игрушек" и уровня экзофлоповой производительности. И теперь пробуют создавать разные "сложности". Но только это совсем не игра и не игрушки. История с появлением LLM явно намекает что это совсем не игра. 

Аватар пользователя trepalo
trepalo (6 лет 4 месяца)

Интересная прикладушка. Спасибо!

Аватар пользователя delta345
delta345 (9 лет 4 месяца)

Большое спасибо, Роман, очень хороший обзор, очень полезно _лично_ для меня

Аватар пользователя Павел.П.
Павел.П. (4 года 10 месяцев)

Спасибо, очень интересный обзор технологии. Повеяло духом свободы древнего интернета. 😊

По идее, первичную информацию нельзя сплошняком читать даже профессиональным аналитикам, так как  современные мозгопромывательные технологии промывают мозги уже вне зависимости воли читающего/смотрящего и стараются сломать, то что не могут промыть.   Так что фильтры нужны даже для личной гигиены и наверно любопытно и полезно  посмотреть, что же тебе на самом деле пытаются втюхать.  😊

Аватар пользователя DOCTORKOCHEV
DOCTORKOCHEV (4 года 9 месяцев)

Только бумажные книжки переведенные в эпоху существования живых советских переводчиков, остальное невозможно читать.

Школьником поверил в машинный перевод, теперь собачий язык учить поздно.

Для работы хватает машинного.

Но литературу переводят как правило несведующие машины, а затем правят далекие от темы люди, получается нынче отвратненько, прямо скажем...

Аватар пользователя BLIK
BLIK (12 лет 3 недели)

живых советских переводчиков

К слову... Смотрел недавно американский фильм "Поезд на Юму" 1957г.  Сначала начал смотреть с советским дубляжом... ну и, что-то прямо не так, что-то неуловимо нелогично... начал смотреть современный перевод... так и есть, косяки со словами т.к. перевод губной, вырезано куча кадров. Мда.

Аватар пользователя Прогрессор ипономики

"Люби Бога и делай что хочешь."

Аватар пользователя Niss
Niss (10 лет 12 месяцев)

уровень генерируемых самими видеохостингами субтитров как ни странно упал

это не падение, просто в том же английском есть 20 разных английских на которых теперь разговаривают люди со всё падающей культурой речи. Появилась куча динамического слэнга, и привет - от классического английского уже ничего не остаётся, наступила полная эрозия. Применили прямое фонетическое транскрибирование, но (внезапно) оказывается, что у людей и с дикцией-то всё не очень хорошо.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Для нейросетей вроде как раз слэнг не проблема в отличии от классических распознавалок текста в аудио.

Но использованный whisper2 тоже на базе нейросети...

Аватар пользователя Niss
Niss (10 лет 12 месяцев)

не, они тоже ж0стко фейлятся, и в общем случае, нейросеть должна на лету подхватить диалект, акцент, тематику, слэнг, это слишком дорого пока, наверное. Поэтому откатились на прямую транскрипцию. А виспер работает лучше, потому что там относительно классическая речь, это более простая задача. Ну и в русском эрозии не так много

Аватар пользователя utx
utx (9 лет 3 месяца)

Мне кажется наличие srt на ютубе всегда было связанно с системой рекомендаций. Когда классификатору стало достаточно упрощенной версии откатились на нее, экономика должна быть экономной. Ну и последние классификаторы смотрят не только на текст но и на всякие смены кадров, цветокор, эмоциональную наполненность и т д, там текст вообще не участвует.

Аватар пользователя Niss
Niss (10 лет 12 месяцев)

это из комментов доставали, кмк

Аватар пользователя utx
utx (9 лет 3 месяца)

Ну комменты да, но имхо больше уже для кластеризации полученных классов/векторов.