Как смот­реть аме­ри­кан­ский ты-​туп или чи­тать парижско-​дубайский теле$рам, с гол­ланд­ским дзы­нем и не стать ту-​пым

Аватар пользователя RomanSmirnov
Гаус­сов­ский "белый" ( и не очень ) шум в со­вре­мен­ных ка­на­лах ма$$ медиа про­сто за­шка­ли­ва­ет, со­от­вет­ствен­но, чтобы хоть как то ими поль­зо­вать­ся, необ­хо­ди­мы филь­тры... при­чем не толь­ко на тупо "факт че­кинг", но и неко­то­рые более слож­ные мо­мен­ты.

Тео­ре­ти­че­ских работ до­ста­точ­но много по во­про­су, как из­вле­кать даже из лож­ной ин­фор­ма­ции не лож­ную (не без кон­тек­ста ко­неч­но), есть и раз­лич­ные грубо го­во­ря "плат­ные" сер­ви­сы для обы­ва­те­ля, прав­да в ре­аль­но­сти не так то все про­сто, да и в общем слу­чае вре­ме­ни нет сво­бод­но­го, на вот это вот все. 

Но есть и хо­ро­шие но­во­сти - если рань­ше об­ра­бот­ка ин­фор­ма­ции была до­ступ­на толь­ко профи, то сей­час в прин­ци­пе от­но­си­тель­но при­ем­ле­мо можно де­лать даже дома на ко­лен­ке. 

Так как на самом деле необ­хо­ди­мо смот­реть ви­до­си­ки или тем более чи­тать вся­кую ин­тер­нет шнягу?

Прак­ти­че­ски любое ин­фор­ма­ци­он­ное со­об­ще­ние в ин­тер­не­те, пус­кай даже оно и за­мас­ки­ро­ва­но под "какой нить" из­ви­ня­юсь "высер", рас­кла­ды­ва­ет­ся на век­тор из упо­ми­на­ний чего то или кого то с под­ве­де­ни­ем со­от­вет­ству­ю­щей кон­но­та­ции (обыч­но нега­тив­ной ибо "про­смот­ров боль­ше").

Так как уро­вень "ге­не­ра­то­ров" па­да­ет и все чаще соб­ствен­но эти со­об­ще­ния стро­га­ют по за­дан­ным шаб­ло­нам ней­ро­сет­ки, то и об­рат­ную де­ком­по­зи­цию также можно вы­пол­нить с их по­мо­щью, за­од­но сэко­но­мив время.

Итак - вме­сто траты время на про­смотр "ви­до­са" - можно ре­а­ли­зо­вать сле­ду­ю­щий ал­го­ритм.

Со­хра­ня­ем видео (или аудио), если уже есть суб­тит­ры (одно время мно­гие ви­део­хо­сте­ры де­ла­ли, но сей­час на­ча­ли от­клю­чать - так по­ни­маю эко­но­мят) со­хра­ня­ем и суб­тит­ры, если нет, то ге­не­ри­ру­ем свои, про­пус­ка­ем суб­тит­ры через ПО для вы­де­ле­ния сущ­но­стей ( люди, ком­па­нии на­при­мер ), так же можно вы­де­лить "кон­но­та­ции" - т.е. нега­тив­ный или по­зи­тив­ный кон­текст от­но­си­тель­но "сущ­но­сти" , потом за­но­сим в БД и стро­им карту (можно трех­мер­ную со вре­ме­нем), ну или мат­ри­цу если хо­ти­те.

Кто - про кого и про что, что ска­зал, с одним из из­ме­ре­ний - "вре­ме­нем".  Не обя­за­тель­но это про "друг" про "друж­ку" долж­но быть, можно и от­но­си­тель­но ка­ко­го то "бу­ду­ще­го" или "про­шло­го" - "мема" (все рано или позд­но пре­вра­ща­ет­ся увы в оные).

По ре­зуль­та­там на­при­мер за­мет­но, как на­чи­на­ют как по ко­ман­де  на или за Пуш­ки­на, или за­уныв­но трын­деть про "де­мо­гра­фию." ...

Как это может вы­гля­деть на прак­ти­ке:

Чтобы, как на­зы­ва­ет­ся ни­ко­го слу­чай­но не за­деть, для при­ме­ра возь­мем в наших усло­ви­ях по­лу­и­сто­ри­че­ский ( на­угад - сам и не смот­рел, что там несут ) видос про рус­скую "ли­те­ра­ту­ру" 90-ых:

20241206175705_mceclip0.png

Ты-​туп кста­ти тут уже вы­де­лил "людей" из ви­до­са, раз­ме­тил поток, что тоже удоб­но, для срав­не­ния.

Итак.

Для со­хра­не­ния ви­до­са в папку - де­ла­ем так ( при­вел сразу если кому надо с прок­сей ) , со­хра­ня­ем толь­ко ауди­о­до­рож­ку ( очень редко кто то по­ка­зы­ва­ет слай­ды, т.е. ана­ли­зи­ру­ем толь­ко аудио­ряд  )

yt-​dlp -c -​-proxy "socks5://user:password@ip:port/" -​-sub-format vtt  -​-write-auto-subs -​-write-info-json -​-sub-lang "ru.*" -​-no-abort-on-error -​-ignore-errors -x -f worstaudio -​-audio-format mp3 http://адрес_ви­до­са -o "data/%(upload_date)s_%(id)s.%(ext)s"

Ска­чи­ва­ет­ся:

20241206170625_mceclip1.png

по­лу­ча­ем набор фай­ли­ков: 

20241206171349_mceclip3.png

далее ге­не­ри­ру­ем "суб­тит­ры"  ( бес­плат­ное ПО -  whisper-​ctranslate2 ) если их нет.    Кста­ти по­след­нее время уро­вень ге­не­ри­ру­е­мых са­ми­ми ви­део­хо­стин­га­ми суб­тит­ров как ни стран­но упал  и это на фоне роста мощ­но­стей!.

В дан­ном слу­чае тран­скрип­ция от гугла дей­стви­тель­но про­сто от­вра­ти­тель­но­го ка­че­ства:

20241206171222_mceclip2.png

со­от­вет­ствен­но де­ла­ем свою тран­скрип­цию:

whisper-​ctranslate2 $1 -​-model large-​v3 -​-output_dir outmisc -​-language Russian > $2

и дей­стви­тель­но стран­но, но до­ста­точ­но тупая "до­маш­няя" ней­ро­сет­ка ока­за­лась лучше, чем у гуг­ло­и­дов

20241206171447_mceclip4.png

-​---------

и для вы­де­ле­ния суч­но­стей рань­ше была биб­лио­те­ка от ми­сте­ра Ку­куш­ки­на [ https://lab.alexkuk.ru/ ]   - На­та­ша 

сей­час есть spacy - https://spacy.io/models/ru#ru_core_news_lg ( на его же "неру­си" сде­ла­на )

20241206111344_mceclip0.png

До­пу­стим сде­ла­ем про­стень­кий скрипт с ее ис­поль­зо­ва­ни­ем:

20241206175055_mceclip1.png

Ре­зуль­тат про­го­на через него

20241206175017_mceclip0.png

Как видим уже боль­ше, чем у хугля, ну не суть ( Воз­ник пер­вый же во­про­сик, как хугль от­филь­тро­вал, кого вклю­чать в свою под­бор­ку, отоб­ра­жа­е­мую под ви­до­сом, а кого нет - ибо как видим набор то кон­крет­но по "ширше" будет... ?)

Это все далее за­ки­ды­ва­ет­ся в со­от­вет­ству­ю­щую базу (по­след­нее время пред­по­чи­таю clickhouse ибо он и прав­да _быст­рый_ , хотя ко­неч­но лучше что ни­будь им­пор­то­за­ме­щен­ное типа postgres от мест­ных аст­ро­фи­зи­ков )

На­при­мер в таб­ли­цу с ко­лон­ка­ми:

[ время ] , [ канал ] , [ видос ] , [ тип объ­ек­та ] , [ время упо­ми­на­ния ] , [ кон­но­та­ция ] 

И так по всему, до чего до­тя­нем­ся.

Со­от­вет­ствен­но со вре­ме­нем ста­но­вит­ся легко от­сле­жи­вать, как под­ни­ма­ют­ся "ко­гни­тив­ные" волны по тому или иному "объ­ек­ту", а так же по­яв­ле­ние новых или за­бы­тие "ста­рых" "мемов".

Софт сей­час пи­шет­ся быст­ро - много всего го­то­во­го, легко до­пи­лить на­пиль­ни­ком. Выше про­сто при­мер того, на­сколь­ко это все стало про­сто.

В чем может быть про­бле­ма при "бес­плат­ной" ре­а­ли­за­ции?

На одном "до­маш­нем" при­со­еди­не­нии Вы не смо­же­те мо­ни­то­рить сразу дей­стви­тель­но много ка­на­лов, ска­жем так бес­плат­но.

Что можно сде­лать - со­брать docker образ, либо еще лучше все за­ком­пи­лить в одно при­ло­же­ние (немно­го боль­ше возни, с уче­том ко­ли­че­ства сто­рон­них биб­лио­тек , но тоже ре­а­ли­зу­е­мо во­об­щем то, в т.ч. на arm toolchain чтобы на мо­бил­ках го­нять, бгг) и раз­дать его дру­зя­кам ( обыч­но рас­кла­ды­ва­ет­ся по раз­ным хо­стин­гам ).

Где вот это все будет по­лу­чать ко­ман­ды (типа вы­пол­нить ана­лиз со­от­вет­ству­ю­ще­го url и вер­нуть ре­зуль­тат), далее на­пи­сать неслож­ный сер­вер, ко­то­рый раз­да­ет кли­ен­там за­да­ния и по­лу­ча­ет от них ре­зуль­та­ты об­ра­бот­ки, через апи. 

Таким об­ра­зом "на­род­ный ва­ри­ант" поз­во­лит филь­тро­вать по­то­ки бреда и не очень бреда, об­ру­ши­ва­е­мо­го на го­ло­вы че­ло­веч­ков медиа-​корпами или "эн­ту­зи­а­ста­ми" (в т.ч. псев­до) и вы­де­лять из него толь­ко то, что дей­стви­тель­но ин­те­рес­но, ну и за­од­но под­све­чи­вать ре­аль­ные век­то­ры, вы­яв­лять "волны", "пер­вич­ку" и прч. 

20241206164353_mceclip11.png

Схе­ма­тич­но вот выше.

С управ­ле­ни­ем оче­ре­дью можно тоже особо не за­мо­ра­чи­вать­ся, а сде­лать на го­то­вом - rabbitmq на­при­мер, так как пе­ре­да­ет­ся толь­ко об­ра­бо­тан­ное, то тре­бо­ва­ния к сер­ве­ру ми­ни­маль­ные...

У "ре­клам­щи­ков" есть _кон­крет­но_ про­дви­ну­тые такие Ма­ши­ны, в т.ч. по ска­жем так не со­всем пуб­лич­ным дан­ным (осо­бен­но после того, как они ин­те­гри­ро­ва­лись с те­ле­ком­щи­ка­ми и бан­ки­ра­ми), ко­то­рые "смот­рят и чи­та­ют всё".

Немно­го (ре­аль­но не много) слож­нее схема с сим­во­ли­че­ски­ми ал­лю­зи­я­ми - это когда "ши­ро­ко­ве­ща­те­лем" под­би­ра­ет­ся что то по­хо­жее на,  с уче­том це­ле­во­го кон­тек­ста, но даже с уче­том этого уров­ня все равно по итогу это все чи­стая ме­ха­ни­ка. В под­лож­ке у ко­то­рой лежит либо ком­мер­ция, заказ, либо тупо агрес­сия с век­то­ром атаки.  Из-за чего воз­ни­ка­ет агрес­сия, если это не заказ? Несо­от­вет­ствие кон­тек­стов? Вот тут уже ин­те­рес­ней ко­неч­но.  На­сколь­ко понял есть Мо­де­ли и с ними... 

Сле­ду­ю­щие уров­ни это смы­ка­ние "смот­ря­щих машин" с социо-​экономическими сгуст­ка­ми, име­ю­щи­ми ре­аль­ные ре­сурс­ные воз­мож­но­сти - при­чем порой из раз­ных ад­ми­ни­стра­тив­ных кон­ту­ров.

А так же их раз­бор­ки между собой,  ино­гда вы­гля­дя­щие кон­крет­но за­бав­но.

Слайд из клас­си­ки:

20241206193016_mceclip0.png

Зато даже по­верх­ност­ный ана­лиз про­из­вод­ной от век­то­ров поз­во­ля­ет хотя бы при­бли­зи­тель­но, но все же вос­ста­но­вить ре­аль­ные рас­кла­ды.

Но это уже дру­гая сказ­ка... всем хо­ро­ших вы­ход­ных.

P.S.

Ис­поль­зо­ван­ное ПО:

https://github.com/yt-​dlp/yt-​dlp

https://github.com/Softcatala/whisper-​ctranslate2

https://spacy.io/models/ru#ru_core_news_lg

P.S.  2

Вывод из этой басни про­стой - сле­ду­ет крайне скеп­ти­че­ски от­но­сить­ся к лю­бо­му, как сей­час го­во­рят "кон­тен­ту", про­из­во­ди­мо­му за де­нюж­ку, или про­сто ма$$овому, но не офи­ци­аль­но­му  - и рань­ше то это про­сто кон­крет­но все было ути­ли­тар­но, а сей­час, с раз­ви­ти­ем тех­но­ло­гий пре­вра­ти­лось,  про­сто в "ме­ха­ни­ку". Ака­де­ми­че­ский сек­тор пока еще дер­жит­ся, за счет ин­сти­ту­та ре­цен­зи­ро­ва­ния и сла­бой об­рат­ной связи с раз­ме­ром ауди­то­рии, но тоже ме­ста­ми пре­вра­тил­ся в оную.

Ав­тор­ство: 
Ав­тор­ская ра­бо­та / пе­ре­во­ди­ка

Комментарии

Аватар пользователя roman_ke
roman_ke (8 лет 5 месяцев)

Люди про­сто не  по­ня­ли что им тут на­пи­са­ли :)

Про­сто ан­глий­ско­го языка да и еще и вме­сте со скри­на­ми с Linux да и в при­да­чу со скрип­та­ми смот­рят­ся как в филь­мах про ха­ке­ров, проще объ­яс­нять надо!

Аватар пользователя anamitos
anamitos (12 лет 6 месяцев)

Я, как под­мно­же­ство людей, ко­то­рые, ско­рее всего, не по­ня­ли что им на­пи­са­ли, еще и не понял зачем это мне?  В пе­ре­ры­вах между по­пыт­ка­ми как-​то спа­сти свои пен­си­он­ные на­коп­ле­ния и по­ис­ка­ми де­ше­вой греч­ки, ана­ли­зи­ро­вать ал­го­рит­мы обол­ва­ни­ва­ния и ма­ни­пу­ли­ро­ва­ния? Как мне это по­мо­жет? Я знаю, что они есть. Мне ка­жет­ся, этого до­ста­точ­но.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

"Греч­ку" коммерсы-​ритейлеры сей­час по­хо­же рыз­г­ры­ва­ют ал­го­рит­ма­ми, как раз в т.ч. на медиа и ра­бо­та с ними могла бы по­мочь и обы­ва­те­лям.... 

Ну или хотя бы по­ни­мать, как все устро­е­но, таи ни­ка­кой кон­спи­ро­ло­гии про­сто биз­нес по­хо­же.

Аватар пользователя Карвель
Карвель (6 лет 3 месяца)

еще и не понял зачем это мне?

При­со­еди­ня­юсь. Во­об­ще... По воз­мож­но­сти ста­ра­юсь (пы­та­юсь) ограж­дать себя от но­вост­ной ин­фор­ма­ции, осо­бен­но по­ли­ти­че­ской. Аб­со­лют­но со­гла­сен с Пав­лом Ще­ли­ным, что дей­стви­тель­но важ­ные со­бы­тия мимо тебя не прой­дут, даже если не смот­реть ТВ, не хо­дить в тыр­нет и не слу­шать радио. Хотя слож­но... Вечно ле­зешь послущать-​глянуть.

... а в ма­шине, на про­гул­ке, в ма­га­зине и проч. пы­та­юсь слу­шать или аудиок­ни­ги клас­си­че­ские, или по­пу­ляр­ные лек­ции по ис­то­рии, фи­зи­ке, пси­хо­ло­гии и проч. 

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

И это пра­виль­но! 

Но­во­сти давно из но­во­стей пре­вра­ти­лись в что то стран­ное... 

Аватар пользователя Добренький
Добренький (11 лет 7 месяцев)

Кар­тин­ки, таб­ли­цы про­пус­ка­ем, в про­ле­тар­скую суть вни­ка­ем.smile1.gif

Вывод из этой басни про­стой - сле­ду­ет крайне скеп­ти­че­ски от­но­сить­ся к лю­бо­му, как сей­час го­во­рят "кон­тен­ту", про­из­во­ди­мо­му за де­нюж­ку, или про­сто ма$$овому - и рань­ше то это про­сто кон­крет­но все было ути­ли­тар­но, а сей­час, с раз­ви­ти­ем тех­но­ло­гий пре­вра­ти­лось,  про­сто в "ме­ха­ни­ку". Ака­де­ми­че­ский сек­тор пока еще дер­жит­ся, за счет ин­сти­ту­та ре­цен­зи­ро­ва­ния и сла­бой об­рат­ной связи с раз­ме­ром ауди­то­рии, но тоже ме­ста­ми пре­вра­тил­ся в оную.

Аватар пользователя Ayatola
Ayatola (12 лет 4 дня)

Ну вот же вы­жим­ка: Вывод из этой басни про­стой - сле­ду­ет крайне скеп­ти­че­ски от­но­сить­ся к лю­бо­му, как сей­час го­во­рят "кон­тен­ту"

В том числе и к этой ста­тье. Как там у Бер­ке­ма - зачем ЭТО ска­за­ли, зачем это ска­за­ли ТЕБЕ, зачем это ска­за­ли тебе СЕЙ­ЧАС.

Аватар пользователя Taylak
Taylak (8 лет 5 месяцев)

smile8.gif

Аватар пользователя e.tvorogov
e.tvorogov (9 лет 3 месяца)

Сам прин­цип со­зда­ния ви­део­кон­тен­та таков, чтобы охва­тить как можно боль­шую ауди­то­рию по те­ма­ти­ке. Со­от­вет­ствен­но, ему по­ла­га­ет­ся быть популярно-​доходчивым, ради чего можно (и нужно) жерт­во­вать пол­но­той и слож­но­стью ин­фор­ма­ции. Да в прин­ци­пе, и с тек­сто­вы­ми ста­тья­ми то же самое. Бе­рёшь, очер­чи­ва­ешь тему и го­во­ришь по ней то, что хо­чет­ся в дан­ный мо­мент. А се­рьёз­ная ин­фор­ма­ция — да, она на ака­де­ми­че­ском уровне. И ещё «в сек­рет­ных ка­би­не­тах».

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Ну и смысл такое по­треб­лять, если это не офи­ци­аль­ная ин­фор­ма­ция?

Аватар пользователя e.tvorogov
e.tvorogov (9 лет 3 месяца)

Пред­по­ло­жу, что да­ле­ко не все спо­соб­ны и хотят усва­и­вать се­рьёз­ную, глу­бо­ко про­ду­ман­ную и про­ра­бо­тан­ную ин­фор­ма­цию. Тео­ре­ти­че­ские вещи уже от­се­ка­ют мно­гих, ори­ен­ти­ро­ван­ных на кон­кре­ти­ку. И тем более дис­курс о воз­мож­но­сти той или иной тео­рии — про­цент ин­те­ре­су­ю­щих­ся на этом уровне ис­че­за­ю­ще мал, по­то­му что выше него нет ни­че­го. В по­дав­ля­ю­щем боль­шин­стве слу­ча­ев люди об­хо­дят­ся фраг­мен­тар­ным и необя­за­тель­но ис­тин­ным зна­ни­ем, живут каж­дый в своём ин­фор­ма­ци­он­ном пу­зы­ре и не по­ни­ма­ют, зачем им знать и уметь что-​то боль­ше того, чем они по­вто­ря­ют каж­дый день. Это во­прос ам­би­ций, и по­че­му они у кого-​то есть, а кому-​то до­ста­точ­но име­ю­ще­го­ся — сие тайна ве­ли­кая есть.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

По моей субьек­тив­ной оцен­ке народ у нас до­ста­точ­но со­об­ра­зи­тель­ный и без тео­рии норм сам филь­тру­ет на ин­ту­и­ции.

Трил­ли­ар­ды про­смот­ров на пло­щад­ках часто ри­со­ван­ные (осо­бен­но если они для от­чет­но­сти).

За­мет­ку на­пи­сал может кому то при­го­дит­ся в прак­ти­че­ском плане... сам поль­зу­юсь ино­гда удоб­но.

Аватар пользователя e.tvorogov
e.tvorogov (9 лет 3 месяца)

народ у нас до­ста­точ­но со­об­ра­зи­тель­ный и без тео­рии норм сам филь­тру­ет на ин­ту­и­ции

Есть раз­ни­ца, про­ис­хо­дит ли такая филь­тра­ция в мо­мен­те или на дол­го­сро­ке. В мо­мен­те — да, со­гла­сен. Но по моей ис­сле­до­ва­тель­ской те­ма­ти­ке (субъ­ек­тив­ное стро­е­ние че­ло­ве­ка) она не про­ка­ты­ва­ет. Нигде так не царят пред­рас­суд­ки, как в оцен­ке дру­гих людей, но большинство-​то счи­та­ет, что они судят друг о друге ис­тин­но. Даже слово «объ­ек­тив­но» вво­ра­чи­ва­ют, ведь на по­ве­де­ние же смот­рят. Ладно, сорри, от­кло­ня­юсь от темы.

Аватар пользователя Dzensnami
Dzensnami (7 лет 12 месяцев)

Круто! Ута­щил в за­клад­ки!

Аватар пользователя valerkav
valerkav (12 лет 8 месяцев)

Спа­си­бо за на­вод­ку, как раз хотел радио мо­ни­то­рить - в об­ла­ко слов по ча­сто­те упо­ми­на­ния.

Аватар пользователя викт54
викт54 (2 года 5 месяцев)

Можно по­про­бо­вать "вы­де­лить сущ­ность" оче­ред­но­го тек­ста Ро­ма­на Смир­но­ва:

Ос­нов­ной во­прос: ... на самом деле необ­хо­ди­мо ли смот­реть ви­до­си­ки или тем более чи­тать вся­кую ин­тер­нет шнягу?

Смот­реть ви­до­си­ки (ви­део­кон­тент) - себя не ува­жать, разве что ввиду край­ней необ­хо­ди­мо­сти (по­пу­ляр­но­сти, до­ход­чи­во­сти)!

Чи­тать тек­сто­вые ста­тьи - есте­ствен­но, нужно по диа­го­на­ли с целью "вы­де­ле­ния сущ­но­сти (сути, смыс­ла). 

Рас­смат­ри­вать необ­хо­ди­мо и нега­тив­ный и по­зи­тив­ный кон­текст от­но­си­тель­но "сущ­но­сти", в про­тив­ном слу­чае есть опас­ность ока­зать­ся вдруг и неожи­дан­но в пол­ном окру­же­нии бурно раз­мно­жа­ю­щей­ся ли­бе­ро­ид­ной мрази. Лучше - как-​нибудь по воз­мож­но­сти за­ра­нее при­го­то­вить­ся к этому. 

Что ка­са­ет­ся ли­те­ра­ту­ры, без вся­ких на­туж­ных ис­сле­до­ва­ний, уже давно стало ясно, что она пе­ре­ста­ла за­ни­мать то место, ко­то­рое она рань­ше за­ни­ма­ла в нашей жизни.  Остат­ки ин­те­ре­са у неко­то­рых вы­зы­ва­ют де­тек­ти­вы (пре­ступ­ле­ния, убий­ства, ро­ман­ти­за­ция кри­ми­на­ла), фан­та­сти­ка - фэн­те­зи (необуз­дан­ные из­мыш­ле­ния, ро­ман­ти­за­ция при­чуд), лю­бов­ный роман (пе­ре­тря­хи­ва­ние гряз­но­го белья, под­гля­ды­ва­ние в раз­ные "сква­жи­ны", ро­ман­ти­за­ция гла­му­ра и пош­ло­сти). 

Аватар пользователя Fandaal
Fandaal (10 лет 5 месяцев)

Зачем со­зда­вать себе про­бле­мы? Смот­реть негод­ное, а потом (или до) рих­то­вать и пи­лить его.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Год­ное тоже надо филь­тро­вать иначе вре­ме­ни ни на что не хва­тит...

Аватар пользователя thinkman
thinkman (1 год 1 месяц)

стан­дарт­ные темы, у того же freeswitch, на базе ко­то­ро­го почти вся ip-​телефония (ко­ман­да от асте­ри­с­ка) есть го­то­вые s2t и t2s (speech to text и на­обо­рот) биб­лио­те­ки, во­об­ще в ри­л­тай­ме стоп­сло­ва ищешь или видит опе­ра­тор какого-​нибудь колл­цен­тра, ана­ло­гич­но ему тра­фик видео-​аудио для филь­тра­ции на­трав­ли­ва­ешь.

текст жаль те­рать, остав­ляя толь­ко сущности-​стопслова, по­это­му ис­поль­зу­ют хра­ни­ли­ще с fts (full text search), где пол­но­цен­ные па­де­жи, скло­не­ния, по кор­ням можно найти и проч,

в при­ро­де остал­ся жив толь­ко про­дукт lucene, его апач за­ха­пал, можно также от апача solr по­ста­вить, для неболь­ших задач хва­тит, на по­боль­ше opensearch (быв­ший ела­стик) в нем же ре­а­ли­зо­вать спра­воч­ни­ки раз­ных сущ­но­стей в за­ви­си­мо­сти от задач или кон­тек­стов со ссыл­ка­ми на сами документы-​контектсы, т.е. сущ­ность 1 к мно­гим ука­зы­ва­ет на до­ку­мен­ты и места, где упо­треб­ля­лась,

се­ман­ти­ки тол­ко­вой нет и не будет, тут при­дет­ся с че­ло­ве­че­скм фак­то­ром са­мо­му.

а для дома хва­тит самой либы apache-​lucene, толь­ко с пи­то­ном по­дру­жить через py4j, раз так стру­мент нра­вит­ся.

вкра­те обыч­но так де­ла­ет­ся в кон­то­рах, где спай­де­ры тыр­нет шер­стят на пред­мет вы­яв­ле­ния тен­ден­ций.

и, уже имея спра­воч­ни­ки сущностей-​стопслов уже более слож­ные ал­го­рит­мы вы­яв­ле­ния свя­зей вклю­ча­ют­ся, вплоть до вы­чис­ле­ния узла, от­ку­да вся ветка фей­ков стар­то­ва­ла.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Есть ссыл­ка на s2t ? Оно от­кры­то?

Если это что то ста­рое опен­сорс­ное аля сфинкс, то там не очень... 

Так то ко­неч­но у профи, чего толь­ко нет.

Аватар пользователя thinkman
thinkman (1 год 1 месяц)

сфинк­са много лет уже не видно, его так из мо­но­ли­та и не раз­ви­ли, это было как раз, когда за­ко­па­ли за­ме­ча­тель­ную биб­лио­те­ку на c++ для lucene и оста­ви­ли в до­сту­пе толь­ко на жа­ва­сте­ке (уве­рен, что сиш­ную раз­ви­ва­ют за­кры­то, все-​таки мак­си­маль­но быст­рая), тогда же вой­нуш­ка и шла за FTS, оче­вид­но было, что за этим бу­ду­щее.

мо­ду­лей для свича хва­та­ет, на­при­мер вот

https://github.com/voicegain/mod_voicegain

вроде 4 года назад что-​то ме­ня­ли, есть ста­рые стан­данрт­ные, все от­кры­тый код, как и сам freeswitch

https://docs.freeswitch.org/ (doxygen)

можно во­об­ще от­дель­ные ре­а­ли­за­ции s2t(stt) по­смот­реть, у ян­дек­са были от­кры­ты ис­ход­ни­ки.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Спа­си­бо, срав­ню с вис­пе­ром...  после ян­дек­сов­ской от­кры­той то­ми­ты (  https://yandex.ru/dev/tomita/ ) ни­че­го у них не смот­рю... (не очень ока­за­лась), а апи не ин­те­рес­но

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

эээ, если пра­виль­но понял, там мо­дуль по ссыл­ке это оберт­ка к api voicegain https://console.voicegain.ai/login ... не, такое не очень ин­те­рес­но.

Аватар пользователя utx
utx (9 лет 3 месяца)

За­чет­ная тех­но­эро­ти­ка!

А даль­ше по­верх clickhouse по­ло­жить эла­стик с гра­фо­вой аг­ре­га­ци­ей и оно кра­си­во от­ри­су­ет кто какие вбро­сы стро­ил, кто по­вто­рял и т д )

А еще в clickhouse можно за­гнать сами век­то­ры и уже по ним по­стро­ит свой клас­си­фи­ка­тор или ба­наль­ный cosin )

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

имен­но,

но боль­ше идея про асим­мет­рию к воз­мож­но­сти кор­пов,  через рас­пре­де­лен­ное при­ло­же­ние ин­те­рес­на...

Аватар пользователя utx
utx (9 лет 3 месяца)

про асим­мет­рию к воз­мож­но­сти кор­пов,

У https://laion.ai/ на гите где-​то есть такой центр как вы опи­са­ли, толь­ко они для кар­ти­нок поль­зу­ют.

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

А даль­ше по­верх clickhouse по­ло­жить эла­стик с гра­фо­вой аг­ре­га­ци­ей и оно кра­си­во от­ри­су­ет кто какие вбро­сы стро­ил, кто по­вто­рял и т д )

smile3.gif Если у вас нет тео­рии объ­яс­ня­ю­щей про­ис­хо­дя­щее, то эти дан­ные вам ни­че­го не по­ка­жут. А лож­ный кор­ре­ля­ций вы мо­же­те найти бес­чис­лен­ное ко­ли­че­ство. Вы­чис­ли­тель­ные воз­мож­но­сти легко поз­во­ля­ют это те­перь сде­лать.

И опять же, как эти дан­ные пред­ста­вить адек­ват­ным до­ступ­ным до че­ло­ве­че­ско­го вос­при­я­тия об­ра­зом? Ну по­стро­и­ли вы "сеть сетей", "мат­ри­цу мат­риц" и "графы гра­фов", а что потом с этим де­лать? smile3.gif Как это прак­ти­че­ски ис­поль­зо­вать.

Имен­но что по­лу­ча­ет­ся:

За­чет­ная тех­но­эро­ти­ка!

Ну или ин­фор­ма­ци­он­ная пор­но­гра­фия. smile3.gif Увле­ка­тель­но, тех­но­ло­гич­но, но со­вер­шен­но бес­смыс­лен­но. Слож­ность ради слож­но­сти и как "лю­бовь к ис­кус­ству". smile3.gif

А какие за­бав­ные ко­гни­тив­ные ис­ка­же­ния долж­ны воз­ник­нуть от про­смот­ра этого "ис­кус­ства" это еще более ин­те­рес­ный во­прос. И тут тоже можно по­стро­ить "графы гра­фов" и найти массу за­бав­ных кор­ре­ля­ций. smile3.gif

Аватар пользователя utx
utx (9 лет 3 месяца)

Увле­ка­тель­но, тех­но­ло­гич­но, но со­вер­шен­но бес­смыс­лен­но. Слож­ность ради слож­но­сти и как "лю­бовь к ис­кус­ству". smile3.gif

Вам что жалко что ли )? 

А при­мер нор­маль­ный, +-​также от­сле­жи­ва­ют­ся об­ще­ствен­ные на­стро­е­ния или де­ла­ют­ся но­вост­ные триг­ге­ры для вы­со­ко­ча­стот­ной тор­гов­ли )

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Мне не жалко. Но это как затея с "сети сетей" для CRM, можно, но не нужно ни­ко­му. 

И мне ин­те­рес­но, вдруг кто может пред­ло­жить "как это по­ни­мать". У меня моз­гов не хва­та­ет это по­нять. Хотя по­ни­маю как под­сту­пить­ся к тео­рии, но и по­ни­маю свою огра­ни­чен­ность в по­ни­ма­нии. 

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Ни­фи­га­се не нужно ))) у биз­ню­ков огром­ный ар­се­нал таких ин­стру­мен­тов...

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Ну и что это дает? smile3.gif Но готов осво­ить любой бюд­жет на этой затее. Еще с ходу могу под­ска­зать массу дру­гих ва­ри­ан­тов по­стро­е­ния кра­си­вых пре­зен­та­ций. smile3.gif

Пом­нит­ся я уже вам писал что в слож­ных си­сте­мах рулит эмер­джент­ность. Так что если вы не мо­же­те вы­счи­тать эмер­джент­ность, не мо­же­те от­ли­чить лож­ные кор­ре­ля­ции от ис­тин­ных, грубо го­во­ря если у вас нет общей тео­рии, то вы мо­же­те осва­и­вать любые бюд­же­ты, на­хо­дить бес­ко­неч­ные кор­ре­ля­ции "длин­ны бо­ро­ды и ми­ро­вых цен на зо­ло­то", но все это никак прак­ти­че­ски не при­ме­ни­мо. Но до­ка­зать что в дей­стви­тель­но­сти "это не ра­бо­та­ет" не про­сто слож­но, а фак­ти­че­ски и тех­ни­че­ски невоз­мож­но. По­то­му что снова и снова будет воз­ни­кать новые лож­ные кор­ре­ля­ции. А том что все это не ра­бо­та­ет вы все­гда узна­е­те пост­фак­тум. Когда эмер­джент­ность аук­нет­ся. 

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Если бы не да­ва­ло не по­ку­па­ли, рынок огром­ный этих си­стем,  все плат­фор­мы ис­поль­зу­ют.... смеш­но даже об­суж­дать.

Аватар пользователя utx
utx (9 лет 3 месяца)

Хе хе до­ста­точ­но знать, что кон­ку­рент верит в такие мо­де­ли )))) А если се­рьез­но то до­ста­точ­но много ме­то­дик для от­се­че­ния "бес­ко­неч­ные кор­ре­ля­ции", при­кол про огур­цы и пи­ра­тов не на пу­стом месте вырос. 

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Вам по­тре­бу­ет­ся бес­ко­неч­ное ко­ли­че­ство ме­то­дик. И все слож­нее и слож­нее. Пока вы сами не за­пу­та­е­тесь в вашем модельно-​зависимом ре­а­лиз­ме. 

Так что нужна функ­ци­о­наль­ная тео­рия. 

Аватар пользователя utx
utx (9 лет 3 месяца)

Ну че­ло­ве­ки уже до­ста­точ­но давно при­ду­ма­ли вся­кие random forest, ре­гре­сии и тд, для оцен­ки важ­но­сти пе­ре­мен­ных . Те вы­де­ле­ние силь­ных или групп сла­бых пе­ре­мен­ных это так-​то ос­но­ва основ в ана­ли­ти­ке.

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Я не про­сто так упо­мя­нул модельно-​зависимый ре­а­лизм. Вы за­бы­ва­е­те самое важ­ное - на­блю­да­тель тоже часть на­блю­да­е­мой си­сте­мы. 

Те вы­де­ле­ние силь­ных или групп сла­бых пе­ре­мен­ных это так-​то ос­но­ва основ в ана­ли­ти­ке.

Вот мы и вер­ну­лись к на­ча­лу дис­кус­сия. Без тео­рии дан­ные бес­смыс­лен­ные. При­дет­ся "вы­брать" тео­рию для адек­ват­но­го вос­при­я­тия дан­ных. Но любая тео­рия будет модельно-​зависимым ре­а­лиз­мом. Сам факт мо­де­ли уже ме­ня­ет на­блю­да­е­мую си­сте­му.

И с чего и на­ча­ли, на те­ку­щий мо­мент ни­ка­кой адек­ват­ной тео­рии не су­ще­ству­ет.

А бес­ко­неч­ные кор­ре­ля­ции поз­во­ля­ют со­здать бес­ко­неч­ное ко­ли­че­ство тео­рий. И по­лу­ча­ет­ся ни­ка­ко­го прак­ти­че­ско­го при­ме­не­ния нет. Но можно сколь­ко угод­но за­ни­мать­ся "тех­но­эро­ти­кой" про­сто из "любви к ис­кус­ству". Слож­ность ради самой слож­но­сти. Про­сто по­то­му что мы можем это сде­лать. 

Все это я к тому, что наш ан­тро­по­цен­тризм и ан­тро­по­мор­физм ме­ша­ет нам уви­деть суть яв­ле­ния и по­стро­ить адек­ват­ные тео­рии. У нас нет вер­ной "си­сте­мы ко­ор­ди­нат" для по­ни­ма­ния.

Аватар пользователя utx
utx (9 лет 3 месяца)

Слож­ность ради слож­но­сти и как "лю­бовь к ис­кус­ству

Про­пу­стил слово "слож­ность" Так в том то и мя­кот­ка. Еще лет 15-20 назад эта ста­тья пре­вра­тил­ся бы в огром­ный тал­муд к про­грамм­но ап­па­рат­но­му ком­плек­су для су­ро­во­го эн­тер­прай­за, а сей­час но­ут­бук + пара скрип­тов. )

Аватар пользователя Корректор
Корректор (8 лет 2 недели)

Ну да, дети до­бра­лись до "за­бав­ных иг­ру­шек" и уров­ня эк­зо­фло­по­вой про­из­во­ди­тель­но­сти. И те­перь про­бу­ют со­зда­вать раз­ные "слож­но­сти". Но толь­ко это со­всем не игра и не иг­руш­ки. Ис­то­рия с по­яв­ле­ни­ем LLM явно на­ме­ка­ет что это со­всем не игра. 

Аватар пользователя trepalo
trepalo (6 лет 4 месяца)

Ин­те­рес­ная при­кла­душ­ка. Спа­си­бо!

Аватар пользователя delta345
delta345 (9 лет 4 месяца)

Боль­шое спа­си­бо, Роман, очень хо­ро­ший обзор, очень по­лез­но _лично_ для меня

Аватар пользователя Павел.П.
Павел.П. (4 года 10 месяцев)

Спа­си­бо, очень ин­те­рес­ный обзор тех­но­ло­гии. По­ве­я­ло духом сво­бо­ды древ­не­го ин­тер­не­та. 😊

По идее, пер­вич­ную ин­фор­ма­цию нель­зя сплош­ня­ком чи­тать даже про­фес­си­о­наль­ным ана­ли­ти­кам, так как  со­вре­мен­ные моз­го­про­мы­ва­тель­ные тех­но­ло­гии про­мы­ва­ют мозги уже вне за­ви­си­мо­сти воли чи­та­ю­ще­го/смот­ря­ще­го и ста­ра­ют­ся сло­мать, то что не могут про­мыть.   Так что филь­тры нужны даже для лич­ной ги­ги­е­ны и на­вер­но лю­бо­пыт­но и по­лез­но  по­смот­реть, что же тебе на самом деле пы­та­ют­ся втю­хать.  😊

Аватар пользователя DOCTORKOCHEV
DOCTORKOCHEV (4 года 9 месяцев)

Толь­ко бу­маж­ные книж­ки пе­ре­ве­ден­ные в эпоху су­ще­ство­ва­ния живых со­вет­ских пе­ре­вод­чи­ков, осталь­ное невоз­мож­но чи­тать.

Школь­ни­ком по­ве­рил в ма­шин­ный пе­ре­вод, те­перь со­ба­чий язык учить позд­но.

Для ра­бо­ты хва­та­ет ма­шин­но­го.

Но ли­те­ра­ту­ру пе­ре­во­дят как пра­ви­ло несве­ду­ю­щие ма­ши­ны, а затем пра­вят да­ле­кие от темы люди, по­лу­ча­ет­ся нынче от­врат­нень­ко, прямо ска­жем...

Аватар пользователя BLIK
BLIK (12 лет 2 недели)

живых со­вет­ских пе­ре­вод­чи­ков

К слову... Смот­рел недав­но аме­ри­кан­ский фильм "Поезд на Юму" 1957г.  Сна­ча­ла начал смот­реть с со­вет­ским дуб­ля­жом... ну и, что-​то прямо не так, что-​то неуло­ви­мо нело­гич­но... начал смот­реть со­вре­мен­ный пе­ре­вод... так и есть, ко­ся­ки со сло­ва­ми т.к. пе­ре­вод губ­ной, вы­ре­за­но куча кад­ров. Мда.

Аватар пользователя Прогрессор ипономики

"Люби Бога и делай что хо­чешь."

Аватар пользователя Niss
Niss (10 лет 12 месяцев)

уро­вень ге­не­ри­ру­е­мых са­ми­ми ви­део­хо­стин­га­ми суб­тит­ров как ни стран­но упал

это не па­де­ние, про­сто в том же ан­глий­ском есть 20 раз­ных ан­глий­ских на ко­то­рых те­перь раз­го­ва­ри­ва­ют люди со всё па­да­ю­щей куль­ту­рой речи. По­яви­лась куча ди­на­ми­че­ско­го сл­эн­га, и при­вет - от клас­си­че­ско­го ан­глий­ско­го уже ни­че­го не оста­ёт­ся, на­сту­пи­ла пол­ная эро­зия. При­ме­ни­ли пря­мое фо­не­ти­че­ское транс­кри­би­ро­ва­ние, но (вне­зап­но) ока­зы­ва­ет­ся, что у людей и с дикцией-​то всё не очень хо­ро­шо.

Аватар пользователя RomanSmirnov
RomanSmirnov (10 лет 11 месяцев)

Для ней­ро­се­тей вроде как раз слэнг не про­бле­ма в от­ли­чии от клас­си­че­ских рас­по­зна­ва­лок тек­ста в аудио.

Но ис­поль­зо­ван­ный whisper2 тоже на базе ней­ро­се­ти...

Аватар пользователя Niss
Niss (10 лет 12 месяцев)

не, они тоже ж0стко фей­лят­ся, и в общем слу­чае, ней­ро­сеть долж­на на лету под­хва­тить диа­лект, ак­цент, те­ма­ти­ку, слэнг, это слиш­ком до­ро­го пока, на­вер­ное. По­это­му от­ка­ти­лись на пря­мую тран­скрип­цию. А вис­пер ра­бо­та­ет лучше, по­то­му что там от­но­си­тель­но клас­си­че­ская речь, это более про­стая за­да­ча. Ну и в рус­ском эро­зии не так много

Аватар пользователя utx
utx (9 лет 3 месяца)

Мне ка­жет­ся на­ли­чие srt на ютубе все­гда было свя­зан­но с си­сте­мой ре­ко­мен­да­ций. Когда клас­си­фи­ка­то­ру стало до­ста­точ­но упро­щен­ной вер­сии от­ка­ти­лись на нее, эко­но­ми­ка долж­на быть эко­ном­ной. Ну и по­след­ние клас­си­фи­ка­то­ры смот­рят не толь­ко на текст но и на вся­кие смены кад­ров, цве­то­кор, эмо­ци­о­наль­ную на­пол­нен­ность и т д, там текст во­об­ще не участ­ву­ет.

Аватар пользователя Niss
Niss (10 лет 12 месяцев)

это из ком­мен­тов до­ста­ва­ли, кмк

Аватар пользователя utx
utx (9 лет 3 месяца)

Ну ком­мен­ты да, но имхо боль­ше уже для кла­сте­ри­за­ции по­лу­чен­ных клас­сов/век­то­ров.