(блог) Инфраструктура НМП

Аватар пользователя RomanSmirnov

(обсчитался малость - удалил тем более на главную попало)

Российская цыфра, бессмысленная и беспощадная.

Яндекс припух конечно такие тарифы выставлять на распознавание аудиоречи.

(слайд один) единица тарификации 1 секунда - 10 копеек. Т.е. чтобы не тратить время на втыкание на ю-туперов даже на двухскоростной перемотке - а сейчас "передачи" пошли по часу в среднем - 3600 секунд это 360 рублей...

Скорость говорения 100 слов в минуту с паузами там и прч в среднем 50. Скорость чтения до 400. При этом в любой речи куча мусора. Вот и считайте. Экономию. Т.е. ю-туп можно только в режиме фона слушать, это же кстати панельных посиделок касается. На профессиональных иногда проскакивают интересные моменты Люди проговариваются, но отслушивать уже обычно многочасовую болтовню сложно даже в фоновом режиме.

Ну ладно отвлекся... по поводу ценообразования.

Сколько там затраты электроэнергии сервера на обработку, его CAPEX, затраты на ФОТ погромистов, которые адаптировали с достаточно большой вероятностью бесплатные алгоритмы? (а сейчас чаще всего _тупо_ гоняли халявные корп данные в готовых нейронных сетях)...

У гугля за 0,004 американского доллара за минуту (слайд два) или секунда меньше копейки. Спасибо братушкам индюкам - IBM ( https://www.ibm.com/cloud/watson-speech-to-text/pricing ) сошел с дистанции...

AWS ( https://aws.amazon.com/transcribe/pricing/ ) еще дешевле.

У майкрософта ажур ( https://azure.microsoft.com/en-us/pricing/details/cognitive-services/spe... ) - ценовая политика как обычно запутанная, но тоже вроде недорого.

Так и живем. Думаю яндекс такой дорогой, потому что заказчик у него госсектор, ну или корп, ну или "заказчик" не нужен и так хорошо. На такси с монопольным положением на рынке и доступом к Ресурсу, проще зарабатывать (по аналогии с расценками на наши ЦОДы, бгг).

Опенсрс?

Старичок https://cmusphinx.github.io/ - ржака, но кстати в прошивках некоторых коммерческих мобильников встречаются следы... т.е. встраивают в. ( Акустические модели не обновляются с 2016 года )


http://julius.osdn.jp/en_index.php - 2014 год
https://kaldi-asr.org/
https://mycroft.ai/ - недоалиса

Ну и ... https://commonvoice.mozilla.org/en ,


https://github.com/mozilla/DeepSpeech (модель для языка китайская, науч работа спонсировалась байду, что как бы все намекает ).

У фейсбуха был https://github.com/flashlight/wav2letter стал https://github.com/flashlight/flashlight . ( для компании с таким капиталом выглядит убого достаточно, моделей языков нет просто считалка).

Короче ничего особенного. Распиаренные нейронные сети... готовых нет.

Коммерческих продуктов в том числе на оных конечно пруд пруди, но... там у большинства как минимум специальные условия использования, которые с улицы то и не узнаешь...

P.S.
Кстате обратите внимание в списке выбора серверов у майкрсофта и амазона, да и если присмотреться гугля отдельным сектором выделены "правительственные".
Краем глаза слежу за строительством глобальной инфраструктуры под планетарное цыфровое правительство (более точный перевод конечно управление) и в принципе там все не останавливалось ни на секунду ни при Трампе, ни при Байдене, бгг.
Потоковое распознавание (и дальнейшее встраивание в более сложные социально-экономические модели) _всех_ коммуникаций между биоединицами его неотъемлемая часть.
Средних размеров локальный контур на 10 млн оных это МАКСИМУМ всего лишь 24 * 10.000.000 * 60 *60 *2 (входной и выходной) * 365 секунд в год. По факту же активно коммуницируют между собой не так уж много людей.
Короче по тарифу гугля какие то несколько миллиардов долларов. ВВП же, даже у без ресурсных территорий, с этими 10 млн обитателей безусловно больше - т.е. овчинка выделки стоит. Да и считать конечно нужно не в резанной, а в кВт*ч затрачиваемых на работу инфраструктуры по обработке всех потоков.
Думаю там не очень много... есть подозрение, что многие контуры в том же ЕС уже полностью, что называется в "облаках". Пока еще напрягает Global South своими размерами, но процесс идет.
 
P.S.
то что яндекс дешевле это хорошо - ценовое давление снизу для гособлаков
Авторство: 
Авторская работа / переводика

Комментарии

Аватар пользователя yoprst
yoprst(9 лет 12 месяцев)

Эх, яблочко, куда ж ты кОтишься..

Аватар пользователя pcmag
pcmag(12 лет 2 месяца)

Заранее прошу прощения, если неправильно понял тему. Ежли Вам просто вытащить текст из youtube, то это бесплатно. Потестировал на собственном ролике. К сожалению у меня более 2 минут видео не бывает. Включаете автосоздание субтитров. Если озвучка по-русски, то получается не идеально, но вряд ли какой сервис сможет лучше сделать. Youtube-ссылку скармливаем серису по вытягиванию субтитров из youtube. Их много разных. Взял первый нагугленный - https://downsub.com/?url=https%3A%2F%2Fyoutu.be%2F2TtMDx55AcA%20 Результат:

для тебя все создаю
для тебя
соловушка пою для тебя
ушные луга
саду цветет незабудка а для тебя солнце
встаёт для тебя
море пою для тебя эти слова
для тебя стр

Аватар пользователя RomanSmirnov
RomanSmirnov(9 лет 11 месяцев)

Она еще работает?

https://vc.ru/services/162486-youtube-otklyuchil-funkciyu-sozdaniya-subt...

 

На самом деле гугль конкретно мониторит использование ресурсов с персональных аккаунтов в том числе

Аватар пользователя pcmag
pcmag(12 лет 2 месяца)

Минуту назад работало. Вы привели ссылку с vc.ru за авторством Липановой :-).

Аватар пользователя RomanSmirnov
RomanSmirnov(9 лет 11 месяцев)

Первое что гугль выдал в поиске, то и привел ))

Сам этим пользовался - несколько суток российской энергонедели перевел в текст и нашел только, то что необходимо...

но есть подозрение, что в промышленных масштабах эта перекладка работать не будет просто, либо с каким то подвохом

Аватар пользователя pcmag
pcmag(12 лет 2 месяца)

После своего гугления я результат протестировал, а Вы поверили на слово. Подвох разумеется есть. Онлайн сервис по сдергиванию субтитров весь экран заполняет рекламой с не совсем одетыми тетками. Так что для офисной работы этот метод рекомендовать не могу :-).

Аватар пользователя не дождетесь
не дождетесь(4 года 6 месяцев)

неотъемлЕмая

Аватар пользователя RomanSmirnov
RomanSmirnov(9 лет 11 месяцев)

fixed

Аватар пользователя Medved075
Medved075(6 лет 3 месяца)

где-то встречал субтитры для караоке в турецком отеле.. там куски слов между собой слеплены были, типа "выха дила песнюзаво дила про худова лысогоос ла"...;)) из той же серии наверна...:)

Аватар пользователя RomanSmirnov
RomanSmirnov(9 лет 11 месяцев)

качество да, иногда страдает даже у "грандов", но у коммерсов прогресс сравнивая с тем же бесплатным "сфинксом" конечно колоссальный. Если специально не шифруются почти все в текст переводится норм

Аватар пользователя sereviel
sereviel(3 года 2 месяца)

Я не понял, вы хотели многочасовые лекции преобразовывать в текст нахаляву? По-моему это наглость. Почему кто-то должен за вас работать бесплатно? Ну нравятся вам допустим лекции Кургиняна. Сами берёте и переводите их в текстовый формат. Либо не хотите вкалывать, и тогда ставите ссылку на двухчасовое видео, за что вам в лицо плюют не только лишь все.

Вы вообще свой рабочий час во сколько оцениваете? Надеюсь гораздо дороже цены на яндексе?

Комментарий администрации:  
*** Отключен (кусок дерьма) ***
Аватар пользователя RomanSmirnov
RomanSmirnov(9 лет 11 месяцев)

перевод "лекций" частная задача... но хотя бы поиск по словам в лекции или заседании мог бы решаться штуками вроде бесплатного сфинкса... но почти все разработки свернуты уже лет 5-7 как - каждый свои "нейронные сети" учит втихаря...  (во всяком случае мне ничего публичного найти не удалось)

Аватар пользователя Фарцовщик
Фарцовщик(12 лет 2 месяца)

Интересно почему вы считаете себя вправе обсуждать цены коммерческой компании?

Ещё и предлагает эту цену "обосновать".

Дорого - не берите.

Комментарий администрации:  
*** Это не ник - это состояние души ***