(обсчитался малость - удалил тем более на главную попало)
Российская цыфра, бессмысленная и беспощадная.
Яндекс припух конечно такие тарифы выставлять на распознавание аудиоречи.
(слайд один) единица тарификации 1 секунда - 10 копеек. Т.е. чтобы не тратить время на втыкание на ю-туперов даже на двухскоростной перемотке - а сейчас "передачи" пошли по часу в среднем - 3600 секунд это 360 рублей...
Скорость говорения 100 слов в минуту с паузами там и прч в среднем 50. Скорость чтения до 400. При этом в любой речи куча мусора. Вот и считайте. Экономию. Т.е. ю-туп можно только в режиме фона слушать, это же кстати панельных посиделок касается. На профессиональных иногда проскакивают интересные моменты Люди проговариваются, но отслушивать уже обычно многочасовую болтовню сложно даже в фоновом режиме.
Ну ладно отвлекся... по поводу ценообразования.
Сколько там затраты электроэнергии сервера на обработку, его CAPEX, затраты на ФОТ погромистов, которые адаптировали с достаточно большой вероятностью бесплатные алгоритмы? (а сейчас чаще всего _тупо_ гоняли халявные корп данные в готовых нейронных сетях)...
У гугля за 0,004 американского доллара за минуту (слайд два) или секунда меньше копейки. Спасибо братушкам индюкам - IBM ( https://www.ibm.com/cloud/watson-speech-to-text/pricing ) сошел с дистанции...
AWS ( https://aws.amazon.com/transcribe/pricing/ ) еще дешевле.
У майкрософта ажур ( https://azure.microsoft.com/en-us/pricing/details/cognitive-services/spe... ) - ценовая политика как обычно запутанная, но тоже вроде недорого.
Так и живем. Думаю яндекс такой дорогой, потому что заказчик у него госсектор, ну или корп, ну или "заказчик" не нужен и так хорошо. На такси с монопольным положением на рынке и доступом к Ресурсу, проще зарабатывать (по аналогии с расценками на наши ЦОДы, бгг).
Опенсрс?
Старичок https://cmusphinx.github.io/ - ржака, но кстати в прошивках некоторых коммерческих мобильников встречаются следы... т.е. встраивают в. ( Акустические модели не обновляются с 2016 года )
http://julius.osdn.jp/en_index.php - 2014 год
https://kaldi-asr.org/
https://mycroft.ai/ - недоалиса
Ну и ... https://commonvoice.mozilla.org/en ,
https://github.com/mozilla/DeepSpeech (модель для языка китайская, науч работа спонсировалась байду, что как бы все намекает ).
У фейсбуха был https://github.com/flashlight/wav2letter стал https://github.com/flashlight/flashlight . ( для компании с таким капиталом выглядит убого достаточно, моделей языков нет просто считалка).
Короче ничего особенного. Распиаренные нейронные сети... готовых нет.
Коммерческих продуктов в том числе на оных конечно пруд пруди, но... там у большинства как минимум специальные условия использования, которые с улицы то и не узнаешь...
Комментарии
Эх, яблочко, куда ж ты кОтишься..
Заранее прошу прощения, если неправильно понял тему. Ежли Вам просто вытащить текст из youtube, то это бесплатно. Потестировал на собственном ролике. К сожалению у меня более 2 минут видео не бывает. Включаете автосоздание субтитров. Если озвучка по-русски, то получается не идеально, но вряд ли какой сервис сможет лучше сделать. Youtube-ссылку скармливаем серису по вытягиванию субтитров из youtube. Их много разных. Взял первый нагугленный - https://downsub.com/?url=https%3A%2F%2Fyoutu.be%2F2TtMDx55AcA%20 Результат:
для тебя все создаю
для тебя
соловушка пою для тебя
ушные луга
саду цветет незабудка а для тебя солнце
встаёт для тебя
море пою для тебя эти слова
для тебя стр
Она еще работает?
https://vc.ru/services/162486-youtube-otklyuchil-funkciyu-sozdaniya-subt...
На самом деле гугль конкретно мониторит использование ресурсов с персональных аккаунтов в том числе
Минуту назад работало. Вы привели ссылку с vc.ru за авторством Липановой :-).
Первое что гугль выдал в поиске, то и привел ))
Сам этим пользовался - несколько суток российской энергонедели перевел в текст и нашел только, то что необходимо...
но есть подозрение, что в промышленных масштабах эта перекладка работать не будет просто, либо с каким то подвохом
После своего гугления я результат протестировал, а Вы поверили на слово. Подвох разумеется есть. Онлайн сервис по сдергиванию субтитров весь экран заполняет рекламой с не совсем одетыми тетками. Так что для офисной работы этот метод рекомендовать не могу :-).
неотъемлЕмая
fixed
где-то встречал субтитры для караоке в турецком отеле.. там куски слов между собой слеплены были, типа "выха дила песнюзаво дила про худова лысогоос ла"...;)) из той же серии наверна...:)
качество да, иногда страдает даже у "грандов", но у коммерсов прогресс сравнивая с тем же бесплатным "сфинксом" конечно колоссальный. Если специально не шифруются почти все в текст переводится норм
Я не понял, вы хотели многочасовые лекции преобразовывать в текст нахаляву? По-моему это наглость. Почему кто-то должен за вас работать бесплатно? Ну нравятся вам допустим лекции Кургиняна. Сами берёте и переводите их в текстовый формат. Либо не хотите вкалывать, и тогда ставите ссылку на двухчасовое видео, за что вам в лицо плюют не только лишь все.
Вы вообще свой рабочий час во сколько оцениваете? Надеюсь гораздо дороже цены на яндексе?
перевод "лекций" частная задача... но хотя бы поиск по словам в лекции или заседании мог бы решаться штуками вроде бесплатного сфинкса... но почти все разработки свернуты уже лет 5-7 как - каждый свои "нейронные сети" учит втихаря... (во всяком случае мне ничего публичного найти не удалось)
Интересно почему вы считаете себя вправе обсуждать цены коммерческой компании?
Ещё и предлагает эту цену "обосновать".
Дорого - не берите.