Я поместил у себя в блоге ролик беседы Д.Пучкова с И.Ашмановым.
Текст длинный (2 часа), но, по моему, достойнейший. Есть желание сделать его текстовый вариант.
Хотелось бы обсудить эту тему и выработать модель таких мероприятий.
Есть такая, например, услуга - 20 рублей/минута. В принципе, я и сам готов это оплатить, но возможно, камрады предложат другой вариант, возможно автоматический, или кто-то будет готов войти в кооперацию, чтобы снизить нагрузку на одного человека.
Если удастся выработать приемлемую модель таких мероприятий, то, возможно такие действа можно будет совершать и почаще.
Комментарии
Меня в данной нише больше интересует стенограмма «теледуэли» ЕБНя с Александром Зиновьевым (на французском телевидении, Программа: «Апострофы» № 709 Дата: 9 марта 1990 г.)
Д.Пучков
Модель-то проста:
* Заводите проект на публичных сервисах проектов.
* Делите исходные данные на кусочки (в случае видео просто считаете минуту за элемент).
* Бросаете клич
* Собираете результат.
Например программисты и переводчики так работают. И на другие области это можно распространить. Тут проблема только в организаторе. Вы лучше свои 20 руб оставьте при себе, а выделите 20 минут на организацию.
Если бы ваш пост выглядел так, то я бы потратил 10 минут:
Ссылочку не дадите на какой-нибудь такой сервис?
Вы видели такие проекты именно на расшифровку?
Мыслите более абстрактно. Я не зря привёл в пример программистов и переводчиков. Они работают с текстом. И у вас текст. Самое главное общие алгоритмы. А для текста они одинаковы: приём вариантов/отклонение, построчное сравнение и вообще вся инфраструктура поддержки. Ссылку на гитхаб я уже привёл (убрать xxx/yyy). Причём бывает там некоторые товарищи хранят свои конфиги (тоже текст). Проще говоря его можно приспособить для чего угодно текстового.
Можно общий документ в google docs создать, кто заберет себе кусок - отмечает это. Лучше нарезать на мелкие кусочки минуты по три. Кто-то возьмет себе десяток таких кусочков, а еще десять человек - по одному. Это когда перевод делают, обычно на крупные куски бьют, так как там вопрос к стилю и вникнуть в текст надо. А здесь, можно без проблем разбить на мелкие.
Можно попробовать https://speechlogger.appspot.com/ru/ для чернового распознавание речи.
Еще http://webtous.ru/konvertery/dva-servisa-raspoznavaniya-rechi-i-perevoda... (не уверен что бесплатно).
Вроде есть проекты работы с сабами (для чистовой правки) ИМХО.
Если распознавание "грязное", то чистить по затратам времени может быть дольше, чем транскрибировать с нуля.
Как синхронизировать текст с видео (сделать субтитры на основе готового текста звуковой дорожки) https://www.youtube.com/watch?v=aZ2Uy9NCuIY К примеру для внесения финальных правок.
Нотабинойд (в основном для переводов) стал полузакрытым. Но вроде есть аналогичные сервисы.
Это позволит получить точные таймкоды. По таймкодам ИМХО будет гораздо проще работать. Затем можно через зачеркнутый текст пометить все бесвязные куски текста которые требуют ручного распознавания (или полностью забраковать подобный перевод). Вроде есть редакторы сабов в которых по идее должна быть функция озвучки по таймкодам.
Закачать на сервисы выше аудио дорожки, ИМХО не такой большой труд.
если не трудно, отпишитесь по результатам тестирования программ по распознаванию речи.
Не так сложно сделать самому. Доводилось транскрибировать глубинные и экспертные интервью. Если наловчиться, получаются затраты времени примерно 1:6-7.
Кстати, если кто-то даст денег, могу и транскрибировать на досуге. Возьму меньше, чем 20руб./минута. Пишите в личку.
К таким хорошим интервью нужен хороший конспект, а не полный текст. Всё-таки формат АШ - это максимум информации за минимум времени.
Хороший конспект, по идее можно влёт.
2О минут готов набить в общий фонд за недельку. А за деньги, с удовольствием и текстом целиком память и пальцы потренирую. Если время без лимита.
Если с лимитом, то можно попробовать народ с "Клавогонок" привлечь. http://klavogonki.ru/ (теоретически рассуждая)
-Я вас категорически приветствую
- Игорь, добрый день.
- Добрый день
-Никогда не видел людей, которые, как бы это сказать создают русский интернет. Вообще никогда, Как специалисту хочу задать вопрос. Вот вчера Наталья Касперская сообщила, что есть такая тема, как сейчас принято говорить, перехватывать все разговоры в разнообразных конторах. Типа, это дело расшифровывать и соотвествующие люди будут всё это изучать. Это законно?
-- Сложный вопрос. Который не имеет прямого ответа. Сейчас объясню. Во-первых, те кто начал шуметь, что это дело незаконно, есть впечатление, что это люди не совсем с хорошей памятью, потому что они видимо забыли, что им рассказал Сноуден, что на самом деле нас всех прослушивают, прослушивают каждую секунду, с любого смартфона. И это незаконно, но пока никто ничего не сделал. Более того, как мы знаем, когда прослушали какую-нибудь Меркель ( я надеюсь, что Путина не слушают), тоже никто ничего не сделал. Соответственно, это раз, это такое общее соображение - когда слушают сейчас, никто, в общем, не беспокоится, а когда коммерсант пересказал пересказ какого-то инсайдера у какого-то конкурента Натальи, то все сразу знают, что это точно не законно. Что здесь можно сказать - система контроля персонала продаются уже лет 20 в нашей стране. Они обычно сейчас называются DLP (английская аббревиатура "Предотвращение утечки данных). Что они делают обычно. Это сервер, который ставится для защиты периметра организации. Он обычно старается перехватить все каналы. Естественно сотрудники подписывают соответствующие соглашение. Они знают, что на работе это положено. И никто до сих пор в суд не подавал ни на одну из таких компаний у нас в стране. Перехватывают они почту, что, казалось бы, должно прямо противоречить конституции.
А товарищ-то заинтересованное лицо. Ещё когда он начал сравнивать Конституцию и бытовуху я заподозрил неладное. Да и вообще много таких подтасовок и т.д. А на 8:00 оказывается, что это его жена! Не ожидал такого от Пучкова, если честно.
Тоже мне "секрет Полишинеля". Это единственное, н что Вы обратили внимание? Сочувствую.
Обычное следствие игры на конкретный результат.
Из ныне эмоционально-нейтральных примеров я бы рекомендовал историю теории эволюции (в изложении академика П.А. Кропоткина, см. «Этику»).