Организационно-техническое. О расшифровке текстов

Аватар пользователя ВладимирХ

Я поместил у себя в блоге ролик беседы Д.Пучкова с И.Ашмановым.

Текст длинный (2 часа), но, по моему, достойнейший. Есть желание сделать его текстовый вариант.

Хотелось бы обсудить эту тему и выработать модель таких мероприятий.

Есть такая, например, услуга - 20 рублей/минута. В принципе, я и сам готов это оплатить, но возможно, камрады предложат другой вариант, возможно автоматический, или кто-то будет готов войти в кооперацию, чтобы снизить нагрузку на одного человека.

Если удастся выработать приемлемую модель таких мероприятий, то, возможно такие действа можно будет совершать и почаще.

Комментарии

Аватар пользователя И-23
И-23(10 лет 6 месяцев)

Меня в данной нише больше интересует стенограмма «теледуэли» ЕБНя с Александром Зиновьевым (на французском телевидении, Программа: «Апострофы» № 709 Дата: 9 марта 1990 г.)

Аватар пользователя KMS-64
KMS-64(14 лет 2 месяца)

Д.Пучков

Аватар пользователя aegis
aegis(11 лет 11 месяцев)

Модель-то проста:

* Заводите проект на публичных сервисах проектов.

* Делите исходные данные на кусочки (в случае видео просто считаете минуту за элемент).

* Бросаете клич

* Собираете результат.

Например программисты и переводчики так работают. И на другие области это можно распространить. Тут проблема только в организаторе. Вы лучше свои 20 руб оставьте при себе, а выделите 20 минут на организацию.

Если бы ваш пост выглядел так, то я бы потратил 10 минут:

Ребят. Надо сделать транскрипцию видео. Проект здесь: https://github.com/xxx/yyyy. Разбираем по минутам (отмечаемся комментариях или в проекте):

00:01 занято
,,, ...
05:34 свободно
Аватар пользователя ВладимирХ
ВладимирХ(13 лет 2 месяца)

* Заводите проект на публичных сервисах проектов.

Ссылочку не дадите на какой-нибудь такой сервис?

Вы видели такие проекты именно на расшифровку?

Аватар пользователя aegis
aegis(11 лет 11 месяцев)

Мыслите более абстрактно. Я не зря привёл в пример программистов и переводчиков. Они работают с текстом. И у вас текст. Самое главное общие алгоритмы. А для текста они одинаковы: приём вариантов/отклонение, построчное сравнение и вообще вся инфраструктура поддержки. Ссылку на гитхаб я уже привёл (убрать xxx/yyy). Причём бывает там некоторые товарищи хранят свои конфиги (тоже текст). Проще говоря его можно приспособить для чего угодно текстового.

Аватар пользователя Knight
Knight(13 лет 4 месяца)

Можно общий документ в google docs создать, кто заберет себе кусок - отмечает это. Лучше нарезать на мелкие кусочки минуты по три. Кто-то возьмет себе десяток таких кусочков, а еще десять человек - по одному. Это когда перевод делают, обычно на крупные куски бьют, так как там вопрос к стилю и вникнуть в текст надо. А здесь, можно без проблем разбить на мелкие.

Аватар пользователя user3120
user3120(10 лет 6 месяцев)

Можно попробовать https://speechlogger.appspot.com/ru/ для чернового распознавание речи.

Еще http://webtous.ru/konvertery/dva-servisa-raspoznavaniya-rechi-i-perevoda...  (не уверен что бесплатно).

Вроде есть проекты работы с сабами (для чистовой правки) ИМХО.

Аватар пользователя perehvat
perehvat(10 лет 3 месяца)

Если распознавание "грязное", то чистить по затратам времени может быть дольше, чем транскрибировать с нуля.

Аватар пользователя user3120
user3120(10 лет 6 месяцев)

Как синхронизировать текст с видео (сделать субтитры на основе готового текста звуковой дорожки) https://www.youtube.com/watch?v=aZ2Uy9NCuIY К примеру для внесения финальных правок.

Нотабинойд (в основном для переводов) стал полузакрытым. Но вроде есть аналогичные сервисы.

Это позволит получить точные таймкоды. По таймкодам ИМХО будет гораздо проще работать. Затем можно через зачеркнутый текст пометить все бесвязные куски текста которые требуют ручного распознавания (или полностью забраковать подобный перевод). Вроде есть редакторы сабов в которых по идее должна быть функция озвучки по таймкодам.

Закачать на сервисы выше аудио дорожки, ИМХО не такой большой труд.

Аватар пользователя alexvlad7
alexvlad7(13 лет 5 месяцев)

если не трудно, отпишитесь по результатам тестирования программ по распознаванию речи.

Аватар пользователя perehvat
perehvat(10 лет 3 месяца)

Не так сложно сделать самому. Доводилось транскрибировать глубинные и экспертные интервью. Если наловчиться, получаются затраты времени примерно 1:6-7.

Кстати, если кто-то даст денег, могу и транскрибировать на досуге. Возьму меньше, чем 20руб./минута. Пишите в личку.

Аватар пользователя Не_волшебник
Не_волшебник(11 лет 6 месяцев)

Я поместил у себя в блоге ролик беседы Д.Пучкова с И.Ашмановым.

Текст длинный (2 часа), но, по моему, достойнейший.

К таким хорошим интервью нужен хороший конспект, а не полный текст. Всё-таки формат АШ - это максимум информации за минимум времени.

Аватар пользователя Виталий Давыдов

Хороший конспект, по идее можно влёт. 

Комментарий администрации:  
*** Уличен в дезинформации ***
Аватар пользователя Виталий Давыдов

2О минут готов набить в общий фонд за недельку. А за деньги, с удовольствием и текстом целиком память и пальцы потренирую. Если время без лимита.

Если с лимитом, то можно попробовать народ с "Клавогонок" привлечь. http://klavogonki.ru/ (теоретически рассуждая)

-Я вас категорически приветствую
- Игорь, добрый день.
- Добрый день
 -Никогда не видел людей, которые, как бы это сказать создают русский интернет. Вообще никогда, Как специалисту хочу задать вопрос. Вот вчера Наталья Касперская сообщила, что есть такая тема, как сейчас принято говорить, перехватывать все разговоры в разнообразных конторах. Типа, это дело расшифровывать и соотвествующие люди будут всё это изучать. Это законно?
-- Сложный вопрос. Который не имеет прямого ответа. Сейчас объясню. Во-первых, те кто начал шуметь, что это дело незаконно, есть впечатление, что это люди не совсем с хорошей памятью, потому что они видимо забыли, что им рассказал Сноуден, что на самом деле нас всех прослушивают, прослушивают каждую секунду, с любого смартфона. И это незаконно, но пока никто ничего не сделал. Более того, как мы знаем, когда прослушали какую-нибудь Меркель ( я надеюсь, что Путина не слушают), тоже никто ничего не сделал.  Соответственно, это раз, это такое общее соображение - когда слушают сейчас, никто, в общем, не беспокоится, а когда коммерсант пересказал пересказ какого-то инсайдера у какого-то конкурента Натальи, то все сразу знают, что это точно не законно. Что здесь можно сказать - система контроля персонала продаются уже лет 20 в нашей стране. Они обычно сейчас называются DLP (английская аббревиатура "Предотвращение утечки данных). Что они делают обычно. Это сервер, который ставится для защиты периметра организации. Он обычно старается перехватить все каналы. Естественно сотрудники подписывают соответствующие соглашение. Они знают, что на работе это положено. И никто до сих пор в суд не подавал ни на одну из таких компаний у нас в стране. Перехватывают они почту, что, казалось бы, должно прямо противоречить конституции. 

Комментарий администрации:  
*** Уличен в дезинформации ***
Аватар пользователя aegis
aegis(11 лет 11 месяцев)

А товарищ-то заинтересованное лицо. Ещё когда он начал сравнивать Конституцию и бытовуху я заподозрил неладное. Да и вообще много таких подтасовок и т.д. А на 8:00 оказывается, что это его жена! Не ожидал такого от Пучкова, если честно.

Аватар пользователя ВладимирХ
ВладимирХ(13 лет 2 месяца)

оказывается, что это его жена! Не ожидал такого от Пучкова, если честно

Тоже мне "секрет Полишинеля". Это единственное, н что Вы обратили внимание? Сочувствую.

Аватар пользователя И-23
И-23(10 лет 6 месяцев)

Обычное следствие игры на конкретный результат.
Из ныне эмоционально-нейтральных примеров я бы рекомендовал историю теории эволюции (в изложении академика П.А. Кропоткина, см. «Этику»).