Зачастую журналистам, маркетологам, видеомонтажёрам и многим другим приходится в своей работе расшифровывать аудиозаписи и превращать их в текст. Делать это вручную — долго и сложно. Сэкономить время и силы помогают специальные сервисы — таких мы нашли три.
RealSpeaker помогает расшифровать речь на 38 языках, есть и русский. Сервис отличается простотой использования — достаточно выбрать язык и загрузить файл длительностью до 180 минут. После этого RealSpeaker покажет расчётное время, когда текст будет готов. В среднем, на двухминутный файл уходит примерно 30 секунд.
Далее заходим в «Мои медиа» и нажимаем кнопку «Транскрибировать». Готовый текст можно редактировать непосредственно в сервисе или скачать его в формате SRT или WebVTT, если вам нужен файл для субтитров к видео.
Бесплатно сервис переводит только первые 1,5 минуты записи. Далее минута обойдется в 8 рублей. Оплатить можно банковской картой.
Существенный недостаток RealSpeaker — в разделе «Мои медиа» сервис показывает не только ваши файлы, но и записи других пользователей. Так что про конфиденциальность данных здесь можно забыть.
Speechpad — один из первых отечественных сервисов по расшифровке речи. Бесплатно он обрабатывает только 15 минут записи. Для полноценной работы с сервисом в личном кабинете нужно приобрести подписку:
1 месяц — 100 рублей;
3 месяца — 250 рублей;
12 месяцев — 800 рублей.
Для работы с файлами пролистайте главный экран вниз и нажмите кнопку «+Транскрибацию». Выберите тип файла HTML5 audio и кликните на кнопку «Включить запись». Для удобства расшифровки сервис предлагает несколько опций. Вы можете включить защиту от шумов, запускать файл с определённых временных меток, управлять перемоткой и скоростью воспроизведения.
Обратите внимание: если в аудиозаписи возникают помехи или голос спикера становится нечётким, Speechpad может пропустить часть текста.
Этот сервис бесплатно расшифровывает лишь десять минут аудиозаписи. Далее час распознавания речи обойдётся в 150 рублей.
Кроме того, у этого сервиса есть бот в Telegram. Правда, по времени он также ограничен десятью минутами. Бот поддерживает файлы до 20 МБ. Расшифровка занимает до 20 минут.
Пока что сервис работает только с русским языком. Однако команда разработчиков заверяет, что скоро добавит и другие языки. При этом Speechtotext стабильно выпускает обновления для улучшения сервиса. Кроме того, здесь предусмотрена служба поддержки, которая помогает пользователям решать проблемы с платформой.
Социальная сеть «Вконтакте» предлагает бесплатное решение — распознавание аудио с помощью нейросетей. Сервис обрабатывает два типа речи: спонтанную — когда говорящий использует сленг или даже нецензурную брань, и нейтральную — например, интервью или выступление.
Разработчики утверждают, что нейросеть может понять человека, даже если он говорит неразборчиво или на записи есть шумы. А ещё она умеет разбивать текст на предложения и ставить запятые.
Сервис работает только с файлами на русском языке. Загрузить можно только три формата: MP3, OGG или WAV. Записи до 100 минут в день можно распознать бесплатно.
Если вы снимаете видео и записываете аудио, вам нужно всё это где-то хранить и держать под рукой. Отличный вариант — облако «МТС Вторая память». Кстати, у вас есть в этом облаке аж 512 ГБ, если вы пользуетесь МТС Premium.