Четыре сервиса для перевода аудио в текст

30 октября 2022

Зачастую журналистам, маркетологам, видеомонтажёрам и многим другим приходится в своей работе расшифровывать аудиозаписи и превращать их в текст. Делать это вручную — долго и сложно. Сэкономить время и силы помогают специальные сервисы — таких мы нашли три.

RealSpeaker

RealSpeaker помогает расшифровать речь на 38 языках, есть и русский. Сервис отличается простотой использования — достаточно выбрать язык и загрузить файл длительностью до 180 минут. После этого RealSpeaker покажет расчётное время, когда текст будет готов. В среднем, на двухминутный файл уходит примерно 30 секунд.

Далее заходим в «Мои медиа» и нажимаем кнопку «Транскрибировать». Готовый текст можно редактировать непосредственно в сервисе или скачать его в формате SRT или WebVTT, если вам нужен файл для субтитров к видео.

Бесплатно сервис переводит только первые 1,5 минуты записи. Далее минута обойдется в 8 рублей. Оплатить можно банковской картой.

Существенный недостаток RealSpeaker — в разделе «Мои медиа» сервис показывает не только ваши файлы, но и записи других пользователей. Так что про конфиденциальность данных здесь можно забыть.

Speechpad

Speechpad — один из первых отечественных сервисов по расшифровке речи. Бесплатно он обрабатывает только 15 минут записи. Для полноценной работы с сервисом в личном кабинете нужно приобрести подписку:

  • 1 месяц — 100 рублей;
  • 3 месяца — 250 рублей;
  • 12 месяцев — 800 рублей.

Для работы с файлами пролистайте главный экран вниз и нажмите кнопку «+Транскрибацию». Выберите тип файла HTML5 audio и кликните на кнопку «Включить запись». Для удобства расшифровки сервис предлагает несколько опций. Вы можете включить защиту от шумов, запускать файл с определённых временных меток, управлять перемоткой и скоростью воспроизведения.

Обратите внимание: если в аудиозаписи возникают помехи или голос спикера становится нечётким, Speechpad может пропустить часть текста.

Материал по теме
МТС Вторая память: обзор приложения, которое сбережёт место на вашем смартфоне

Speechtotext

Этот сервис бесплатно расшифровывает лишь десять минут аудиозаписи. Далее час распознавания речи обойдётся в 150 рублей.

Кроме того, у этого сервиса есть бот в Telegram. Правда, по времени он также ограничен десятью минутами. Бот поддерживает файлы до 20 МБ. Расшифровка занимает до 20 минут.

Пока что сервис работает только с русским языком. Однако команда разработчиков заверяет, что скоро добавит и другие языки. При этом Speechtotext стабильно выпускает обновления для улучшения сервиса. Кроме того, здесь предусмотрена служба поддержки, которая помогает пользователям решать проблемы с платформой.

Распознавание речи от «ВКонтакте»

Социальная сеть «Вконтакте» предлагает бесплатное решение — распознавание аудио с помощью нейросетей. Сервис обрабатывает два типа речи: спонтанную — когда говорящий использует сленг или даже нецензурную брань, и нейтральную — например, интервью или выступление.

Разработчики утверждают, что нейросеть может понять человека, даже если он говорит неразборчиво или на записи есть шумы. А ещё она умеет разбивать текст на предложения и ставить запятые.

Сервис работает только с файлами на русском языке. Загрузить можно только три формата: MP3, OGG или WAV. Записи до 100 минут в день можно распознать бесплатно.

Если вы снимаете видео и записываете аудио, вам нужно всё это где-то хранить и держать под рукой. Отличный вариант — облако «МТС Вторая память». Кстати, у вас есть в этом облаке аж 512 ГБ, если вы пользуетесь МТС Premium.
Вторая память
Скачать

Теги:

Подпишитесь на канал МТС в Telegram
МТС Офишиал
МТС Офишиал
Новости экосистемы. Статьи о технологиях. Разыгрываем гаджеты. Дарим промокоды.