Глоссарий
Voice activity detection
Обнаружение речевой активности (VAD) — это метод, определяющий, какие части аудиопотока содержат речь, а какие — тишину или фоновый шум.
Что это значит
VAD отвечает на узкий вопрос: говорит ли кто-то прямо сейчас? Он не расшифровывает аудио и не определяет говорящего. Программы используют его, чтобы пропускать тихие участки, знать, когда начинать и останавливать обработку, и подавать на транскрипцию более чистое аудио.
В конвейере транскрипции VAD полезен как первый этап. Убрав длинные паузы и неречевые звуки до запуска модели распознавания, он сокращает время обработки и уменьшает ложные срабатывания от фонового шума.
Как это связано с Autorec
Этап транскрипции в Autorec работает с записанным аудио вашего звонка. Определение, где именно идёт речь, помогает локальной транскрипции оставаться эффективной и не превращать фоновый шум в случайный текст в расшифровке.
Попробовать Autorec
Локальный рекордер встреч для Linux и Windows. Автообнаружение звонков, запись на ваш диск и транскрипция на вашем устройстве. Единовременно €20, с бесплатным уровнем для старта.
Скачать Autorec