Glosario
Voice activity detection
La detección de actividad de voz (VAD) es una técnica que identifica qué partes de un flujo de audio contienen habla y cuáles son silencio o ruido de fondo.
Qué significa
El VAD responde una pregunta específica: ¿alguien está hablando ahora? No transcribe el audio ni identifica al hablante. El software lo usa para saltar tramos silenciosos, saber cuándo comenzar y detener el procesamiento, y alimentar audio más limpio a la transcripción.
En una canalización de transcripción, el VAD es un buen primer paso. Al recortar largos silencios y audio sin voz antes de ejecutar el modelo de reconocimiento, reduce el tiempo de procesamiento y evita resultados erróneos provocados por ruido ambiental.
Cómo se relaciona con Autorec
El paso de transcripción de Autorec trabaja con el audio grabado de tu llamada. Detectar dónde ocurre realmente la voz ayuda a que la transcripción local sea eficiente y evita que el ruido ambiental se convierta en texto aleatorio en la transcripción.
Probar Autorec
Un grabador de reuniones local primero para Linux y Windows. Detecta automáticamente tus llamadas, graba en tu propio disco y transcribe en tu máquina. 20 € único, con versión gratuita para empezar.
Descargar Autorec