Glossaire
Voice activity detection
La détection de la présence vocale (VAD) est une technique qui identifie quelles parties d'un flux audio contiennent de la parole et lesquelles sont du silence ou du bruit de fond.
Ce que cela signifie
La VAD répond à une question précise : quelqu'un parle-t-il en ce moment ? Elle ne transcrit pas l'audio ni n'identifie le locuteur. Les logiciels l'utilisent pour sauter les moments de silence, savoir quand commencer et arrêter le traitement, et fournir un audio plus propre à la transcription.
Dans un pipeline de transcription, la VAD constitue un bon premier filtre. En supprimant les longs silences et les sons non vocaux avant que le modèle de reconnaissance ne s'exécute, elle réduit le temps de traitement et limite les erreurs dues au bruit ambiant.
Comment cela concerne Autorec
L'étape de transcription de Autorec travaille sur l'audio enregistré de votre appel. Détecter quand la parole a lieu aide la transcription locale à rester efficace et empêche les bruits ambiants de devenir du texte parasite dans la transcription.
Essayer Autorec
Un enregistreur de réunions local d'abord, pour Linux et Windows. Il détecte automatiquement vos appels, les enregistre sur votre propre disque et les transcrit localement. 20 € une fois, avec une version gratuite pour commencer.
Télécharger Autorec