Glossario

Voice activity detection

Il rilevamento dell'attività vocale (VAD) è una tecnica che identifica quali parti di un flusso audio contengono parlato e quali sono silenzio o rumore di fondo.

Cosa significa

Il VAD risponde a una domanda precisa: qualcuno sta parlando in questo momento? Non trascrive l'audio né identifica il parlante. I software lo usano per saltare i momenti di silenzio, per sapere quando iniziare e interrompere l'elaborazione e per fornire un audio più pulito alla trascrizione.

In una pipeline di trascrizione, il VAD è un utile primo passo. Tagliando lunghi silenzi e audio non parlato prima che il modello di riconoscimento entri in azione, riduce i tempi di elaborazione e limita output errati causati dal rumore di fondo.

Come si collega a Autorec

La fase di trascrizione di Autorec lavora sull'audio registrato della tua chiamata. Rilevare dove avviene effettivamente il parlato aiuta la trascrizione locale a rimanere efficiente e impedisce che il rumore ambientale si trasformi in testo casuale nella trascrizione.

Prova Autorec

Un registratore di riunioni locale per Linux e Windows. Rileva automaticamente le tue chiamate, registra sul tuo disco e trascrive in locale. Costo una tantum di 20€, con una versione gratuita per iniziare.

Scarica Autorec