Glossário

Voice activity detection

A detecção de atividade de voz (VAD) é uma técnica que identifica quais partes de um fluxo de áudio contêm fala e quais são silêncio ou ruído de fundo.

O que significa

O VAD responde a uma pergunta específica: alguém está falando agora? Ele não transcreve o áudio nem identifica o falante. O software o usa para pular trechos silenciosos, saber quando começar e parar o processamento e fornecer áudio mais limpo para a transcrição.

Em um fluxo de transcrição, o VAD é um bom primeiro passo. Ao cortar silêncios longos e áudio sem fala antes do modelo de reconhecimento rodar, ele reduz o tempo de processamento e evita saídas incorretas causadas por ruídos de fundo.

Como isso se relaciona com Autorec

A etapa de transcrição do Autorec trabalha com o áudio gravado da sua chamada. Detectar onde a fala realmente ocorre ajuda a manter a eficiência da transcrição local e evita que ruídos de ambiente virem texto aleatório na transcrição.

Experimente Autorec

Um gravador de reuniões local para Linux e Windows. Ele detecta automaticamente suas chamadas, grava no seu próprio disco e transcreve na sua máquina. Preço único de €20, com versão gratuita para começar.

Baixar Autorec