Glossário
Voice activity detection
A detecção de atividade de voz (VAD) é uma técnica que identifica quais partes de um fluxo de áudio contêm fala e quais são silêncio ou ruído de fundo.
O que significa
O VAD responde a uma pergunta específica: alguém está falando agora? Ele não transcreve o áudio nem identifica o falante. O software o usa para pular trechos silenciosos, saber quando começar e parar o processamento e fornecer áudio mais limpo para a transcrição.
Em um fluxo de transcrição, o VAD é um bom primeiro passo. Ao cortar silêncios longos e áudio sem fala antes do modelo de reconhecimento rodar, ele reduz o tempo de processamento e evita saídas incorretas causadas por ruídos de fundo.
Como isso se relaciona com Autorec
A etapa de transcrição do Autorec trabalha com o áudio gravado da sua chamada. Detectar onde a fala realmente ocorre ajuda a manter a eficiência da transcrição local e evita que ruídos de ambiente virem texto aleatório na transcrição.
Experimente Autorec
Um gravador de reuniões local para Linux e Windows. Ele detecta automaticamente suas chamadas, grava no seu próprio disco e transcreve na sua máquina. Preço único de €20, com versão gratuita para começar.
Baixar Autorec