术语表

Voice activity detection

语音活动检测(VAD)是一种识别音频流中哪些部分包含语音、哪些部分是静音或背景噪音的技术。

含义

VAD 回答的是一个具体问题:当前是否有人在说话?它不会转录音频,也无法识别说话人。软件利用它跳过静音片段,判断何时开始或停止处理,并将更干净的音频输入转录系统。

在转录流程中,VAD 是一个有用的初步处理步骤。通过在识别模型运行前剪除长时间的静音和非语音音频,它能缩短处理时间,并减少背景噪音导致的错误文本输出。

与 Autorec 的关联

Autorec 的转录步骤基于你通话的录音音频进行。准确检测语音发生的位置,有助于设备本地的转录保持高效,并防止环境噪音被误转为文本内容。

试试 Autorec

专为 Linux 和 Windows 设计的本地优先会议录音工具。自动检测您的通话,在您自己的硬盘上录制,并在本地转录。一次性 20 欧元,提供免费版本试用。

下载 Autorec