术语表

Speaker diarization

说话人分离是指将音频录音分割成多个片段,并标注每个片段中是谁在说话的过程。

含义

转录回答的是“说了什么”,而说话人分离回答的是“谁说的”。这是两个不同的问题:转录文本可能完全准确,但仍可能是一整段未分割的文字。说话人分离将音频按发言轮次分段,并将每段标记为说话人1、说话人2等。通常它无法将这些标签对应到真实姓名。

当多人同时说话,或多个声音相似时,说话人分离最难准确。音源分离清晰的干净录音能显著提高其可靠性。

与 Autorec 的关联

Autorec 将会议录制成清晰的音频轨道,这正是说话人分离所需的良好输入。其设备端转录生成带时间戳的文本,你在回顾时可自然地将其与发言轮次对应起来。

试试 Autorec

专为 Linux 和 Windows 设计的本地优先会议录音工具。自动检测您的通话,在您自己的硬盘上录制,并在本地转录。一次性 20 欧元,提供免费版本试用。

下载 Autorec