用語集
Speaker diarization
話者分離とは、音声録音をセグメントに分け、それぞれのセグメントで誰が話しているかをラベル付けするプロセスです。
意味するところ
文字起こしは「何が話されたか」に答えます。話者分離は「誰が話したか」に答えます。これらは別問題です。文字起こしが完璧でも、すべてがつながった1つのテキストブロックとして出力されることがあります。話者分離は音声を発話単位に分け、それぞれを「話者1」「話者2」などとラベル付けします。単独では、通常は実名まで特定できません。
話者分離は、複数の人が同時に話す場合や、複数の声が似ている場合に最も難しくなります。音源が分離されたクリーンな録音であれば、はるかに正確になります。
Autorecとの関係
Autorecはクリーンな音声トラックに会議を録音するため、話者分離がうまく機能するのに最適な入力になります。デバイス内文字起こしにより、タイムスタンプ付きの文字起こしを生成し、レビュー時に発話の区切りに自然に対応できます。
Autorecを試す
LinuxおよびWindows向けのローカル優先会議録音ツール。通話を自動検出し、自分のディスクに録音。文字起こしも自分のマシン上で実行。一度20ユーロ。無料版から始められます。
Autorecをダウンロード