用語集
whisper.cpp
whisper.cppはOpenAIのWhisper音声認識モデルをC/C++で移植したもので、普通のハードウェア上で音声をテキストに変換することを目的としています。
意味するところ
WhisperはOpenAIが公開した音声認識モデルです。オリジナルはPythonで動作し、重い依存関係を持ちます。whisper.cppはC/C++で独立して再実装されたもので、同じモデルをPython不要、GPU不要、小さなフットプリントで実行できます。
これにより、クラウドサービスを使わずに文字起こしが必要なデスクトップアプリの共通の構成要素となっています。モデルファイルを一度読み込むと、以降は完全にオフラインで音声を文字起こしでき、GPUが利用可能な場合はオプションでアクセラレーションも可能です。
Autorecとの関係
Autorecは内蔵の文字起こしにwhisper.cppを使用しています。録音が終わると、音声はあなたのマシン上でwhisper.cppに渡され、結果としてテキストの文字起こしとSRT字幕ファイルが出力されます。
Autorecを試す
LinuxおよびWindows向けのローカル優先会議録音ツール。通話を自動検出し、自分のディスクに録音。文字起こしも自分のマシン上で実行。一度20ユーロ。無料版から始められます。
Autorecをダウンロード