Transkription & KI

Autorec transkribiert Aufnahmen lokal mit whisper.cpp und generiert optional KI-Zusammenfassungen über eine beliebige OpenAI-kompatible API.

So funktioniert die Transkription

  1. Nachdem eine Aufnahme beendet ist, extrahiert autorec die Audiospur
  2. Das Audio wird vom ausgewählten Whisper-Modell vollständig auf Ihrem Gerät verarbeitet
  3. Zwei Ausgabedateien werden neben dem Video erstellt:
    • .txt — Reintext-Transkript
    • .srt — Untertiteldatei mit Zeitstempeln

Während der Transkription verlässt kein Audio- oder Videodaten Ihren Computer.

Whisper-Modelle

Modelle werden beim ersten Heruntergeladen und in ~/.local/share/autorec/models/ (Linux) oder %LOCALAPPDATA%\autorec\models\ (Windows) gespeichert.

ModellGrößeGeschwindigkeitGenauigkeitAm besten für
tiny~75 MBAm schnellstenGrundlegendSchnelle Notizen, leistungsschwache Geräte
base~142 MBSchnellGutStandard — empfohlen für die meisten Nutzer
small~466 MBMittelBesserWenn Genauigkeit wichtiger ist als Geschwindigkeit
medium~1,5 GBLangsamHochNicht-englische Sprachen, schwieriges Audio
large~3 GBAm langsamstenAm bestenMaximale Genauigkeit, leistungsstarke Hardware

Modelle herunterladen

  1. Öffnen Sie Einstellungen aus dem Tray-Menü
  2. Gehen Sie zum Abschnitt Transkription
  3. Wählen Sie eine Modellgröße aus
  4. Klicken Sie auf Herunterladen — das Modell wird einmal heruntergeladen und für alle zukünftigen Transkriptionen wiederverwendet

KI-Zusammenfassungen

KI-Zusammenfassungen nutzen eine Cloud-API, um aus dem Transkripttext einen Titel und eine Zusammenfassung zu generieren. Es wird nur der Text gesendet — kein Audio oder Video.

Einrichtung

  1. Öffnen Sie Einstellungen > KI-Zusammenfassungen
  2. Geben Sie Ihren API-Endpunkt ein (z. B. https://api.openai.com/v1)
  3. Geben Sie Ihren API-Schlüssel ein
  4. Wählen Sie ein Modell aus (z. B. gpt-4o-mini)
  5. Aktivieren Sie Automatisch zusammenfassen

Kompatible Dienste

Jeder Dienst mit einem OpenAI-kompatiblen Chat-Completions-Endpunkt funktioniert:

  • OpenAIhttps://api.openai.com/v1
  • OpenRouterhttps://openrouter.ai/api/v1
  • Lokale Modelle (Ollama, LM Studio usw.) — verwenden Sie Ihren lokalen Endpunkt

Was generiert wird

Für jede transkribierte Aufnahme generiert autorec:

  • Titel — einen kurzen, beschreibenden Titel für das Meeting
  • Zusammenfassung — eine prägnante Zusammenfassung der besprochenen Kernpunkte

Beide erscheinen in der Videobibliothek und in der Detailansicht des Videos, sodass Sie das gesuchte Meeting leicht finden können, ohne es erneut anzusehen.