Transkription & KI
Autorec transkribiert Aufnahmen lokal mit whisper.cpp und generiert optional KI-Zusammenfassungen über eine beliebige OpenAI-kompatible API.
So funktioniert die Transkription
- Nachdem eine Aufnahme beendet ist, extrahiert autorec die Audiospur
- Das Audio wird vom ausgewählten Whisper-Modell vollständig auf Ihrem Gerät verarbeitet
- Zwei Ausgabedateien werden neben dem Video erstellt:
.txt— Reintext-Transkript.srt— Untertiteldatei mit Zeitstempeln
Während der Transkription verlässt kein Audio- oder Videodaten Ihren Computer.
Whisper-Modelle
Modelle werden beim ersten Heruntergeladen und in ~/.local/share/autorec/models/ (Linux) oder %LOCALAPPDATA%\autorec\models\ (Windows) gespeichert.
| Modell | Größe | Geschwindigkeit | Genauigkeit | Am besten für |
|---|---|---|---|---|
| tiny | ~75 MB | Am schnellsten | Grundlegend | Schnelle Notizen, leistungsschwache Geräte |
| base | ~142 MB | Schnell | Gut | Standard — empfohlen für die meisten Nutzer |
| small | ~466 MB | Mittel | Besser | Wenn Genauigkeit wichtiger ist als Geschwindigkeit |
| medium | ~1,5 GB | Langsam | Hoch | Nicht-englische Sprachen, schwieriges Audio |
| large | ~3 GB | Am langsamsten | Am besten | Maximale Genauigkeit, leistungsstarke Hardware |
Modelle herunterladen
- Öffnen Sie Einstellungen aus dem Tray-Menü
- Gehen Sie zum Abschnitt Transkription
- Wählen Sie eine Modellgröße aus
- Klicken Sie auf Herunterladen — das Modell wird einmal heruntergeladen und für alle zukünftigen Transkriptionen wiederverwendet
KI-Zusammenfassungen
KI-Zusammenfassungen nutzen eine Cloud-API, um aus dem Transkripttext einen Titel und eine Zusammenfassung zu generieren. Es wird nur der Text gesendet — kein Audio oder Video.
Einrichtung
- Öffnen Sie Einstellungen > KI-Zusammenfassungen
- Geben Sie Ihren API-Endpunkt ein (z. B.
https://api.openai.com/v1) - Geben Sie Ihren API-Schlüssel ein
- Wählen Sie ein Modell aus (z. B.
gpt-4o-mini) - Aktivieren Sie Automatisch zusammenfassen
Kompatible Dienste
Jeder Dienst mit einem OpenAI-kompatiblen Chat-Completions-Endpunkt funktioniert:
- OpenAI —
https://api.openai.com/v1 - OpenRouter —
https://openrouter.ai/api/v1 - Lokale Modelle (Ollama, LM Studio usw.) — verwenden Sie Ihren lokalen Endpunkt
Was generiert wird
Für jede transkribierte Aufnahme generiert autorec:
- Titel — einen kurzen, beschreibenden Titel für das Meeting
- Zusammenfassung — eine prägnante Zusammenfassung der besprochenen Kernpunkte
Beide erscheinen in der Videobibliothek und in der Detailansicht des Videos, sodass Sie das gesuchte Meeting leicht finden können, ohne es erneut anzusehen.