Транскрипция и ИИ

Приложение autorec транскрибирует записи локально с помощью whisper.cpp и при необходимости генерирует сводки с помощью любого API, совместимого с OpenAI.

Как работает транскрипция

  1. После завершения записи приложение autorec извлекает аудиодорожку
  2. Аудио обрабатывается выбранной моделью Whisper полностью на вашем компьютере
  3. Рядом с видео создаются два файла:
    • .txt — текстовая транскрипция
    • .srt — файл субтитров с временными метками

Во время транскрипции аудио- и видеоданные не покидают ваш компьютер.

Модели Whisper

Модели загружаются при первом использовании и сохраняются в ~/.local/share/autorec/models/ (Linux) или %LOCALAPPDATA%\autorec\models\ (Windows).

МодельРазмерСкоростьТочностьЛучше всего подходит для
tiny~75 МБСамая быстраяБазоваяБыстрые заметки, маломощные машины
base~142 МББыстраяХорошаяПо умолчанию — рекомендуется для большинства пользователей
small~466 МБСредняяЛучшеКогда точность важнее скорости
medium~1,5 ГБМедленнаяВысокаяНеразговорные языки, сложное аудио
large~3 ГБСамая медленнаяЛучшаяМаксимальная точность, мощное оборудование

Загрузка моделей

  1. Откройте Настройки из меню в трее
  2. Перейдите в раздел Транскрипция
  3. Выберите размер модели
  4. Нажмите Загрузить — модель загружается один раз и используется для всех будущих транскрипций

Сводки с помощью ИИ

Сводки с помощью ИИ используют облачный API для генерации заголовка и краткого содержания на основе текста транскрипции. Отправляется только текст — аудио и видео не передаются.

Настройка

  1. Откройте Настройки > Сводки с помощью ИИ
  2. Введите ваш конечную точку API (например, https://api.openai.com/v1)
  3. Введите ваш ключ API
  4. Выберите модель (например, gpt-4o-mini)
  5. Включите автоматическое создание сводок

Совместимые сервисы

Подходит любой сервис с конечной точкой для завершения чата, совместимой с OpenAI:

  • OpenAIhttps://api.openai.com/v1
  • OpenRouterhttps://openrouter.ai/api/v1
  • Локальные модели (Ollama, LM Studio и т.д.) — используйте вашу локальную конечную точку

Что генерируется

Для каждой транскрибированной записи приложение autorec генерирует:

  • Заголовок — короткий описательный заголовок встречи
  • Сводка — краткое содержание ключевых обсуждённых моментов

Оба элемента отображаются в библиотеке видео и в детальном просмотре видео, что упрощает поиск нужной встречи без повторного просмотра.