Transcripción e IA

Autorec transcribe grabaciones localmente usando whisper.cpp y opcionalmente genera resúmenes con IA a través de cualquier API compatible con OpenAI.

Cómo funciona la transcripción

  1. Después de que una grabación termina, autorec extrae la pista de audio
  2. El audio es procesado por el modelo Whisper seleccionado completamente en tu máquina
  3. Se crean dos archivos junto al video:
    • .txt — transcripción en texto plano
    • .srt — archivo de subtítulos con marcas de tiempo

Ningún dato de audio o video sale de tu computadora durante la transcripción.

Modelos Whisper

Los modelos se descargan en el primer uso y se almacenan en ~/.local/share/autorec/models/ (Linux) o %LOCALAPPDATA%\autorec\models\ (Windows).

ModeloTamañoVelocidadPrecisiónMejor para
tiny~75 MBLa más rápidaBásicaNotas rápidas, máquinas de bajo rendimiento
base~142 MBRápidaBuenaPredeterminado — recomendado para la mayoría de los usuarios
small~466 MBModeradaMejorCuando la precisión importa más que la velocidad
medium~1.5 GBLentaAltaIdiomas no ingleses, audio difícil
large~3 GBLa más lentaLa mejorMáxima precisión, hardware potente

Descarga de modelos

  1. Abre Configuración desde el menú de la bandeja del sistema
  2. Ve a la sección Transcripción
  3. Selecciona un tamaño de modelo
  4. Haz clic en Descargar — el modelo se descarga una vez y se reutiliza para todas las transcripciones futuras

Resúmenes con IA

Los resúmenes con IA utilizan una API en la nube para generar un título y un resumen a partir del texto de la transcripción. Solo se envía el texto — no se envía audio ni video.

Configuración

  1. Abre Configuración > Resúmenes con IA
  2. Ingresa tu endpoint de API (por ejemplo, https://api.openai.com/v1)
  3. Ingresa tu clave de API
  4. Elige un modelo (por ejemplo, gpt-4o-mini)
  5. Habilita resumen automático

Servicios compatibles

Cualquier servicio con un endpoint de chat completions compatible con OpenAI funciona:

  • OpenAIhttps://api.openai.com/v1
  • OpenRouterhttps://openrouter.ai/api/v1
  • Modelos locales (Ollama, LM Studio, etc.) — usa tu endpoint local

Qué se genera

Para cada grabación transcrita, autorec genera:

  • Título — un título corto y descriptivo para la reunión
  • Resumen — un resumen conciso de los puntos clave discutidos

Ambos aparecen en la biblioteca de videos y en la vista de detalle del video, facilitando encontrar la reunión que necesitas sin tener que volver a verla.