Volver a todas las herramientas
Herramientas de IA local

Transcripción privada de voz a texto (Whisper Web) gratis online

Reportar un problema

Transcribe archivos de audio o grabaciones de reuniones localmente en tu navegador con un flujo privado de Whisper.

Grabacion de origen

El audio permanece en tu navegador durante la transcripción. La primera ejecución puede descargar archivos del modelo desde el host del modelo para iniciar y guardar en cache el runtime privado de Whisper web.

Haz clic para elegir una grabacion de audio o video

La primera ejecución puede tardar más mientras el modelo Whisper se descarga y guarda en la cache del navegador.

Controles de transcripción

Elige el idioma de origen y el backend preferido del navegador, y luego ejecuta la transcripción local con IA.

Este es un flujo privado en el navegador. Tu grabacion no se sube al servidor de la app para la transcripción.

Los archivos del modelo pueden descargarse una sola vez desde el host del modelo, y luego la cache del navegador puede reutilizarlos en ejecuciones locales posteriores.

Elige una grabacion para iniciar la transcripción local.0%

Transcripción

Revisa el texto extraido antes de copiarlo o descargarlo.

Segmentos de transcripción

0

Modelo

--

Segmentos con timestamps

Previsualiza los primeros segmentos devueltos por el modelo local de Whisper.

Ejecuta la transcripción para ver segmentos con timestamps.

AI Local

Requisitos de modelo y navegador

Las herramientas AI Local se ejecutan en el navegador, pero el tamano del modelo, la aceleracion de hardware y el almacenamiento del navegador afectan la primera carga, la velocidad y el uso offline.

Updated 2026-06-04

Audio and speech model

  • Requires WebAssembly, Web Workers, Audio APIs, and enough memory for the speech model.
  • Microphone input requires browser permission; file transcription does not require uploading audio to an app server.

Browser baseline

  • Use a current Chromium, Edge, Firefox, or Safari release with JavaScript, WebAssembly, Web Workers, and Cache Storage enabled.
  • Private browsing modes or aggressive site-data cleanup can remove cached models and offline assets.

Model loading

  • The first run may download model or runtime assets from the tool bundle or model CDN.
  • After successful loading, repeat use can be faster if the browser keeps the model cache or IndexedDB data.
Procesamiento en el navegador
Resultados inmediatos
Sin almacenamiento de datos

Qué es Transcripción privada de voz a texto (Whisper Web)?

Transcribir voz a texto es útil para notas de reunión, audios personales y entrevistas cortas, pero muchos servicios empiezan pidiendo la subida completa del archivo a una plataforma externa. Para grabaciones internas o contenido aún no publicado, esa fricción no tiene sentido. Esta herramienta lleva el flujo de Whisper al navegador. Puedes abrir un archivo local, dejar que el modelo corra en tu dispositivo y revisar o descargar la transcripción sin enviar el audio o Video al servidor de la app.

Los servicios de transcripción en la nube no siempre encajan con grabaciones sensibles

Muchos servicios de voz a texto exigen subir el archivo completo antes de iniciar la transcripción.

Eso incomoda cuando el material es una reunión interna, una entrevista en borrador, un audio personal o contenido creativo aún no publicado.

Tambien aparecen el tiempo de subida, el procesamiento remoto y la espera para descubrir si la transcripción realmente quedo bien.

En muchos casos, la necesidad es más simple: correr la transcripción localmente, mantener el archivo donde esta y exportar el texto cuando el resultado sea aceptable.

Ejecutar Whisper en el navegador con transcripción local y bloques con timestamp

La herramienta usa un modelo Whisper en el navegador para convertir grabaciones locales en texto sin enviar el archivo al servidor de la app.

Puedes sugerir el idioma de origen, priorizar WebGPU en dispositivos compatibles o usar WASM para un camino más conservador.

El resultado incluye la transcripción completa y bloques con marcas de tiempo para revisar el contenido con más rapidez antes de copiar o descargar.

Cómo usar Transcripción privada de voz a texto (Whisper Web)

  1. 1Elige la grabación - Sube un archivo de audio o Video compatible con tu navegador.
  2. 2Define el idioma - Usa detección automatica o selecciona el idioma de origen si ya lo conoces.
  3. 3Elige el backend - Usa el modo automático para priorizar WebGPU o fuerza WASM si prefieres más compatibilidad.
  4. 4Ejecuta la transcripción - Espera a que el navegador prepare el modelo local y procese la grabación.
  5. 5Revisa y exporta - Comprueba la transcripción, los bloques con timestamps y luego copia o descarga el texto.

Funciones principales

  • Transcripción local con Whisper en el navegador
  • Soporte para audio y varias fuentes de Video
  • Bloques con timestamps para revisar más rápido
  • No envía la grabación al servidor de la app
  • Cache del modelo para futuras ejecuciones

Beneficios

  • Mantiene reuniones y notas de voz dentro del dispositivo
  • Evita subir archivos sensibles a una plataforma externa
  • Acelera la creacion de borradores y minutas
  • Sirve como paso inicial antes de resumir o editar

Casos de uso

Notas de reunión privadas

Transcribe reuniones internas o llamadas de trabajo sin mandar el archivo fuera del dispositivo.

Audios personales

Convierte notas de voz en texto manteniendo el archivo original en el equipo.

Entrevistas en borrador

Crea una primera transcripción para edicion y revisión posterior.

Flujos de contenido

Convierte voz en texto para subtitulos, resumentes, briefs o organizacion de ideas.

Consejos y errores comunes

Consejos

  • Elige el idioma correcto cuando ya lo conozcas, sobre todo en clips cortos.
  • Prioriza WebGPU en dispositivos compatibles si quieres mejor velocidad de inferencia.
  • Descarga la transcripción al terminar en lugar de dejarla solo en la pestána abierta.
  • Es normal que la primera ejecución sea más lenta porque el modelo puede necesitar descarga y cache.
  • Grabaciones más limpias, con poco ruido y menos superposicion de voces, suelen producir resultados más fáciles de revisar.

Errores comunes

  • Asumir que transcripción local significa que ningún modelo necesita descargarse la primera vez.
  • Esperar perfeccion inmediata en archivos con mucho ruido o varias personas hablando al mismo tiempo.
  • Cerrar la pestána mientras el modelo aún se carga o la transcripción sigue en curso.
  • Tratar la primera salida como si ya fuera una versión final validada.
  • Ignorar que la velocidad depende bastante del navegador y del hardware del dispositivo.

Notas útiles

  • La transcripción con IA local reduce el riesgo de exponer grabaciones, pero aún depende de la descarga del modelo y de la compatibilidad del navegador.
  • Whisper funciona bien en muchos escenarios reales, pero el ruido de fondo y las voces superpuestas siguen reduciendo precision.
  • WebGPU puede acelerar la inferencia, mientras que WASM suele ofrecer compatibilidad más amplia.
  • La primera transcripción suele ser un borrador útil de trabajo, no necesariamente un documento final validado.
  • El cache del navegador ayuda bastante en las siguientes ejecuciones después del costo inicial de preparacion.

Preguntas frecuentes

El archivo de audio se envía a algun servidor?

No. El archivo permanece en el navegador mientras Whisper corre localmente. Solo los archivos del modelo pueden descargarse en la primera ejecución.

Sirve para grabaciones de reunión?

Sí. Ese es uno de los usos más naturales de la herramienta, siempre que el formato sea compatible con el navegador.

Por que la primera ejecución es más lenta?

El navegador puede necesitar descargar y guardar en cache los archivos del modelo antes de que la transcripción local quede lista.

La herramienta muestra timestamps?

Sí. La salida incluye bloques con marcas de tiempo para facilitar la revisión.

Esto sustituye una plataforma corporativa de transcripción?

No. Es una herramienta enfocada en transcripción local en el navegador, no un sistema corporativo completo de gestion de equipos.

Explorar más Herramientas de IA local

Transcripción privada de voz a texto (Whisper Web) forma parte de la categoría Herramientas de IA local. Explora más herramientas gratis online para resolver tareas parecidas con mayor rapidez.

Ver todo Herramientas de IA local