El dictado de voz en Windows 11 (Win+H) funciona, pero tiene tres problemas que entorpecen el uso serio:
- Precisión promedio. Los nombres propios, la jerga, los términos técnicos — falla a menudo y no hay una forma fácil de corregir.
- Dependencia parcial de la nube. Algunos modos envían audio a los servidores de Microsoft.
- Sin atajo por aplicación. Solo funciona con la ventana emergente de Windows, que roba el foco y rompe el flujo.
Si escribes mucho — correos electrónicos, Slack, Obsidian, scripts, código — un mejor dictado se amortiza en horas ahorradas por semana. Aquí está la configuración con VoxBooster en 2026.
Qué cambia con el dictado neuronal local
VoxBooster utiliza modelos derivados de Whisper que se ejecutan localmente en tu PC. Diferencias prácticas:
- Precisión lo suficientemente alta como para no necesitar editar mucho. Acepta puntuación por comando (“coma”, “punto”, “nueva línea”).
- 100% local. Nada va a un servidor. Importante para cualquiera que dicte documentos sensibles, código propietario o conversación profesional.
- Atajo global. Mantén presionado
Ctrl+Shift+Den cualquier aplicación — Outlook, VS Code, navegador, WhatsApp Web — habla, suelta, el texto aparece en el campo donde está el cursor.
Configuración
- En VoxBooster, ve a Dictation y activa.
- Elige un modelo: Fast (latencia de 200 ms, buena precisión) o Precise (latencia de 500 ms, alta precisión). Para la mayoría de los usos, Fast es suficiente.
- Establece el idioma principal e idioma secundario opcional — útil si mezclas inglés técnico en tu discurso.
- Establece el atajo global. Por defecto:
Ctrl+Shift+D. - Listo. Abre cualquier aplicación, coloca el cursor, mantén presionado el atajo, habla, suelta.
Modos de uso
Presionar para dictar. Mantén presionado el atajo, habla, suelta. El texto aparece inmediatamente. Este es el modo para el 80% de los casos.
Alternar. Presiona el atajo una vez para encender, nuevamente para apagar. Útil para dictado largo (script, correo electrónico grande) donde no quieres mantener una tecla presionada.
Siempre activo. Reconocimiento pasivo esperando un disparador de voz (“Vox, escribir…”). Útil para el flujo sin manos como conducir o con RSI.
Comandos útiles
- “coma” →
, - “punto” / “punto final” →
. - “signo de interrogación” →
? - “signo de exclamación” →
! - “nueva línea” → salto de línea
- “nuevo párrafo” → dos saltos de línea
- “dos puntos” →
: - “abrir paréntesis / cerrar paréntesis” →
(/) - “eliminar última palabra” → retroceso de palabra
- “eliminar todo” → borra el búfer de dictado actual
Casos de uso que funcionan bien
- Correos electrónicos en volumen. Dictar un borrador es 3x más rápido que escribir. 30 segundos de revisión al final.
- Notas personales en Obsidian / Notion. Capturar una idea al ritmo en que te viene a la cabeza, sin estar limitado por la velocidad de escritura.
- Responder en Slack / WhatsApp Web. En una respuesta larga, dictar con un atajo global es más rápido que cambiar al teléfono y usar el dictado del teléfono.
- Mensajes de audio en forma de texto. Graba la idea hablando, consíguela en texto, edición rápida. Respeta mejor el tiempo del lector que el audio.
- Scripts, entradas de blog, documentación. El primer borrador dictado es 2-4x más rápido que escrito. Edición de texto después, normalmente.
Casos donde el dictado no gana
- Código. Nombres de variables, sintaxis, llaves abrir/cerrar — dictar código es más lento que escribir con autocompletar. Excepción: comentario largo en una función, que dicta bien.
- Tablas / hojas de cálculo. La estructura de cuadrícula no coincide con el flujo de voz.
- Entorno ruidoso. Sala con aire acondicionado fuerte, café, espacio compartido — la precisión baja. Mejor volver a escribir.
Privacidad
El modelo se ejecuta localmente, el audio nunca deja tu PC, ningún registro de dictado se guarda por defecto. Si quieres un registro — para revisar borradores perdidos — activa “Keep history” en configuración; los archivos van a una carpeta local que solo tú puedes acceder, encriptada por Windows.
Eso importa para cualquiera que dicte conversación sensible. El dictado nativo de Windows, incluso en modo offline, comparte telemetría del dispositivo. VoxBooster no — sin telemetría en absoluto en el módulo de dictado.