Arreglando el dictado en estonio y la transmisión en Windows
Ayer lanzamos Smart Transcription. Hoy pasamos todo el día arreglando lo que rompió.
Tres lanzamientos. Tres errores que se remontan a la misma realidad: construir una aplicación de voz a texto en tiempo real es más difícil de lo que parece.
Las palabras en estonio desaparecían
Un usuario dictando en estonio notó algo raro. La palabra “jää” (hielo) aparecía como “j “. La palabra “töötab” (funciona) se convirtió en “t tab”. “Hääldada” (pronunciar) cambió a “h ldada”.
Las letras desaparecían en medio de la palabra.
Nos tomó un tiempo encontrarlo. El filtro de palabras de relleno — la función que lanzamos ayer para eliminar “um”, “uh” y “hmm” de tu dictado con IA — tenía entradas para sonidos comunes de duda en estonio. Sonidos que también aparecen dentro de palabras normales en estonio.
El filtro no podía distinguir entre un relleno independiente y las mismas letras dentro de una palabra real. Así que las eliminaba.
Cada palabra estonia que contenía esas combinaciones de letras quedaba dañada.
La solución: eliminar completamente las entradas problemáticas del filtro rápido. La capa inteligente de transcripción con IA todavía puede detectar los rellenos estonios usando el contexto. El filtro rápido simplemente no puede manejarlos de forma segura.
El estonio, finlandés y cualquier otro idioma con caracteres fuera del alfabeto inglés ahora se transcriben correctamente. Superscribe soporta dictado en 99 idiomas — y ahora todos funcionan como deberían.
La transmisión en Windows se estaba ubicando en el lugar equivocado
El segundo error era específico de nuestra app de dictado para Windows. Colocas el cursor en medio de un párrafo. Comienzas a dictar. Las nuevas palabras aparecen — al final del documento.
En nuestra app de dictado para Mac, la posición del cursor funciona bien. El sistema lo maneja de forma nativa. Windows no te da eso gratis.
Nuestro enfoque original funcionaba bien para casos simples. Pero cuando empiezas a transmitir texto por voz en tiempo real — palabras que aparecen mientras las pronuncias — las cosas se complican rápido. El texto debe aparecer exactamente donde está tu cursor, actualizarse suavemente mientras sigues hablando y manejar correctamente cada idioma y carácter.
Reescribimos el motor de transmisión dos veces en un día para hacerlo bien.
El primer intento corrigió el desplazamiento del cursor pero aún tenía problemas con caracteres especiales y parpadeo visual. El segundo intento tomó un enfoque completamente diferente: en lugar de insertar caracteres uno por uno, ahora actualizamos todo el texto de una vez. Sin parpadeos. Sin corrupción de caracteres. Sin saltos del cursor.
Tomó algo de esfuerzo lograr que fuera fluido, pero el resultado vale la pena. Voz a texto en Windows ahora se siente como debería — las palabras aparecen donde está tu cursor, en el momento en que las dices.
El error del pegado obsoleto
Había un tercer error, más pequeño. Si grababas una transcripción, luego empezabas una nueva grabación y la cancelabas, al pegar se insertaba la transcripción antigua en lugar de nada.
Arreglo simple, pero el tipo de cosas que solo detectas cuando alguien usa la aplicación de voz a texto de manera diferente a lo que esperabas.
Tres versiones en un día
Así fue el día:
v0.2.34 — Se corrigió el error del pegado obsoleto.
v0.2.35 — Primera reescritura de transmisión para Windows. Se corrigió el desplazamiento del cursor pero aún tenía detalles por pulir.
v0.2.36 — Segunda reescritura de transmisión más la corrección de caracteres estonios. Todo fluido.
Las tres versiones están firmadas y distribuidas a través de nuestro canal normal de lanzamientos. Actualiza a la última y lo tendrás todo.
Lo que esto significa para ti
Si dictas en estonio, finlandés o cualquier idioma con caracteres especiales — ahora funciona. No más letras faltantes.
Si usas Superscribe en Windows y te gusta dictar en medio de un texto ya existente, ahora funciona. Se respeta la posición del cursor.
Si solo quieres una escritura por voz suave y limpia en tu escritorio, eso es lo que obtienes.
Superscribe es una app de voz a texto con seguimiento automático de tiempo para Mac y Windows. Pulsa un atajo de teclado, habla y tus palabras aparecen al instante en cualquier campo de entrada. El tiempo se registra solo mientras dictas, sin temporizadores, sin hojas de cálculo, sin olvidar en qué trabajaste.
Y si algo más se rompió — cuéntanos. Enviaremos la solución antes de que termines de escribir el informe de error. Hablando, obviamente.
Lectura relacionada
¿Quieres que esto sea más fácil en la práctica?
Prueba Superscribe en tu próxima tarea real
Úsalo para seguimientos, notas, correos y trabajo con clientes, luego decide si se adapta a tu flujo de trabajo.
Prueba Superscribe