Una semana entregando Superscribe: del 18 al 25 de febrero

Una semana entregando Superscribe: del 18 al 25 de febrero

Siete días. Tres lanzamientos. Seis publicaciones en el blog. Una campaña de Google Ads que añadió 19 países sin avisarnos.

Esto es lo que realmente pasó esta semana construyendo Superscribe.

Transcripción Inteligente: Lo Más Importante

La función principal fue Transcripción Inteligente, y tocó cada capa de la plataforma.

La idea es simple: cuando dejas de hablar, Superscribe limpia lo que dijiste. Elimina muletillas. Da formato a la salida en la estructura que necesites. Email, notas de reuniones, comentarios de código, líneas de factura.

La implementación no fue sencilla.

Construimos un sistema de dos niveles para muletillas. El primer nivel es un pase rápido con regex que elimina muletillas comunes en cinco idiomas: inglés, estonio, alemán, español y francés. Sin llamadas a API, sin latencia. Solo coincidencia de patrones.

El segundo nivel envía la transcripción a través de GPT-4o-mini para un filtrado inteligente con un tiempo límite de 4 segundos. Probamos primero Gemini 2.5 Flash pero volvimos atrás porque se agotaba el tiempo en producción.

Además del filtrado, ahora hay un sistema de plantillas. Elige una plantilla antes de empezar a hablar. Cuando termines, la transcripción en bruto se transforma en una salida estructurada. Las notas de reuniones salen como viñetas con tareas. Los emails salen listos para enviar.

Un detalle sutil que importa más de lo que parece: el buffer de parada de 750 milisegundos. Cuando sueltas la tecla rápida, el micrófono sigue abierto 750 ms más. Esto captura las palabras finales que la gente dice naturalmente mientras alcanza el teclado. Sin esto, se cortarían la última o las dos últimas palabras cada vez.

Esto se lanzó como v0.2.29 el 24 de febrero, tanto en macOS como en Windows.

La Paridad en Windows se Volvió Real

Hacer que Superscribe funcione igual en macOS y Windows es uno de esos problemas que suena fácil y no lo es para nada.

La versión v0.2.32 corrigió una cadena de errores específicos de Windows:

El filtrado de relleno estaba roto silenciosamente porque el esquema GraphQL no tenía un campo ID en UserSettings. Las actualizaciones de caché de Apollo necesitan un ID estable para fusionar los datos correctamente. Sin él, la mutación tenía éxito en el servidor pero la caché local nunca se actualizaba. El interruptor parecía funcionar, pero la configuración nunca se guardaba.

Las plantillas tenían un problema similar. La app enviaba la cadena “none” en lugar de null cuando no se seleccionaba ninguna plantilla. El backend trataba “none” como un ID de plantilla válido, intentaba buscarlo, fallaba y devolvía texto sin formato sin avisar.

La corrección más interesante fue la ventana que no se activaba. En macOS, hay una API limpia de AppKit para ventanas que aceptan clics sin robar el foco de otras apps. En Windows, necesitas interoperabilidad Win32. Usamos P/Invoke para llamar a user32.dll y establecer WS_EX_NOACTIVATE y WS_EX_TOOLWINDOW en los estilos extendidos de ventana. Esto significa que Superscribe puede flotar sobre tu editor, mostrar texto en streaming y nunca robar la posición del cursor.

Luego, la v0.2.33 corrigió un error sutil donde el ruido ambiental del micrófono podía activar el procesador de plantillas. Si empezabas una grabación, seleccionabas una plantilla y luego parabas sin hablar realmente, el formateador esperaba para siempre una salida estructurada que nunca llegaría. La solución fue una sola línea: eliminar espacios en blanco del texto final antes de comprobar si está vacío.

Nos sentamos a revisar la campaña de Google Ads y descubrimos algo alarmante. Entre el 16 y el 22 de febrero, Google aplicó automáticamente 145 recomendaciones a nuestra campaña. Esto incluyó ampliar nuestro objetivo de 4 países a 23 países sin ninguna aprobación humana.

La buena noticia: algunas de esas expansiones automáticas realmente funcionaron. La campaña ahora llega a 27 países y los números generales son sólidos. 12,214 impresiones, 1,476 clics, 12% de tasa de clics, 75 conversiones con un CPA promedio de 8.10 euros.

El descubrimiento interesante fue el rendimiento geográfico. Los países bálticos y del sur de Europa superan ampliamente a los mercados de habla inglesa. Letonia convierte a 2.91 euros por adquisición. Estados Unidos cuesta 16.03 euros. Añadimos Emiratos Árabes Unidos, Nueva Zelanda, Hong Kong y Noruega basándonos en los datos.

También desactivamos la aplicación automática para futuras recomendaciones. Confiar pero verificar no funciona cuando Google está gastando tu dinero.

Modo Demo: Prueba antes de iniciar sesión

Diseñamos y construimos parcialmente un modo demo que permite a las personas probar Superscribe sin crear una cuenta. El backend está completo: 5 minutos de transcripción gratuita por dispositivo, identificado por un ID de instalación UUID, con limitación de tasa por IP para evitar abusos.

El trabajo del cliente para macOS está diseñado pero aún no lanzado. Cuando esté disponible, los nuevos usuarios podrán usar el atajo de teclado y comenzar a dictar en 30 segundos tras instalar la app. Sin email, sin contraseña, sin fricciones.

Construir infraestructura

Pequeñas mejoras que se acumulan con el tiempo. El script de compilación para Windows ahora crea directorios faltantes antes de sincronizar con la VM. El instalador lee números de versión dinámicamente en lugar de cadenas codificadas. Una nueva bandera –build-only omite la subida a S3 durante el desarrollo. Un script de firma independiente vive en la VM de Windows para cuando la salida SSH se trunca.

Cada lanzamiento pasa por la misma cadena: compilar, firmar (notarización de Apple en Mac, firma confiable de Azure en Windows), subir a S3 con rutas versionadas y últimas, desplegar la API, hacer push a git.

Seis publicaciones en el blog

Publicamos seis entradas de blog con un ritmo de una por día. Un artículo comparativo de SEO contra SuperWhisper. Tres artículos sobre flujos de trabajo de dictado y seguimiento de tiempo. Un artículo "cementerio de notas de voz" sobre por qué las notas de voz mueren en tu teléfono. Y un artículo meta sobre el cuello de botella en los prompts.

Cada publicación tuvo una imagen generada única y corregimos un error en el manejo de fechas que hacía que las publicaciones con fecha futura aparecieran antes de su hora programada.

Los números

Al final de la semana:

  • 3 lanzamientos enviados (v0.2.29, v0.2.32, v0.2.33)
  • 6 entradas de blog publicadas
  • 39 envíos a directorios en total
  • 27 países objetivo en Google Ads
  • 75 conversiones con un CPA de 8,10 euros
  • Smart Transcription activo en ambas plataformas
  • Backend del modo demo completado

La próxima semana: lanzamiento del cliente en modo demo para macOS, más contenido para el blog y continuar la campaña de envíos a directorios.

Si quieres ver cómo se siente en trabajo real, prueba Superscribe.

¿Quieres que esto sea más fácil en la práctica?

Prueba Superscribe en tu próxima tarea real

Úsalo para seguimientos, notas, correos y trabajo con clientes, luego decide si se adapta a tu flujo de trabajo.

Prueba Superscribe
← Volver al Blog