Une semaine de lancement de Superscribe : du 18 au 25 février
Sept jours. Trois versions. Six articles de blog. Une campagne Google Ads qui a discrètement ajouté 19 pays sans nous prévenir.
Voici ce qui s'est vraiment passé cette semaine dans le développement de Superscribe.
Transcription intelligente : la grande nouveauté
La fonctionnalité phare était la Transcription intelligente, qui a impacté tous les niveaux de la pile.
L'idée est simple : quand vous arrêtez de parler, Superscribe nettoie ce que vous avez dit. Il supprime les mots parasites. Il formate le résultat dans la structure dont vous avez besoin. Email, notes de réunion, commentaires de code, lignes de facture.
La mise en œuvre n'a pas été simple.
Nous avons construit un système à deux niveaux pour les mots parasites. Le premier niveau est un passage rapide par regex qui élimine les mots parasites courants dans cinq langues : anglais, estonien, allemand, espagnol et français. Pas d'appels API, pas de latence. Juste une correspondance de motifs.
Le second niveau envoie la transcription à GPT-4o-mini pour un filtrage intelligent avec un délai d'attente de 4 secondes. Nous avons essayé Gemini 2.5 Flash d'abord, mais nous sommes revenus en arrière après plusieurs délais d'attente en production.
En plus du filtrage, il y a maintenant un système de modèles. Choisissez un modèle avant de commencer à parler. Quand vous arrêtez, la transcription brute est transformée en sortie structurée. Les notes de réunion sortent sous forme de points avec des actions à faire. Les emails sont prêts à être envoyés.
Un détail subtil mais important : le tampon d'arrêt de 750 millisecondes. Quand vous relâchez la touche de raccourci, le micro reste ouvert encore 750 ms. Cela capture les derniers mots que les gens prononcent naturellement en allant vers le clavier. Sans ça, le dernier mot ou deux seraient systématiquement coupés.
Cette version est sortie en v0.2.29 le 24 février, sur macOS et Windows.
La parité Windows devient réelle
Faire fonctionner Superscribe de manière identique sur macOS et Windows est un de ces problèmes qui semble simple mais ne l'est absolument pas.
La version v0.2.32 a corrigé une série de bugs spécifiques à Windows :
Le filtrage des remplissages était silencieusement cassé car le schéma GraphQL manquait d'un champ ID sur UserSettings. Les mises à jour du cache Apollo ont besoin d'un ID stable pour fusionner correctement les données. Sans cela, la mutation réussissait sur le serveur mais le cache local ne se mettait jamais à jour. Le bouton semblait fonctionner, mais le réglage ne restait jamais en place.
Les modèles avaient un problème similaire. L'application envoyait la chaîne « none » au lieu de null lorsqu'aucun modèle n'était sélectionné. Le backend considérait « none » comme un ID de modèle valide, essayait de le rechercher, échouait, et retournait silencieusement du texte non formaté.
La correction la plus intéressante concernait la fenêtre non activante. Sur macOS, il existe une API AppKit propre pour les fenêtres qui acceptent les clics sans voler le focus aux autres applications. Sur Windows, il faut utiliser l'interop Win32. Nous avons utilisé P/Invoke pour appeler user32.dll et définir WS_EX_NOACTIVATE et WS_EX_TOOLWINDOW dans les styles de fenêtre étendus. Cela signifie que Superscribe peut flotter au-dessus de votre éditeur, afficher du texte en streaming, et ne jamais voler la position de votre curseur.
Ensuite, la version v0.2.33 a corrigé un bug subtil où le bruit ambiant du micro pouvait déclencher le processeur de modèles. Si vous commenciez un enregistrement, sélectionniez un modèle, puis arrêtiez sans parler réellement, le formateur attendait indéfiniment une sortie structurée qui n’arriverait jamais. La correction était une seule ligne : supprimer les espaces blancs du texte final avant de vérifier s’il est vide.
Google Ads : Les 145 recommandations surprises
Nous nous sommes penchés sur la campagne Google Ads et avons découvert quelque chose d’alarmant. Entre le 16 et le 22 février, Google avait automatiquement appliqué 145 recommandations à notre campagne. Cela incluait l’élargissement de notre ciblage de 4 pays à 23 pays sans aucune validation humaine.
La bonne nouvelle : certaines de ces expansions automatiques ont réellement fonctionné. La campagne atteint désormais 27 pays et les chiffres globaux sont solides. 12 214 impressions, 1 476 clics, un taux de clics de 12 %, 75 conversions avec un CPA moyen de 8,10 euros.
La découverte intéressante concernait la performance géographique. Les pays baltes et d'Europe du Sud surpassent largement les marchés anglophones. La Lettonie convertit à 2,91 euros par acquisition. Les États-Unis coûtent 16,03 euros. Nous avons ajouté les Émirats arabes unis, la Nouvelle-Zélande, Hong Kong et la Norvège en fonction des données.
Nous avons également désactivé l'application automatique pour les recommandations futures. Faire confiance mais vérifier ne fonctionne pas quand Google dépense votre argent.
Mode Démo : Essayez avant de vous connecter
Nous avons conçu et partiellement développé un mode démo qui permet aux utilisateurs d’essayer Superscribe sans créer de compte. Le backend est complet : 5 minutes de transcription gratuite par appareil, identifié par un ID d’installation UUID, avec limitation de débit IP pour éviter les abus.
Le client macOS est conçu mais pas encore livré. Lorsqu’il sera disponible, les nouveaux utilisateurs pourront utiliser le raccourci clavier et commencer à dicter dans les 30 secondes suivant l’installation de l’application. Pas d’email, pas de mot de passe, sans friction.
Construire l’infrastructure
Petites améliorations qui s’accumulent avec le temps. Le script de build Windows crée désormais les répertoires manquants avant la synchronisation avec la VM. L’installateur lit les numéros de version dynamiquement au lieu de chaînes codées en dur. Un nouveau flag –build-only évite le téléchargement sur S3 pendant le développement. Un script de signature autonome est disponible sur la VM Windows pour quand la sortie SSH est tronquée.
Chaque version suit le même processus : build, signature (notarisation Apple sur Mac, signature Azure Trusted sur Windows), upload vers S3 avec chemins versionnés et latest, déploiement de l’API, push sur git.
Six articles de blog
Nous avons publié six articles de blog à raison d'un par jour. Un article comparatif SEO contre SuperWhisper. Trois articles sur les flux de travail de dictée et le suivi du temps. Un article « cimetière de mémos vocaux » expliquant pourquoi les notes vocales disparaissent de votre téléphone. Et un article méta sur le goulot d'étranglement des prompts.
Chaque article a reçu une image générée unique et nous avons corrigé un bug de gestion des dates qui faisait apparaître des articles datés dans le futur avant leur heure prévue.
Les chiffres
À la fin de la semaine :
- 3 versions publiées (v0.2.29, v0.2.32, v0.2.33)
- 6 articles de blog publiés
- 39 soumissions dans des annuaires au total
- 27 pays ciblés dans Google Ads
- 75 conversions à 8,10 euros CPA
- Smart Transcription en direct sur les deux plateformes
- Mode démo backend terminé
La semaine prochaine : publication du client macOS en mode démo, plus de contenu pour le blog, et poursuite de la campagne de soumission dans les annuaires.
Si vous voulez voir ce que ça donne en situation réelle, essayez Superscribe.
Lectures associées
Vous voulez que ce soit plus simple en pratique ?
Essayez Superscribe sur votre prochaine tâche réelle
Utilisez-le pour les suivis, notes, emails et travail client, puis décidez s'il convient à votre flux de travail.
Essayez Superscribe