Eine Woche Superscribe-Release: 18. bis 25. Februar

Eine Woche Superscribe-Release: 18. bis 25. Februar

Sieben Tage. Drei Releases. Sechs Blogbeiträge. Eine Google Ads-Kampagne, die heimlich 19 Länder hinzugefügt hat, ohne uns zu informieren.

Das ist diese Woche wirklich passiert beim Aufbau von Superscribe.

Smart Transcription: Das große Feature

Das Hauptfeature war Smart Transcription, und es betrifft jede Ebene des Stacks.

Die Idee ist einfach: Wenn du aufhörst zu sprechen, bereinigt Superscribe, was du gesagt hast. Entfernt Füllwörter. Formatiert das Ergebnis in die Struktur, die du brauchst. E-Mail, Meeting-Notizen, Code-Kommentare, Rechnungspositionen.

Die Umsetzung war nicht einfach.

Wir haben ein zweistufiges Füllwort-System gebaut. Die erste Stufe ist ein schneller Regex-Durchlauf, der gängige Füllwörter in fünf Sprachen entfernt: Englisch, Estnisch, Deutsch, Spanisch und Französisch. Keine API-Aufrufe, keine Verzögerung. Nur Mustererkennung.

Die zweite Stufe schickt das Transkript durch GPT-4o-mini für intelligente Filterung mit einem 4-Sekunden-Timeout. Wir haben zuerst Gemini 2.5 Flash ausprobiert, sind aber zurückgegangen, weil es in der Produktion ständig Zeitüberschreitungen gab.

Oben drauf gibt es jetzt ein Templatesystem. Wähle ein Template, bevor du zu sprechen beginnst. Wenn du aufhörst, wird das rohe Transkript in strukturiertes Ergebnis umgewandelt. Meeting-Notizen kommen als Aufzählungspunkte mit Aufgaben heraus. E-Mails sind versandfertig.

Ein kleines Detail, das wichtiger ist, als es klingt: der 750-Millisekunden-Stopp-Puffer. Wenn du die Hotkey-Taste loslässt, bleibt das Mikrofon noch 750 ms offen. So werden die letzten Worte erfasst, die man natürlich spricht, während man zur Tastatur greift. Ohne das würden die letzten ein oder zwei Worte immer abgeschnitten.

Das wurde als v0.2.29 am 24. Februar für macOS und Windows veröffentlicht.

Windows-Parität wurde ernst

Superscribe auf macOS und Windows identisch zum Laufen zu bringen, ist eines dieser Probleme, die einfach klingen, es aber nicht sind.

Das Release v0.2.32 hat eine Reihe Windows-spezifischer Bugs behoben:

Das Füller-Filtering war stillschweigend kaputt, weil im GraphQL-Schema ein ID-Feld bei UserSettings fehlte. Apollo-Cache-Updates brauchen eine stabile ID, um Daten korrekt zusammenzuführen. Ohne diese würde die Mutation auf dem Server zwar erfolgreich sein, aber der lokale Cache würde nie aktualisiert. Der Schalter sah so aus, als würde er funktionieren, aber die Einstellung blieb nie erhalten.

Templates hatten ein ähnliches Problem. Die App schickte den String „none“ statt null, wenn kein Template ausgewählt war. Das Backend behandelte „none“ als gültige Template-ID, versuchte sie nachzuschlagen, scheiterte und gab stillschweigend unformatierten Text zurück.

Die interessanteste Korrektur war das nicht-aktivierende Fenster. Auf macOS gibt es eine saubere AppKit-API für Fenster, die Klicks akzeptieren, ohne den Fokus von anderen Apps zu stehlen. Unter Windows braucht man Win32-Interop. Wir nutzten P/Invoke, um user32.dll aufzurufen und WS_EX_NOACTIVATE sowie WS_EX_TOOLWINDOW in den erweiterten Fensterstilen zu setzen. Das bedeutet, Superscribe kann über deinem Editor schweben, Streaming-Text anzeigen und niemals deine Cursorposition stehlen.

Dann hat v0.2.33 einen subtilen Fehler behoben, bei dem Umgebungsgeräusche vom Mikrofon den Template-Prozessor auslösen konnten. Wenn du eine Aufnahme gestartet, ein Template ausgewählt und dann ohne tatsächlich zu sprechen gestoppt hast, wartete der Formatter ewig auf strukturierte Ausgabe, die nie kam. Die Lösung war eine einzige Zeile: Leerzeichen am Ende des Textes entfernen, bevor geprüft wird, ob er leer ist.

Wir haben uns hingesetzt, um die Google Ads-Kampagne zu überprüfen, und etwas Alarmierendes entdeckt. Zwischen dem 16. und 22. Februar hatte Google automatisch 145 Empfehlungen auf unsere Kampagne angewendet. Darunter war die Ausweitung unserer Zielgruppe von 4 auf 23 Länder ohne menschliche Freigabe.

Die gute Nachricht: Einige dieser automatischen Erweiterungen haben tatsächlich funktioniert. Die Kampagne erreicht jetzt 27 Länder und die Gesamtdaten sind solide. 12.214 Impressionen, 1.476 Klicks, 12 % Klickrate, 75 Conversions bei durchschnittlichen Kosten pro Akquisition von 8,10 Euro.

Die interessante Entdeckung war die geografische Leistung. Baltische und südeuropäische Länder schneiden deutlich besser ab als englischsprachige Märkte. Lettland konvertiert bei 2,91 Euro pro Akquisition. Die USA kosten 16,03 Euro. Basierend auf den Daten haben wir die VAE, Neuseeland, Hongkong und Norwegen hinzugefügt.

Wir haben auch die automatische Anwendung für zukünftige Empfehlungen deaktiviert. Vertrauen, aber überprüfen funktioniert nicht, wenn Google dein Geld ausgibt.

Demo-Modus: Ausprobieren, bevor du dich anmeldest

Wir haben einen Demo-Modus entworfen und teilweise entwickelt, der es ermöglicht, Superscribe ohne Kontoerstellung auszuprobieren. Das Backend ist fertig: 5 Minuten kostenlose Transkription pro Gerät, identifiziert durch eine UUID-Installations-ID, mit IP-Rate-Limiting zur Missbrauchsverhinderung.

Die Arbeit am macOS-Client ist entworfen, aber noch nicht veröffentlicht. Wenn er live geht, können neue Nutzer die Tastenkombination drücken und innerhalb von 30 Sekunden nach der Installation der App mit dem Diktieren beginnen. Keine E-Mail, kein Passwort, keine Hürden.

Infrastruktur aufbauen

Kleine Verbesserungen, die sich über die Zeit summieren. Das Windows-Build-Skript erstellt jetzt fehlende Verzeichnisse, bevor es mit der VM synchronisiert. Der Installer liest Versionsnummern dynamisch statt als fest codierte Strings. Ein neuer –build-only-Flag überspringt den S3-Upload während der Entwicklung. Ein eigenständiges Signierskript liegt auf der Windows-VM, falls die SSH-Ausgabe abgeschnitten wird.

Jede Veröffentlichung durchläuft die gleiche Pipeline: bauen, signieren (Apple-Notarisierung auf Mac, Azure Trusted Signing auf Windows), Upload zu S3 mit versionierten und aktuellen Pfaden, API bereitstellen, Push zu git.

Sechs Blogbeiträge

Wir haben sechs Blogbeiträge im Tagesrhythmus veröffentlicht. Einen SEO-Vergleich gegen SuperWhisper. Drei Artikel zu Diktier-Workflows und Zeiterfassung. Einen Artikel „Voice Memo Friedhof“ darüber, warum Sprachnotizen auf deinem Handy sterben. Und einen Meta-Artikel über das Prompting-Engpass.

Jeder Beitrag bekam ein einzigartiges generiertes Bild und wir haben einen Fehler bei der Datumsverarbeitung behoben, der dazu führte, dass Beiträge mit zukünftigem Datum vor ihrer geplanten Zeit erschienen.

Die Zahlen

Bis zum Ende der Woche:

  • 3 Releases veröffentlicht (v0.2.29, v0.2.32, v0.2.33)
  • 6 Blogbeiträge veröffentlicht
  • Insgesamt 39 Verzeichnis-Einträge
  • 27 Länder mit Google Ads angesprochen
  • 75 Conversions bei 8,10 Euro CPA
  • Smart Transcription auf beiden Plattformen live
  • Demo-Modus Backend fertiggestellt

Nächste Woche: Veröffentlichung des macOS Demo-Modus Clients, mehr Blog-Inhalte und Fortsetzung der Verzeichnis-Eintrag-Kampagne.

Wenn du sehen willst, wie es sich in der echten Arbeit anfühlt, probiere Superscribe.

Möchten Sie, dass sich das in der Praxis einfacher anfühlt?

Probieren Sie Superscribe bei Ihrer nächsten echten Aufgabe aus

Verwenden Sie es für Nachverfolgungen, Notizen, E-Mails und Kundenarbeit und entscheiden Sie dann, ob es zu Ihrem Workflow passt.

Teste Superscribe
← Zurück zum Blog