Intelligente Transkription: Was passiert, nachdem du aufgehört hast zu sprechen
Die meisten Diktier-Apps hören auf zu funktionieren, sobald Sie aufhören zu sprechen. Sie erhalten einen Haufen rohen Texts, inklusive jedem „äh“, jedem Fehlstart und jedem Satz, der ins Leere lief. Dann liegt es an Ihnen, das Ganze aufzuräumen.
Die intelligente Transkriptions-Pipeline von Superscribe ändert das. Sie nimmt die rohe Sprache und durchläuft zwei Stufen: sofortige Füllwortentfernung und dann KI-gestützte Formatierung nach Vorlage. Das Ergebnis ist ein nutzbarer Text, ohne dass Sie ihn bearbeiten müssen.
So funktioniert es.
Stufe 1: Füllwortentfernung (sofort)
Die erste Stufe passiert in dem Moment, in dem Ihre Audioaufnahme transkribiert wird. Noch bevor eine KI den Text berührt, werden Füllwörter sofort entfernt.
Dabei handelt es sich nicht um ein Sprachmodell, das entscheidet, was behalten wird. Es ist Mustererkennung. Schnell, vorhersehbar und gründlich.
Folgendes wird entfernt:
- Füllwörter: „äh“, „ähm“, „hmm“, „like“, „you know“, „basically“
- Sprachspezifische Füllwörter in über 99 Sprachen: Deutsch „äh“, Französisch „euh“, Estnisch „noh“, Spanisch „pues“ und viele mehr
- Wiederholte Wörter: „the the“, „I I“, „so so“
- Nach der Entfernung zurückbleibende Satzzeichenfehler (verwaiste Kommas, doppelte Leerzeichen, nachgestellte Punkte)
Wichtig: Das verursacht keine Verzögerung. Es läuft als reine Texttransformation, ohne Netzwerkaufruf oder Modellinferenz. Wenn Sie Ihre Transkription sehen, sind die Füllwörter bereits entfernt.
Für viele Anwendungsfälle reicht das aus. Sie diktieren, die Füllwörter verschwinden, und Sie haben sauberen Text. Fertig.
Manchmal brauchen Sie aber mehr als nur sauberen Text. Sie brauchen formatierten Output.
Stufe 2: KI-Vorlagenverarbeitung
Hier kommen die 13 Ausgabevorlagen ins Spiel. Wählen Sie eine Vorlage, und ein KI-Modell nimmt Ihre bereinigte Transkription und formatiert sie in ein bestimmtes Dokumentformat um.
Die Verarbeitung ist stimmungsbewusst. Sie erkennt den Ton und die Absicht dessen, was Sie gesagt haben, nicht nur die Worte. Ein frustrierter Fehlerbericht bleibt frustriert. Eine lockere Nachricht bleibt locker. Die KI formatiert um, ohne Ihre Stimme zu verwässern.
Währenddessen erscheint ein Ladeindikator, damit Sie wissen, dass die Verarbeitung läuft. Je nach Vorlage und Länge dauert es ein paar Sekunden.
Lassen Sie uns anhand von echten Beispielen durchgehen, wie das tatsächlich aussieht.
Beispiel 1: Roh-Diktat zu professioneller E-Mail
Was du gesagt hast:
„Hey, ich wollte mit dem Kunden live über die Logo-Designs sprechen, die zweite Runde ist fertig und ich denke, Option B ist die stärkste, aber wir sollten sie entscheiden lassen, außerdem muss erwähnt werden, dass sich der Zeitplan wegen der verzögerten Rückmeldung auf ihrer Seite um etwa eine Woche verschoben hat“
Nach Entfernung von Füllwörtern:
„Hey, ich wollte mit dem Kunden live über die Logo-Designs sprechen, die zweite Runde ist fertig und ich denke, Option B ist die stärkste, aber wir sollten sie entscheiden lassen, außerdem muss erwähnt werden, dass sich der Zeitplan wegen der verzögerten Rückmeldung auf ihrer Seite um etwa eine Woche verschoben hat“
Nach der Vorlage für professionelle E-Mails:
Betreff: Update zum Logo-Design – Runde 2 abgeschlossen
Hallo [Client],
Die zweite Runde der Logo-Designs ist abgeschlossen. Von den vorgestellten Optionen sticht Option B als stärkste Richtung hervor, aber wir würden gerne Ihre Meinung hören, bevor wir weitermachen.
Eine kurze Anmerkung zum Zeitplan: Aufgrund der verzögerten Rückmeldung aus der vorherigen Runde hat sich der Zeitplan um etwa eine Woche verschoben. Wir senden Ihnen separat einen aktualisierten Projektzeitplan.
Bitte teilen Sie uns Ihre Gedanken zu den Designs so bald wie möglich mit.
Beste Grüße
Ein Diktat. Keine Bearbeitung. Versandbereit.
Beispiel 2: Brain Dump zu Besprechungsnotizen
Was du gesagt hast:
„Okay, im Standup heute hat Marcus gesagt, die API-Integration ist blockiert, weil die Drittanbieter-Dokumentation falsch ist, Sarah beendet gerade den Onboarding-Prozess, sollte bis Donnerstag fertig sein, und wir haben zugestimmt, den Launch wegen der API-Sache vom 1. März auf den 8. März zu verschieben, oh und wir müssen den Demo-Raum für die Kundenpräsentation am Freitag buchen“
Vorlage für Nachbesprechungsnotizen:
Besprechungsnotizen
Teilnehmer: Marcus, Sarah
Updates:
- API-Integration blockiert wegen falscher Drittanbieter-Dokumentation (Marcus)
- Onboarding-Prozess im Zeitplan, voraussichtliche Fertigstellung bis Donnerstag (Sarah)
Entscheidungen:
- Launch wegen API-Integrationsblockade vom 1. März auf den 8. März verschoben
Aufgaben:
- Demo-Raum für Kundenpräsentation am Freitag buchen
Die Vorlage hat Teilnehmer identifiziert, Updates von Entscheidungen getrennt und Aufgaben extrahiert. Alles aus einem einzigen, etwa 20 Sekunden langen Stream-of-Consciousness-Text.
Beispiel 3: Programmieren – KI-Eingabeaufforderung per Sprache
Hier wird es für Entwickler interessant. Die KI-Coding-Prompt-Vorlage nimmt eine verbale Beschreibung dessen, was du bauen möchtest, und strukturiert sie in eine Eingabeaufforderung, die du direkt in einen KI-Coding-Assistenten einfügen kannst.
Was du gesagt hast:
„Ich brauche eine React-Komponente, die ein Dropdown-Menü mit Suchfilter anzeigt, sie soll ein Array von Optionen als Props akzeptieren, den passenden Text beim Tippen hervorheben und einen onChange-Handler aufrufen, wenn etwas ausgewählt wird, außerdem Tastaturnavigation mit Pfeiltasten und Enter zum Auswählen“
Nach der KI-Coding-Prompt-Vorlage:
Erstelle eine React-Komponente mit folgenden Anforderungen:
Komponente: SearchableDropdown
Props:
- options: Array auswählbarer Elemente
- onChange: Callback-Funktion, die bei Auswahl ausgelöst wird
Funktionen:
- Dropdown-Menü mit Such-/Filtereingabe
- Passenden Text in Optionen beim Tippen hervorheben
- Tastaturnavigation (Pfeiltasten zum Navigieren, Enter zum Auswählen)
Verhalten:
- Filteroptionen basierend auf der Sucheingabe
- Rufe den onChange-Handler mit dem ausgewählten Wert auf
- Unterstützt vollständige Tastaturzugänglichkeit
Die Elite Coding Prompt-Vorlage geht weiter und liefert eine JSON-strukturierte Spezifikation mit Feldern für Kontext, Anforderungen, Einschränkungen und erwartetes Verhalten. Nützlich, um sie an KI-Agenten zu übergeben, die besser mit strukturierten Eingaben arbeiten.
Beispiel 4: Stream-of-Consciousness zur To-Do-Liste
Was du gesagt hast:
„Ich muss das SSL-Zertifikat erneuern, bevor es am 15. abläuft, außerdem muss der Blogbeitrag über Vorlagen diese Woche veröffentlicht werden, erinnere mich daran, das alte Analytics-Abo zu kündigen, das wir nicht mehr nutzen, und ich sollte wahrscheinlich die Abhängigkeiten im Haupt-Repo aktualisieren, bevor sie zu veraltet sind“
Nach der To-Do-Liste-Vorlage:
- SSL-Zertifikat erneuern (Frist: 15.)
- Blogbeitrag über Vorlagen veröffentlichen (diese Woche)
- Unbenutztes Analytics-Abo kündigen
- Abhängigkeiten im Haupt-Repo aktualisieren
Vier Punkte, extrahiert und formatiert aus einem einzigen Satz, den du beim Kaffee machen gesagt hast.
Der Zwei-Stufen-Vorteil
Warum zwei Stufen statt einer? Warum nicht einfach alles an die KI senden?
Geschwindigkeit und Zuverlässigkeit.
Füllwörter werden sofort entfernt. Wenn du nur sauberen Text ohne Formatierung brauchst, bekommst du ihn sofort. Kein Warten, keine Gefahr, dass etwas „hilfreich“ umstrukturiert wird, das du so lassen wolltest.
Die Vorlagen-Stufe ist optional. Wähle eine Vorlage, wenn du strukturierte Ausgabe brauchst. Überspringe sie, wenn nicht. Das bedeutet, dass die Standarderfahrung schnell ist und die erweiterte Erfahrung da ist, wenn du sie brauchst.
Das bedeutet auch, dass die KI sauberere Eingaben bekommt. Füllwörter vor der Vorlagenverarbeitung zu entfernen, heißt, dass das Modell seine Tokens für Struktur und Bedeutung nutzt, nicht dafür, herauszufinden, dass „ähm, also, im Grunde“ ignoriert werden sollte.
Alle 13 Vorlagen
Das komplette Vorlagenangebot deckt fünf Kategorien ab:
Core: Super (Grammatikbereinigung), Nachricht (lockeres Chat-Format), Zusammenfassung
E-Mail: Professionell, Locker
Organisation: Notiz, Besprechungsnotizen, To-Do-Liste
Inhalt: Tweet/Social (unter Verwendung des Hook-Retain-Reward-Frameworks), Blogbeitrag
Programmierung: KI-Coding-Prompt, Elite-Coding-Prompt (JSON-strukturiert), Fehlerbericht
Jede Vorlage ist über das Einstellungsfenster zugänglich, das jetzt auf macOS und Windows ein Inline-Erweiterungsdesign verwendet.
Probier es aus
Intelligente Transkription ist jetzt in Superscribe v0.2.29+ verfügbar. Diktiere etwas Unordentliches. Wähle eine Vorlage. Sieh, was dabei herauskommt.
Hol dir Superscribe auf superscribe.io
Sprechen. Erfassen. Abrechnen.
Verwandte Lektüre
Möchten Sie, dass sich das in der Praxis einfacher anfühlt?
Probieren Sie Superscribe bei Ihrer nächsten echten Aufgabe aus
Verwenden Sie es für Nachverfolgungen, Notizen, E-Mails und Kundenarbeit und entscheiden Sie dann, ob es zu Ihrem Workflow passt.
Teste Superscribe