Come risolvere la dettatura estone e lo streaming su Windows
Ieri abbiamo lanciato Smart Transcription. Oggi abbiamo passato tutta la giornata a sistemare quello che ha rotto.
Tre rilasci. Tre bug che risalgono tutti alla stessa realtà: costruire un'app di voce in testo in tempo reale è più difficile di quanto sembri.
Parole estoni sparivano
Un utente che dettava in estone ha notato qualcosa di strano. La parola “jää” (ghiaccio) appariva come “j “. La parola “töötab” (funziona) diventava “t tab”. “Hääldada” (pronunciare) si trasformava in “h ldada”.
Lettere sparivano a metà parola.
Ci è voluto un po' per individuarlo. Il filtro per le parole di riempimento — la funzione che abbiamo rilasciato ieri per eliminare “um”, “uh” e “hmm” dalla tua detta con IA — aveva voci per suoni di esitazione comuni in estone. Suoni che per caso compaiono anche all'interno di parole estoni normali.
Il filtro non riusciva a distinguere tra una parola di riempimento autonoma e le stesse lettere all'interno di una parola reale. Quindi le eliminava.
Ogni parola estone contenente quelle combinazioni di lettere veniva rovinata.
La soluzione: rimuovere completamente le voci problematiche dal filtro veloce. Lo strato intelligente di trascrizione IA può ancora riconoscere le parole di riempimento estoni usando il contesto. Il filtro veloce semplicemente non può gestirle in sicurezza.
Estone, finlandese e tutte le altre lingue con caratteri fuori dall'alfabeto inglese ora trascrivono correttamente. Superscribe supporta la dettatura in 99 lingue — e ora tutte funzionano come dovrebbero.
Lo streaming su Windows finiva nel posto sbagliato
Il secondo bug era specifico per la nostra app di dettatura per Windows. Posizioni il cursore nel mezzo di un paragrafo. Inizi a dettare. Le nuove parole appaiono — alla fine del documento.
Nella nostra app di dettatura per Mac, la posizione del cursore funziona correttamente. Il sistema la gestisce nativamente. Windows non lo offre gratuitamente.
Il nostro approccio originale funzionava bene per casi semplici. Ma quando inizi a trasmettere in streaming voce in testo in tempo reale — le parole appaiono mentre le pronunci — le cose si complicano rapidamente. Il testo deve posizionarsi esattamente dove si trova il cursore, aggiornarsi senza intoppi mentre continui a parlare e gestire correttamente ogni lingua e carattere.
Abbiamo riscritto due volte il motore di streaming in un solo giorno per farlo funzionare bene.
Il primo tentativo ha risolto lo spostamento del cursore ma aveva ancora problemi con i caratteri speciali e il lampeggiamento visivo. Il secondo tentativo ha adottato un approccio completamente diverso: invece di inserire i caratteri uno a uno, ora aggiorniamo il testo tutto in una volta. Niente lampeggiamenti. Nessuna corruzione dei caratteri. Nessun salto del cursore.
Ci è voluto un po' di impegno per renderlo fluido, ma il risultato vale la pena. Dettatura vocale su Windows ora funziona come dovrebbe — le parole appaiono dove si trova il cursore, nel momento in cui le pronunci.
Il bug dell’incolla obsoleto
C’era un terzo bug, più piccolo. Se registravi una trascrizione, poi iniziavi una nuova registrazione e la annullavi, incollando veniva inserita la vecchia trascrizione invece di niente.
Correzione semplice, ma quel tipo di problema che si nota solo quando qualcuno usa l’app di dettatura vocale in modo diverso da come ti aspettavi.
Tre versioni in un giorno
Ecco come è andata la giornata:
v0.2.34 — Corretto il bug dell’incolla obsoleto.
v0.2.35 — Prima riscrittura dello streaming per Windows. Risolto lo spostamento del cursore ma ancora qualche imperfezione.
v0.2.36 — Seconda riscrittura dello streaming più la correzione dei caratteri estoni. Tutto fluido.
Tutte e tre le versioni sono firmate e distribuite tramite il nostro normale processo di rilascio. Aggiorna all’ultima versione e troverai tutto.
Cosa significa per te
Se detti in estone, finlandese o in qualsiasi lingua con caratteri speciali — ora funziona. Niente più lettere mancanti.
Se usi Superscribe su Windows e ti piace dettare nel mezzo di un testo già esistente — ora funziona. La posizione del cursore viene rispettata.
Se vuoi solo una dettatura vocale fluida e pulita sul tuo desktop — questo è quello che ottieni.
Superscribe è un app di dettatura con tracciamento automatico del tempo per Mac e Windows. Premi una scorciatoia da tastiera, parla e le tue parole appaiono istantaneamente in qualsiasi campo di input. Il tempo si traccia da solo mentre detti — niente timer, niente fogli di calcolo, niente dimenticanze su cosa hai lavorato.
E se qualcosa si è rotto — dicci. Risolveremo il problema prima che tu finisca di scrivere il report del bug. Ovviamente parlando.
Letture correlate
Vuoi che sia più facile nella pratica?
Prova Superscribe nel tuo prossimo compito reale
Usalo per follow-up, note, email e lavoro cliente, poi decidi se si adatta al tuo flusso di lavoro.
Prova Superscribe