Corrigindo Ditado em Estoniano e Streaming no Windows
Ontem lançamos a Transcrição Inteligente. Hoje passamos o dia inteiro consertando o que ela quebrou.
Três lançamentos. Três bugs que todos têm a mesma origem: construir um aplicativo de voz para texto em tempo real é mais difícil do que parece. voz para texto app é mais difícil do que parece.
Palavras em estoniano estavam desaparecendo
Um usuário ditando em estoniano percebeu algo errado. A palavra “jää” (gelo) aparecia como “j “. A palavra “töötab” (funciona) virou “t tab”. “Hääldada” (pronunciar) virou “h ldada”.
Letras desapareciam no meio da palavra.
Demoramos um pouco para encontrar o problema. O filtro de palavras de preenchimento — o recurso que lançamos ontem para remover “um”, “uh” e “hmm” da sua ditado por IA — tinha entradas para sons comuns de hesitação em estoniano. Sons que também aparecem dentro de palavras normais em estoniano.
O filtro não conseguia diferenciar entre um preenchimento isolado e as mesmas letras dentro de uma palavra real. Então ele as removia.
Toda palavra estoniana contendo essas combinações de letras estava sendo distorcida.
A solução: remover completamente as entradas problemáticas do filtro rápido. A camada inteligente de transcrição por IA ainda consegue identificar preenchimentos estonianos pelo contexto. O filtro rápido simplesmente não consegue lidar com eles com segurança.
Estoniano, finlandês e todas as outras línguas com caracteres fora do alfabeto inglês agora transcrevem corretamente. Superscribe suporta ditado em 99 idiomas — e agora todos funcionam como deveriam.
Streaming no Windows estava indo para o lugar errado
O segundo bug era específico do nosso app de ditado para Windows. Você posiciona o cursor no meio de um parágrafo. Começa a ditar. As novas palavras aparecem — no final do documento.
No nosso app de ditado para Mac, a posição do cursor funciona corretamente. O sistema lida com isso nativamente. O Windows não oferece isso automaticamente.
Nossa abordagem original funcionava bem para casos simples. Mas quando você começa a transmitir texto de voz em tempo real — palavras aparecendo conforme você as fala — as coisas ficam complicadas rapidamente. O texto precisa aparecer exatamente onde seu cursor está, atualizar suavemente enquanto você continua falando e lidar corretamente com todos os idiomas e caracteres.
Reescrevemos o motor de streaming duas vezes em um dia para acertar.
A primeira tentativa corrigiu o desvio do cursor, mas ainda tinha problemas com caracteres especiais e cintilação visual. A segunda tentativa adotou uma abordagem completamente diferente: em vez de inserir caracteres um por um, agora atualizamos o texto todo de uma vez. Sem cintilação. Sem corrupção de caracteres. Sem o cursor pulando.
Foi preciso algum esforço para deixar tudo suave, mas o resultado vale a pena. Ditado por voz no Windows agora funciona como deveria — as palavras aparecem onde seu cursor está, no momento em que você as diz.
O Bug da Colagem Obsoleta
Havia um terceiro bug menor. Se você gravasse uma transcrição, depois começasse uma nova gravação e a cancelasse, colar inseria a transcrição antiga em vez de nada.
Correção simples, mas do tipo que você só percebe quando alguém usa o reconhecimento de voz de forma diferente do que você esperava.
Três Versões em Um Dia
Veja como foi o dia:
v0.2.34 — Corrigido o bug da colagem obsoleta.
v0.2.35 — Primeira reescrita do streaming para Windows. Corrigiu o desvio do cursor, mas ainda tinha falhas.
v0.2.36 — Segunda reescrita do streaming mais a correção do caractere estoniano. Tudo suave.
Todas as três versões são assinadas e distribuídas pelo nosso pipeline normal de lançamentos. Atualize para a versão mais recente e estará tudo lá.
O Que Isso Significa Para Você
Se você dita em estoniano, finlandês ou qualquer idioma com caracteres especiais — agora funciona. Sem mais letras faltando.
Se você usa Superscribe no Windows e gosta de ditar no meio de um texto já existente — agora funciona. A posição do seu cursor é respeitada.
Se você só quer uma digitação por voz suave e limpa no seu desktop — é isso que você recebe.
Superscribe é um aplicativo de voz para texto com rastreamento automático de tempo para Mac e Windows. Pressione um atalho de teclado, fale, e suas palavras aparecem instantaneamente em qualquer campo de entrada. O tempo é registrado automaticamente enquanto você dita — sem timers, sem planilhas, sem esquecer no que você trabalhou.
E se algo mais quebrou — nos conte. Vamos enviar a correção antes de você terminar de escrever o relatório de erro. Falando, obviamente.
Leitura relacionada
Quer que isso pareça mais fácil na prática?
Experimente o Superscribe na sua próxima tarefa real
Use para acompanhamentos, notas, e-mails e trabalho com clientes, depois decida se se encaixa no seu fluxo.
Experimente o Superscribe