Corrigindo Ditado em Estoniano e Streaming no Windows

Corrigindo Ditado em Estoniano e Streaming no Windows

Ontem lançamos a Transcrição Inteligente. Hoje passamos o dia inteiro consertando o que ela quebrou.

Três lançamentos. Três bugs que todos têm a mesma origem: construir um aplicativo de voz para texto em tempo real é mais difícil do que parece. voz para texto app é mais difícil do que parece.

Palavras em estoniano estavam desaparecendo

Um usuário ditando em estoniano percebeu algo errado. A palavra “jää” (gelo) aparecia como “j “. A palavra “töötab” (funciona) virou “t tab”. “Hääldada” (pronunciar) virou “h ldada”.

Letras desapareciam no meio da palavra.

Demoramos um pouco para encontrar o problema. O filtro de palavras de preenchimento — o recurso que lançamos ontem para remover “um”, “uh” e “hmm” da sua ditado por IA — tinha entradas para sons comuns de hesitação em estoniano. Sons que também aparecem dentro de palavras normais em estoniano.

O filtro não conseguia diferenciar entre um preenchimento isolado e as mesmas letras dentro de uma palavra real. Então ele as removia.

Toda palavra estoniana contendo essas combinações de letras estava sendo distorcida.

A solução: remover completamente as entradas problemáticas do filtro rápido. A camada inteligente de transcrição por IA ainda consegue identificar preenchimentos estonianos pelo contexto. O filtro rápido simplesmente não consegue lidar com eles com segurança.

Estoniano, finlandês e todas as outras línguas com caracteres fora do alfabeto inglês agora transcrevem corretamente. Superscribe suporta ditado em 99 idiomas — e agora todos funcionam como deveriam.

Streaming no Windows estava indo para o lugar errado

O segundo bug era específico do nosso app de ditado para Windows. Você posiciona o cursor no meio de um parágrafo. Começa a ditar. As novas palavras aparecem — no final do documento.

No nosso app de ditado para Mac, a posição do cursor funciona corretamente. O sistema lida com isso nativamente. O Windows não oferece isso automaticamente.

Nossa abordagem original funcionava bem para casos simples. Mas quando você começa a transmitir texto de voz em tempo real — palavras aparecendo conforme você as fala — as coisas ficam complicadas rapidamente. O texto precisa aparecer exatamente onde seu cursor está, atualizar suavemente enquanto você continua falando e lidar corretamente com todos os idiomas e caracteres.

Reescrevemos o motor de streaming duas vezes em um dia para acertar.

A primeira tentativa corrigiu o desvio do cursor, mas ainda tinha problemas com caracteres especiais e cintilação visual. A segunda tentativa adotou uma abordagem completamente diferente: em vez de inserir caracteres um por um, agora atualizamos o texto todo de uma vez. Sem cintilação. Sem corrupção de caracteres. Sem o cursor pulando.

Foi preciso algum esforço para deixar tudo suave, mas o resultado vale a pena. Ditado por voz no Windows agora funciona como deveria — as palavras aparecem onde seu cursor está, no momento em que você as diz.

O Bug da Colagem Obsoleta

Havia um terceiro bug menor. Se você gravasse uma transcrição, depois começasse uma nova gravação e a cancelasse, colar inseria a transcrição antiga em vez de nada.

Correção simples, mas do tipo que você só percebe quando alguém usa o reconhecimento de voz de forma diferente do que você esperava.

Três Versões em Um Dia

Veja como foi o dia:

v0.2.34 — Corrigido o bug da colagem obsoleta.

v0.2.35 — Primeira reescrita do streaming para Windows. Corrigiu o desvio do cursor, mas ainda tinha falhas.

v0.2.36 — Segunda reescrita do streaming mais a correção do caractere estoniano. Tudo suave.

Todas as três versões são assinadas e distribuídas pelo nosso pipeline normal de lançamentos. Atualize para a versão mais recente e estará tudo lá.

O Que Isso Significa Para Você

Se você dita em estoniano, finlandês ou qualquer idioma com caracteres especiais — agora funciona. Sem mais letras faltando.

Se você usa Superscribe no Windows e gosta de ditar no meio de um texto já existente — agora funciona. A posição do seu cursor é respeitada.

Se você só quer uma digitação por voz suave e limpa no seu desktop — é isso que você recebe.

Superscribe é um aplicativo de voz para texto com rastreamento automático de tempo para Mac e Windows. Pressione um atalho de teclado, fale, e suas palavras aparecem instantaneamente em qualquer campo de entrada. O tempo é registrado automaticamente enquanto você dita — sem timers, sem planilhas, sem esquecer no que você trabalhou.

E se algo mais quebrou — nos conte. Vamos enviar a correção antes de você terminar de escrever o relatório de erro. Falando, obviamente.

Quer que isso pareça mais fácil na prática?

Experimente o Superscribe na sua próxima tarefa real

Use para acompanhamentos, notas, e-mails e trabalho com clientes, depois decida se se encaixa no seu fluxo.

Experimente o Superscribe
← Voltar ao Blog