修复爱沙尼亚语语音转录和 Windows 流媒体

修复爱沙尼亚语语音转录和 Windows 流媒体

昨天我们发布了智能转录功能。今天我们花了一整天修复它带来的问题。

三次发布。三个错误,所有问题都归结于同一个事实:构建一个实时 语音转文字 应用比看起来要难。

爱沙尼亚语单词消失了

一位使用爱沙尼亚语口述的用户发现了问题。单词“jää”(冰)显示成了“j ”。单词“töötab”(工作)变成了“t tab”。“Hääldada”(发音)变成了“h ldada”。

字母在单词中间消失了。

我们花了一些时间才找到原因。填充词过滤器——我们昨天发布的功能,用来剔除“um”、“uh”和“hmm”等填充词, AI口述 ——包含了常见的爱沙尼亚语犹豫音。这些声音也恰好出现在正常的爱沙尼亚语单词中。

过滤器无法区分独立的填充词和真实单词中的相同字母组合,所以它把它们都删掉了。

所有包含这些字母组合的爱沙尼亚语单词都被破坏了。

解决方法:完全移除快速过滤器中有问题的条目。智能 AI转录 层仍然可以通过上下文捕捉爱沙尼亚语的填充词。快速过滤器无法安全处理它们。

爱沙尼亚语、芬兰语以及所有包含非英语字母的语言现在都能正确转录。Superscribe支持99种语言的口述——现在所有语言都能正常工作。

Windows流式传输定位错误

第二个错误是针对我们的 Windows口述应用。你把光标放在段落中间,开始口述。新词却出现在文档末尾。

在我们的 Mac口述应用中,光标位置正常工作。系统原生支持。Windows不会自动处理这个问题。

我们最初的方法在简单情况下效果不错。但当你开始实时流式传输 语音文本 ——说话时文字实时出现——情况就变得复杂了。文本需要准确地出现在光标所在位置,随着你继续说话平滑更新,并且正确处理每种语言和字符。

我们在一天内重写了两次流式传输引擎,才做到正确。

第一次尝试修复了光标漂移问题,但特殊字符和视觉闪烁仍然存在。第二次尝试采用了完全不同的方法:不再逐个插入字符,而是一次性更新全部文本。没有闪烁,没有字符损坏,没有光标跳动。

虽然花了一些功夫让它流畅,但结果值得。 Windows上的语音转文本 现在感觉就是应该有的样子——你说出的话会立即出现在光标所在位置。

陈旧粘贴错误

还有第三个较小的错误。如果你录制了转录内容,然后开始新录制但取消了,粘贴时会插入旧的转录内容,而不是空白。

简单修复,但这种问题只有当有人以不同于你预期的方式使用 语音转文本 应用时才会发现。

一天内的三个版本

当天的进展如下:

v0.2.34 ——修复了陈旧粘贴错误。

v0.2.35 ——Windows流式传输首次重写。修复了光标漂移,但仍有瑕疵。

v0.2.36 ——第二次流式传输重写,加上爱沙尼亚字符修复。一切流畅。

这三个版本都经过签名并通过我们正常的发布流程发布。更新到最新版本即可体验全部改进。

这对你意味着什么

如果你用爱沙尼亚语、芬兰语或任何带特殊字符的语言进行语音输入——现在可以正常使用了。不再缺字。

如果你在 Windows 上使用 Superscribe,并且喜欢在已有文本中间进行语音输入——现在可以了。光标位置会被准确识别。

如果你只想要流畅、干净的 语音输入 在你的桌面上——这就是你得到的。

Superscribe 是一款 带有自动时间追踪功能的语音转文字应用 适用于 Mac 和 Windows。按下快捷键,说话,你的文字会立即出现在任何输入框中。时间会在你说话时自动记录——无需计时器,无需电子表格,也不用担心忘记自己做了什么。

如果还有其他问题—— 告诉我们。我们会在你写完错误报告之前修复问题。显然,是通过说话来反馈的。

想让实际操作更轻松?

在你的下一个真实任务中试试Superscribe

用它来处理跟进、笔记、邮件和客户工作,然后决定它是否适合你的工作流程。

试试 Superscribe
← 返回博客