Superscribe 一周发布记录:2月18日至25日

Superscribe 一周发布记录:2月18日至25日

七天。三次发布。六篇博客文章。一场悄悄增加了19个国家的谷歌广告活动,没告诉我们。

这就是本周构建Superscribe的真实情况。

智能转录:重头戏

头条功能是智能转录,它涉及了整个技术栈的每一层。

想法很简单:当你停止说话时,Superscribe会整理你说的话。去除填充词。将输出格式化成你需要的任何结构。邮件、会议记录、代码注释、发票条目。

实现起来并不简单。

我们构建了一个两级填充词系统。第一级是快速的正则表达式处理,剥离五种语言中的常见填充词:英语、爱沙尼亚语、德语、西班牙语和法语。无API调用,无延迟。只是模式匹配。

第二级通过GPT-4o-mini进行智能过滤,设置了4秒超时。我们最初尝试了Gemini 2.5 Flash,但因生产环境频繁超时而回退。

除了过滤,现在还有模板系统。开始说话前选择一个模板。停止说话时,原始转录会被转换成结构化输出。会议记录以带行动项的项目符号形式呈现。邮件则准备好发送。

一个看似细微但非常重要的细节:750毫秒的停止缓冲。当你松开快捷键时,麦克风会继续开启750毫秒。这能捕捉到人们自然说出的尾随词,正当他们去按键盘时。没有它,最后一两个词每次都会被截断。

该功能于2月24日以v0.2.29版本发布,支持macOS和Windows。

Windows功能实现达标

让Superscribe在macOS和Windows上表现一致是个听起来简单但绝非如此的问题。

v0.2.32 版本修复了一系列 Windows 特有的错误:

填充过滤功能因 GraphQL 模式中缺少 UserSettings 的 ID 字段而默默失效。Apollo 缓存更新需要稳定的 ID 来正确合并数据。没有它,变更会在服务器端成功,但本地缓存永远不会更新。切换按钮看似有效,但设置从未生效。

模板也有类似问题。应用在未选择模板时发送了字符串“none”而非 null。后端将“none”视为有效的模板 ID,尝试查找失败后默默返回未格式化的文本。

最有趣的修复是非激活窗口。在 macOS 上,有一个干净的 AppKit API 允许窗口接受点击但不抢占其他应用的焦点。在 Windows 上,需要使用 Win32 互操作。我们使用 P/Invoke 调用 user32.dll,设置扩展窗口样式 WS_EX_NOACTIVATE 和 WS_EX_TOOLWINDOW。这意味着 Superscribe 可以悬浮在编辑器上,显示流式文本,且永远不会抢占你的光标位置。

随后 v0.2.33 修复了一个微妙的错误:环境麦克风噪音可能触发模板处理器。如果你开始录音,选择模板,然后停止但没有实际说话,格式化器会无限等待永远不会到来的结构化输出。修复方法很简单:在检查文本是否为空之前,先去除最终文本的空白字符。

我们坐下来审查 Google Ads 活动,发现了令人震惊的事情。2 月 16 日至 22 日期间,Google 自动对我们的活动应用了 145 条推荐。这包括未经人工批准,将我们的目标范围从 4 个国家扩大到 23 个国家。

好消息:部分自动扩展确实有效。该活动现在覆盖27个国家,整体数据稳健。12,214次展示,1,476次点击,点击率12%,75次转化,平均每次转化成本为8.10欧元。

有趣的发现是地理表现。波罗的海和南欧国家的表现远超英语市场。拉脱维亚的获客成本为2.91欧元。美国则为16.03欧元。我们基于数据新增了阿联酋、新西兰、香港和挪威。

我们还关闭了未来推荐的自动应用功能。信任但验证在谷歌花你的钱时不起作用。

演示模式:先试用再登录

我们设计并部分开发了一个演示模式,让用户无需创建账户即可试用Superscribe。后端已完成:每台设备免费提供5分钟转录,设备通过UUID安装ID识别,并通过IP速率限制防止滥用。

macOS客户端的工作已设计完成但尚未发布。上线后,新用户安装应用后30秒内即可通过快捷键开始语音输入。无需邮箱,无需密码,无任何阻碍。

构建基础设施

小改进积少成多。Windows构建脚本现在会在同步到虚拟机前创建缺失目录。安装程序动态读取版本号,而非硬编码字符串。新增–build-only标志,开发时跳过S3上传。Windows虚拟机上有独立签名脚本,防止SSH输出被截断。

每次发布都经过相同流程:构建、签名(Mac上苹果公证,Windows上Azure可信签名)、上传到带版本和最新路径的S3、部署API、推送到git。

六篇博客文章

我们发布了六篇博客文章,采用每天一篇的滴灌发布计划。一篇针对 SuperWhisper 的 SEO 对比文章。三篇关于语音转录工作流程和时间跟踪的文章。一篇关于“语音备忘录坟场”的文章,讲述为什么语音笔记会在手机里消失。还有一篇关于提示瓶颈的元文章。

每篇文章都配有独特生成的图片,我们还修复了一个日期处理错误,导致未来日期的文章提前显示。

数据统计

截至本周末:

  • 发布了3个版本(v0.2.29,v0.2.32,v0.2.33)
  • 发布了6篇博客文章
  • 共提交了39个目录
  • 谷歌广告覆盖27个国家
  • 75次转化,CPA为8.10欧元
  • 智能转录已在两个平台上线
  • 演示模式后端完成

下周计划:发布 macOS 演示模式客户端,更多博客内容,继续目录提交活动。

如果你想体验真实工作中的感觉,试试 Superscribe.

想让实际操作更轻松?

在你的下一个真实任务中试试Superscribe

用它来处理跟进、笔记、邮件和客户工作,然后决定它是否适合你的工作流程。

试试 Superscribe
← 返回博客