电子邮件语音转文字:少打字,多发送
如果电子邮件是你日常工作的重要部分,你可能已经注意到一些不便。
你在开始打字前就知道自己想说什么。话语已经成形,思路清晰。但写一封中等长度的回复,格式化并发送,仍然需要两三分钟。然后你还得重复这个过程。到了下午中段,你的高效工作时间已经被这项大脑几秒钟就能解决的任务占用了不少。
打字不是瓶颈,大脑才是。语音输入能打破这个瓶颈。
电子邮件的语音转文字并不新鲜。对于发送大量邮件的人来说,这是最快的实用工作流程改进之一。
打字邮件的真正成本
大多数专业人士在典型工作日会发送20到60封邮件。低端计算,每封邮件两分钟,就是40分钟。高端则超过两个小时。
不舒服的是,大部分时间都在机械操作。你的大脑早已完成思考,手指却还没跟上。你打字时并没有思考,只是在转录已经完成的想法。
思考速度与打字速度之间的差距,就是语音输入节省时间的地方。
说话速度每分钟130到150字,打字速度每分钟60到80字,差距明显。一个200字的回复,打字需要三分钟,说话只需约90秒。大量邮件时,这种差异会迅速累积。
电子邮件语音转文字的实际体验
值得使用的版本不会让你停止当前操作。
你在Gmail、Outlook、HEY、Fastmail或任何你用的客户端里。光标在回复框内。你按住快捷键,说出回复,文字就会实时出现在回复框里。无需切换应用,无需从转录文本复制,无需粘贴步骤。
文本会实时出现在光标所在的位置,随着你的讲话同步显示。
这是大多数人在首次尝试语音输入时忽略的关键细节。语音工具分为两类:
先录音再粘贴的工具。 你在应用界面中讲话,应用处理你的音频,然后粘贴结果。虽然延迟通常很短,但模型是先停止再输出。文本会在你说完后作为一个整体出现。
实时流式输入到你当前活动字段的工具。 转录会在你讲话时进行。单词一个接一个、字符一个接一个地出现在你的回复框中,随着识别实时显示。你可以在邮件正文内实时看到你的语音变成文字。
第二种方式从根本上改变了邮件语音输入的体验。你不是对着空白等待,而是看到文字准确地出现在它们应该出现的位置,随着你的发声同步生成。
Superscribe 就是这样工作的。你按住 Option+Space,直接在邮件输入框中说出回复,文本会在你松开按键前就已经出现。无需中转,也不用担心文字会跑到哪里去。
实时语音转写到任何输入框 解释了为什么这个技术细节比听起来更重要。
哪些邮件客户端支持语音输入
实际情况取决于你的语音输入工具在底层是如何工作的。
先录音再粘贴的工具几乎适用于任何文本字段,因为它们只是触发了标准的粘贴事件。但实时流式工具只有在底层转录引擎能实时向聚焦字段注入按键时才有效,而大多数桌面平台对此支持良好。
在 Mac 和 Windows 上,实时语音输入到任何聚焦的文本字段是 Superscribe 等应用的标准功能。这意味着在 Chrome 中的 Gmail、Outlook 桌面版、Apple Mail、Spark、HEY、Superhuman、Missive、浏览器中的 Fastmail、Notion 邮件块,任何有光标的地方都可以使用。
你不需要为每个应用专门集成。语音输入工具不需要知道你正在使用邮件。它只需要知道光标的位置,文本就会出现在那里。
优势:客户邮件和可计费时间
对于自由职业者和顾问来说,邮件不仅仅是沟通工具。它还是文档记录。
客户通话后的实时输出。范围澄清。项目整理。礼貌而坚定的界限设定信息。这些邮件非常重要。它们确立了达成的协议、交付内容和下一步计划的记录。
这些邮件往往也是写起来最费时的。因为内容重要,你会反复斟酌。你会重写开头,反复考虑语气。结果你花了 15 分钟写的邮件,读起来和你如果直接打电话用 60 秒说出的内容差不多。
语音转文本消除了起草的阻力。当你用语音写邮件时,产出的内容更接近你自然的说话方式。语气通常更简洁,句子更短。你停止过度思考,开始真正沟通。
Superscribe 自带的自动时间跟踪功能也意味着你刚刚用语音输入的 12 分钟客户整理时间会自动记录到正确的项目中。你工作了,有记录,无需额外计时器。
如何无需计时器自动跟踪计费时间 深入探讨了这对按小时计费的顾问为何重要。
常见异议,诚实回答
“语音输入的邮件听起来不够专业。”
它们听起来不同于那些经过五分钟反复斟酌每个词写成的邮件。是否显得不够专业,完全取决于你现在的邮件听起来是什么样子。
实际上,大多数口述的邮件比打字的更直接、更温暖。那种让邮件显得机械的过度修饰的企业语气,往往来自反复修改。口述的初稿通常更好。
“我会犯太多错误。”
现代的口述准确率,使用基于 Whisper 的模型,已经足够高,通常每封邮件只需修改一两个词,而不是常态。前几天之后,你会犯的错误比预期的少。
更重要的是:你不会在第一天就用口述替代所有邮件的打字。你从简单的开始。你已经知道怎么写的回复。简短的更新。确认邮件。然后逐步扩大使用范围。
“我在开放式办公室工作。”
这是实际的限制,值得坦诚面对。开放式办公室让任何语音工作都很尴尬。如果你和别人共用一个房间,口述不适合涉及敏感内容的邮件。
但同一个办公室让你在打电话时尴尬,也会让你口述时尴尬。如果你能在办公桌上接电话,可能也能口述邮件。如果不能,这个限制早于口述工具的出现。
什么时候语音转文字邮件不合适
有些邮件不适合口述:
- 需要谨慎法律措辞或正式文件的邮件
- 需要每个词都慎重选择的高度敏感信息
- 简短的两字回复,打字比用快捷键更快
- 需要大量格式、表格或嵌入链接且需要查找的内容
语音转文字最适合用于你已经知道要说什么、瓶颈在于输入速度的邮件。如果瓶颈实际上是决定说什么,语音输入并不能帮忙。
让它工作的设置
尝试此方法的最快方式:
- 在此安装 Superscribe superscribe.io
- 打开你的邮件客户端,点击回复框
- 按住 Option+Space(Mac)或 Windows 上的对应快捷键
- 说出回复内容
- 松开按键,检查,发送
第一封邮件会感觉有点不自然。第三封会觉得正常。到第十封时,你会不明白为什么以前要打中等长度的邮件。
如果你想自动添加句号和逗号,可以在设置中调整标点规则,或者关闭自动标点,手动编辑。两种方式都有效。大多数人在几天后会选择轻度标点模式。
这实际上改变了什么
语音转文字用于邮件的理由不是它有多聪明或有趣,而是时间上的优势明显且启动门槛低。
你现在可能每天花一个小时或更长时间处理邮件。这段时间主要耗费在机械输入上,而不是思考。语音转文字能将这部分时间成本减半,同时不影响写作质量。
邮件发送更快。实时输出在你忘记上下文之前就发出。今天下午的客户整理工作今天完成,而不是等到明天早上细节模糊时。
这不是生产力技巧,只是去除了一个一直存在的瓶颈。
按住一个键,说出你的意思,让它准确落到正确的位置。
相关阅读
常见问题
你能在 Gmail 中使用语音转文字吗? 可以。使用像 Superscribe 这样的实时语音输入工具,你只需点击 Gmail 的撰写或回复框,按住快捷键,说话。文字会实时流入邮件正文,无需复制粘贴步骤。
Mac上最好的邮件语音输入应用是什么? Superscribe是Mac用户进行实时语音输入到任何邮件客户端的最佳选择。它能将文本直接流式输入到当前聚焦的任何字段,支持Chrome中的Gmail、Outlook、Apple Mail及其他客户端,并且包含自动语音输入时长追踪功能。
语音转文字在Outlook中能用吗? 可以。Superscribe支持Outlook桌面版和网页版,因为它通过系统键盘输入直接输入到聚焦的文本字段,无需特殊的Outlook集成。
邮件语音输入的准确度如何? 基于现代Whisper的转录技术,准确度足够高,大多数邮件最多只需修改一两个词。专有名词和不常见的名字是最常见的错误类型。对于标准商务邮件语言,准确率通常超过95%。
语音输入的邮件会显得不专业吗? 实际上不会。语音输入的邮件语气通常比经过大量编辑的打字邮件更直接、更自然。主要的质量差异在于语音输入鼓励使用更短的句子和更清晰的表达。是否显得不专业取决于你当前的写作风格。