Superscribeの1週間のリリース:2月18日から25日まで
7日間。3つのリリース。6つのブログ投稿。私たちに知らせずに19か国をこっそり追加した1つのGoogle広告キャンペーン。
今週Superscribeを開発していて実際に起こったことをお伝えします。
スマートトランスクリプション:大きな進歩
注目の機能はスマートトランスクリプションで、スタックのあらゆる層に影響を与えました。
アイデアはシンプルです:話すのをやめると、Superscribeが発言内容を整理します。フィラー(つなぎ言葉)を除去し、必要な形式に出力を整えます。メール、会議メモ、コードコメント、請求書の明細など。
実装は簡単ではありませんでした。
2段階のフィラー除去システムを構築しました。第1段階は高速な正規表現による処理で、英語、エストニア語、ドイツ語、スペイン語、フランス語の5言語の一般的なフィラーを除去します。API呼び出しなし、遅延なし。ただのパターンマッチングです。
第2段階はGPT-4o-miniを使ったインテリジェントなフィルタリングで、4秒のタイムアウトがあります。最初はGemini 2.5 Flashを試しましたが、本番環境でタイムアウトが続いたため戻しました。
フィルタリングに加えて、テンプレートシステムも導入しました。話し始める前にテンプレートを選択します。話し終えると、生のトランスクリプトが構造化された出力に変換されます。会議メモは箇条書きとアクションアイテム付きで、メールは送信準備完了の状態で出力されます。
重要だけど見落とされがちな細かい点:750ミリ秒の停止バッファです。ホットキーを離してもマイクはさらに750ms開いたままになります。これにより、キーボードに手を伸ばす間に自然に話される最後の言葉をキャプチャします。これがないと、最後の1〜2語が毎回切れてしまいます。
これは2026年2月24日にv0.2.29としてmacOSとWindowsでリリースされました。
Windowsとの機能差が現実に
SuperscribeをmacOSとWindowsで同じように動作させるのは、一見簡単そうに見えて実際は全く簡単ではない問題の一つです。
v0.2.32リリースではWindows特有のバグの連鎖を修正しました:
フィラーのフィルタリングは、UserSettingsのGraphQLスキーマにIDフィールドが欠けていたため、静かに壊れていました。Apolloのキャッシュ更新には、データを正しくマージするための安定したIDが必要です。これがないと、ミューテーションはサーバー上で成功しても、ローカルキャッシュは更新されません。トグルは動作しているように見えましたが、設定は反映されませんでした。
テンプレートにも同様の問題がありました。テンプレートが選択されていない場合、アプリはnullの代わりに文字列「none」を送信していました。バックエンドは「none」を有効なテンプレートIDとして扱い、検索を試みて失敗し、無言で未フォーマットのテキストを返していました。
最も興味深い修正は、非アクティブウィンドウの問題でした。macOSでは、他のアプリのフォーカスを奪わずにクリックを受け付けるウィンドウ用のクリーンなAppKit APIがあります。WindowsではWin32の相互運用が必要です。user32.dllを呼び出すためにP/Invokeを使い、拡張ウィンドウスタイルにWS_EX_NOACTIVATEとWS_EX_TOOLWINDOWを設定しました。これにより、Superscribeはエディタの上に浮かび、ストリーミングテキストを表示しつつ、カーソル位置を奪うことがありません。
次にv0.2.33で、環境マイクノイズがテンプレートプロセッサを誤って起動させる微妙なバグを修正しました。録音を開始し、テンプレートを選択してから実際に話さずに停止すると、フォーマッターは構造化された出力を永遠に待ち続けてしまいました。修正は単純で、最終テキストの空白をトリムしてから空かどうかをチェックする一行を追加しただけです。
Google広告:145の驚きの推奨事項
Google広告キャンペーンを見直したところ、驚くべきことが判明しました。2月16日から22日の間に、Googleが自動的に145件の推奨事項をキャンペーンに適用していました。これには、4か国から23か国へのターゲティング拡大が含まれており、人の承認なしで行われていました。
朗報です:いくつかの自動展開は実際に効果がありました。キャンペーンは現在27か国に届いており、全体の数字も堅調です。12,214回のインプレッション、1,476クリック、クリック率12%、平均CPA8.10ユーロで75件のコンバージョンを獲得しました。
興味深い発見は地理的なパフォーマンスでした。バルト三国や南ヨーロッパの国々は英語圏の市場を大きく上回っています。ラトビアの獲得単価は2.91ユーロです。アメリカは16.03ユーロかかっています。データに基づきUAE、ニュージーランド、香港、ノルウェーを追加しました。
また、将来の推奨に対して自動適用を無効にしました。Googleがあなたのお金を使うときは「信頼して検証する」は通用しません。
デモモード:サインイン前に試す
Superscribeをアカウント作成なしで試せるデモモードを設計し、一部構築しました。バックエンドは完成しており、UUIDインストールIDで識別されたデバイスごとに5分間の無料文字起こしが可能で、IPレート制限で悪用を防止しています。
macOSクライアントの作業は設計済みですが、まだリリースされていません。リリースされると、新規ユーザーはキーボードショートカットを押して、アプリインストール後30秒以内に音声入力を開始できます。メールもパスワードも不要で、手間がかかりません。
インフラ構築
時間とともに積み重なる小さな改善。Windowsのビルドスクリプトは、VMに同期する前に不足しているディレクトリを作成するようになりました。インストーラーはバージョン番号をハードコードされた文字列ではなく動的に読み取ります。新しい–build-onlyフラグは開発中にS3アップロードをスキップします。SSH出力が切れる場合に備え、Windows VMに独立した署名スクリプトがあります。
すべてのリリースは同じパイプラインを通ります:ビルド、署名(MacはAppleの公証、WindowsはAzure Trusted Signing)、バージョン管理されたパスと最新パスでS3にアップロード、APIをデプロイ、gitにプッシュ。
6つのブログ投稿
1日1本のペースで6本のブログ記事を公開しました。SuperWhisperとのSEO比較記事。音声入力のワークフローと時間追跡に関する3本の記事。スマホ内で音声メモが消えてしまう理由を扱った「ボイスメモの墓場」記事。そしてプロンプトのボトルネックについてのメタ記事です。
各投稿にはユニークな生成画像を付け、未来の日付の投稿が予定より前に表示される日付処理のバグも修正しました。
数字で見る成果
週末までに:
- 3つのリリースを出荷(v0.2.29、v0.2.32、v0.2.33)
- 6本のブログ記事を公開
- 合計39件のディレクトリ登録
- Google広告で27カ国をターゲット
- CPA8.10ユーロで75件のコンバージョン
- 両プラットフォームでSmart Transcriptionが稼働中
- デモモードのバックエンドが完成
来週はmacOSデモモードクライアントの出荷、さらにブログコンテンツの追加、ディレクトリ登録キャンペーンの継続を予定しています。
実際の仕事での感触を知りたいなら、ぜひ試してみてください Superscribe.
関連資料
実際にもっと簡単に感じたいですか?
次の実際のタスクでSuperscribeを試してみてください
フォローアップ、メモ、メール、クライアント作業に使い、ワークフローに合うか判断してください。
Superscribeを試してみてください