Superscribe की एक सप्ताह की शिपिंग: 18 से 25 फरवरी
सात दिन। तीन रिलीज़। छह ब्लॉग पोस्ट। एक Google Ads अभियान जिसने बिना बताए 19 देशों को चुपके से जोड़ दिया।
यह है इस सप्ताह Superscribe बनाने में वास्तव में क्या हुआ।
स्मार्ट ट्रांसक्रिप्शन: सबसे बड़ा फीचर
मुख्य फीचर था स्मार्ट ट्रांसक्रिप्शन, और इसने स्टैक की हर परत को छुआ।
विचार सरल है: जब आप बोलना बंद करते हैं, तो Superscribe आपकी कही बात को साफ करता है। भराव शब्द हटाता है। आउटपुट को आपकी जरूरत के अनुसार किसी भी संरचना में फॉर्मेट करता है। ईमेल, मीटिंग नोट्स, कोड कमेंट्स, इनवॉइस लाइन आइटम।
इसे लागू करना सरल नहीं था।
हमने दो-स्तरीय भराव शब्द प्रणाली बनाई। पहली परत एक तेज़ regex पास है जो पांच भाषाओं में सामान्य भराव शब्दों को हटाता है: अंग्रेज़ी, एस्टोनियाई, जर्मन, स्पेनिश, और फ्रेंच। कोई API कॉल नहीं, कोई विलंब नहीं। बस पैटर्न मैचिंग।
दूसरी परत ट्रांसक्रिप्ट को GPT-4o-mini के माध्यम से बुद्धिमान फ़िल्टरिंग के लिए भेजती है, जिसमें 4 सेकंड का टाइमआउट होता है। हमने पहले Gemini 2.5 Flash आज़माया था लेकिन उत्पादन में बार-बार टाइमआउट होने के कारण वापस लौट आए।
फ़िल्टरिंग के ऊपर अब एक टेम्पलेट सिस्टम है। बोलना शुरू करने से पहले एक टेम्पलेट चुनें। जब आप रुकते हैं, तो कच्चा ट्रांसक्रिप्ट संरचित आउटपुट में बदल जाता है। मीटिंग नोट्स बुलेट पॉइंट्स और एक्शन आइटम के रूप में निकलते हैं। ईमेल भेजने के लिए तैयार होते हैं।
एक सूक्ष्म विवरण जो जितना लगता है उससे ज्यादा मायने रखता है: 750-मिलीसेकंड का स्टॉप बफ़र। जब आप हॉटकी छोड़ते हैं, तो माइक्रोफोन अगले 750ms तक खुला रहता है। यह उन अंतिम शब्दों को कैप्चर करता है जो लोग स्वाभाविक रूप से बोलते हैं जब वे कीबोर्ड की ओर बढ़ते हैं। इसके बिना, आखिरी एक या दो शब्द हर बार कट जाते।
यह v0.2.29 के रूप में 24 फरवरी को macOS और Windows दोनों पर जारी किया गया।
Windows समानता हुई वास्तविक
Superscribe को macOS और Windows पर समान रूप से काम करवाना एक ऐसा मुद्दा है जो आसान लगता है लेकिन बिल्कुल भी आसान नहीं है।
v0.2.32 रिलीज़ ने Windows-विशिष्ट बग्स की एक श्रृंखला को ठीक किया:
फिलर फ़िल्टरिंग चुपचाप टूट गई थी क्योंकि GraphQL स्कीमा में UserSettings पर एक ID फ़ील्ड गायब था। Apollo कैश अपडेट्स को डेटा को सही तरीके से मर्ज करने के लिए एक स्थिर ID की जरूरत होती है। इसके बिना, म्यूटेशन सर्वर पर सफल होता था लेकिन लोकल कैश कभी अपडेट नहीं होता था। टॉगल काम करता हुआ दिखता था, लेकिन सेटिंग कभी स्थायी नहीं होती थी।
टेम्पलेट्स में भी इसी तरह की समस्या थी। जब कोई टेम्पलेट चुना नहीं गया था, तो ऐप null की बजाय “none” स्ट्रिंग भेज रहा था। बैकएंड “none” को एक वैध टेम्पलेट ID मानता था, उसे खोजने की कोशिश करता था, असफल होता था, और बिना कोई फॉर्मेट किए हुए टेक्स्ट चुपचाप वापस कर देता था।
सबसे दिलचस्प फिक्स था नॉन-एक्टिवेटिंग विंडो। macOS पर, ऐसे विंडो के लिए एक साफ AppKit API है जो क्लिक स्वीकार करते हैं बिना अन्य ऐप्स से फोकस चुराए। Windows पर, आपको Win32 इंटरऑप की जरूरत होती है। हमने P/Invoke का उपयोग करके user32.dll को कॉल किया और एक्सटेंडेड विंडो स्टाइल्स पर WS_EX_NOACTIVATE और WS_EX_TOOLWINDOW सेट किया। इसका मतलब है कि Superscribe आपके एडिटर के ऊपर फ्लोट कर सकता है, स्ट्रीमिंग टेक्स्ट दिखा सकता है, और कभी भी आपका कर्सर पोजीशन नहीं चुराएगा।
फिर v0.2.33 ने एक सूक्ष्म बग को ठीक किया जहां परिवेशीय माइक्रोफोन शोर टेम्पलेट प्रोसेसर को ट्रिगर कर सकता था। अगर आपने रिकॉर्डिंग शुरू की, टेम्पलेट चुना, फिर बिना बोले रिकॉर्डिंग बंद कर दी, तो फॉर्मेटर संरचित आउटपुट के लिए हमेशा इंतजार करता रहता था जो कभी नहीं आता था। फिक्स एक लाइन था: अंतिम टेक्स्ट से व्हाइटस्पेस ट्रिम करें और फिर जांचें कि वह खाली है या नहीं।
Google Ads: 145 आश्चर्यजनक सिफारिशें
हमने Google Ads अभियान की समीक्षा की और कुछ चिंताजनक पाया। 16 से 22 फरवरी के बीच, Google ने हमारे अभियान पर 145 सिफारिशें स्वचालित रूप से लागू कर दीं। इसमें बिना किसी मानव अनुमोदन के हमारे टारगेटिंग को 4 देशों से बढ़ाकर 23 देशों तक कर दिया गया।
अच्छी खबर: उन ऑटो-एक्सपैंशन्स में से कुछ वास्तव में काम कर गए। अभियान अब 27 देशों तक पहुंचता है और कुल आंकड़े मजबूत हैं। 12,214 इंप्रेशन, 1,476 क्लिक, 12% क्लिक-थ्रू रेट, औसत CPA 8.10 यूरो पर 75 कन्वर्ज़न।
दिलचस्प खोज भौगोलिक प्रदर्शन थी। बाल्टिक और दक्षिणी यूरोपीय देश अंग्रेज़ी भाषी बाजारों की तुलना में काफी बेहतर प्रदर्शन करते हैं। लातविया प्रति अधिग्रहण 2.91 यूरो पर कन्वर्ट करता है। संयुक्त राज्य अमेरिका की लागत 16.03 यूरो है। हमने डेटा के आधार पर UAE, न्यूज़ीलैंड, हांगकांग और नॉर्वे को जोड़ा।
हमने भविष्य की सिफारिशों के लिए ऑटो-अप्लाई भी अक्षम कर दिया। भरोसा करें लेकिन सत्यापित करें तब काम नहीं करता जब Google आपका पैसा खर्च कर रहा हो।
डेमो मोड: साइन इन करने से पहले आज़माएं
हमने एक डेमो मोड डिज़ाइन किया और आंशिक रूप से बनाया है जो लोगों को बिना खाता बनाए Superscribe आज़माने देता है। बैकएंड पूरा है: प्रत्येक डिवाइस के लिए 5 मिनट का मुफ्त ट्रांसक्रिप्शन, जिसे UUID इंस्टॉल ID द्वारा पहचाना जाता है, और दुरुपयोग रोकने के लिए IP रेट लिमिटिंग।
macOS क्लाइंट का काम डिज़ाइन किया गया है लेकिन अभी तक जारी नहीं किया गया है। जब यह लाइव होगा, नए उपयोगकर्ता कीबोर्ड शॉर्टकट दबाकर ऐप इंस्टॉल करने के 30 सेकंड के भीतर डिक्टेट करना शुरू कर सकेंगे। कोई ईमेल, कोई पासवर्ड, कोई बाधा नहीं।
इन्फ्रास्ट्रक्चर बनाएं
छोटे सुधार जो समय के साथ बढ़ते हैं। Windows बिल्ड स्क्रिप्ट अब VM को सिंक करने से पहले गायब डायरेक्टरी बनाती है। इंस्टॉलर संस्करण संख्या हार्डकोडेड स्ट्रिंग्स के बजाय डायनामिकली पढ़ता है। एक नया –build-only फ्लैग विकास के दौरान S3 अपलोड को छोड़ देता है। SSH आउटपुट कट जाने पर Windows VM पर एक स्टैंडअलोन साइनिंग स्क्रिप्ट रहती है।
हर रिलीज़ एक ही पाइपलाइन से गुजरती है: बिल्ड, साइन (Mac पर Apple नोटराइजेशन, Windows पर Azure Trusted Signing), संस्करणित और नवीनतम पथों के साथ S3 पर अपलोड, API तैनात करें, git पर पुश करें।
छह ब्लॉग पोस्ट
हमने एक-प्रति-दिन ड्रिप शेड्यूल पर छह ब्लॉग पोस्ट प्रकाशित किए। SuperWhisper के खिलाफ एक SEO तुलना लेख। डिक्टेशन वर्कफ़्लोज़ और टाइम ट्रैकिंग पर तीन लेख। एक “वॉइस मेमो ग्रेवयार्ड” लेख कि क्यों वॉइस नोट्स आपके फोन में मर जाते हैं। और एक मेटा लेख प्रॉम्प्टिंग बॉटलनेक के बारे में।
प्रत्येक पोस्ट को एक अनूठी जनरेट की गई छवि मिली और हमने एक तारीख हैंडलिंग बग ठीक किया जो भविष्य की तारीख वाले पोस्ट को उनके निर्धारित समय से पहले दिखा रहा था।
संख्या
सप्ताह के अंत तक:
- 3 रिलीज़ जारी (v0.2.29, v0.2.32, v0.2.33)
- 6 ब्लॉग पोस्ट प्रकाशित
- कुल 39 डायरेक्टरी सबमिशन
- Google Ads में 27 देशों को लक्षित किया गया
- 75 रूपांतरण 8.10 यूरो CPA पर
- दोनों प्लेटफॉर्म पर Smart Transcription लाइव
- डेमो मोड बैकएंड पूरा
अगले सप्ताह: macOS डेमो मोड क्लाइंट जारी करना, और ब्लॉग सामग्री बढ़ाना, और डायरेक्टरी सबमिशन अभियान जारी रखना।
अगर आप असली काम में इसका अनुभव देखना चाहते हैं, तो कोशिश करें Superscribe.
संबंधित पढ़ाई
क्या आप चाहते हैं कि यह व्यवहार में आसान लगे?
अपने अगले असली कार्य पर Superscribe आज़माएं
इसे फॉलो-अप, नोट्स, ईमेल, और क्लाइंट काम के लिए इस्तेमाल करें, फिर तय करें कि यह आपके वर्कफ़्लो में फिट बैठता है या नहीं।
Superscribe आज़माएं