एस्टोनियाई डिक्टेशन और Windows स्ट्रीमिंग ठीक करना

एस्टोनियाई डिक्टेशन और Windows स्ट्रीमिंग ठीक करना

कल हमने Smart Transcription जारी किया। आज हमने पूरा दिन उन चीज़ों को ठीक करने में बिताया जो उसने तोड़ी थीं।

तीन रिलीज़। तीन बग जो सभी एक ही सचाई से जुड़े हैं: एक रियल-टाइम वॉइस टू टेक्स्ट ऐप बनाना जितना आसान दिखता है उससे कहीं ज्यादा मुश्किल है।

एस्टोनियाई शब्द गायब हो रहे थे

एक उपयोगकर्ता जो एस्टोनियाई में बोल रहा था, ने कुछ गलत देखा। शब्द “jää” (बर्फ) “j “ के रूप में दिख रहा था। शब्द “töötab” (काम करता है) “t tab” बन गया। “Hääldada” (उच्चारण) “h ldada” में बदल गया।

शब्द के बीच में अक्षर गायब हो रहे थे।

हमें इसे खोजने में कुछ समय लगा। फीलर शब्द फ़िल्टर — वह फीचर जो हमने कल जारी किया था ताकि “um”, “uh” और “hmm” को आपकी एआई डिक्टेशन से हटा सके — में सामान्य एस्टोनियाई हिचकिचाहट की आवाज़ों के लिए एंट्री थीं। ऐसी आवाज़ें जो सामान्य एस्टोनियाई शब्दों के अंदर भी आती हैं।

फ़िल्टर यह नहीं समझ पाया कि एक स्वतंत्र फीलर और वही अक्षर असली शब्द के अंदर हैं। इसलिए उसने उन्हें हटा दिया।

हर एस्टोनियाई शब्द जिसमें ये अक्षर संयोजन थे, बिगड़ रहा था।

समाधान: फास्ट फ़िल्टर से समस्या वाले एंट्री पूरी तरह हटा देना। स्मार्ट एआई ट्रांसक्रिप्शन लेयर अभी भी संदर्भ के आधार पर एस्टोनियाई फीलर्स पकड़ सकता है। फास्ट फ़िल्टर उन्हें सुरक्षित रूप से संभाल नहीं सकता।

एस्टोनियाई, फिनिश, और हर दूसरी भाषा जिसमें अंग्रेज़ी वर्णमाला के बाहर के अक्षर हैं, अब सही तरीके से ट्रांसक्राइब होती है। Superscribe 99 भाषाओं में डिक्टेशन सपोर्ट करता है — और अब वे सभी वैसे ही काम करते हैं जैसे उन्हें करना चाहिए।

Windows स्ट्रीमिंग गलत जगह पर जा रही थी

दूसरा बग हमारे Windows के लिए डिक्टेशन ऐपसे जुड़ा था। आप पैराग्राफ के बीच में कर्सर रखते हैं। आप डिक्टेट करना शुरू करते हैं। नए शब्द — दस्तावेज़ के अंत में दिखाई देते हैं।

Mac के लिए हमारे डिक्टेशन ऐप मेंकर्सर की स्थिति सही काम करती है। सिस्टम इसे मूल रूप से संभालता है। Windows यह सुविधा मुफ्त में नहीं देता।

हमारा मूल तरीका सरल मामलों के लिए ठीक काम करता था। लेकिन जब आप स्ट्रीमिंग शुरू करते हैं वॉइस टेक्स्ट रियल टाइम में — जैसे ही आप बोलते हैं शब्द दिखाई देते हैं — चीजें जल्दी जटिल हो जाती हैं। टेक्स्ट को बिल्कुल उसी जगह आना चाहिए जहाँ आपका कर्सर है, जैसे-जैसे आप बोलते रहें वह स्मूदली अपडेट होना चाहिए, और हर भाषा और अक्षर को सही तरीके से संभालना चाहिए।

हमने इसे सही करने के लिए एक ही दिन में स्ट्रीमिंग इंजन को दो बार फिर से लिखा।

पहली कोशिश में कर्सर ड्रिफ्ट ठीक हो गया लेकिन अभी भी स्पेशल कैरेक्टर्स और विजुअल फ्लिकरिंग की समस्या थी। दूसरी कोशिश में पूरी तरह अलग तरीका अपनाया: अक्षरों को एक-एक करके डालने के बजाय, अब हम टेक्स्ट को एक साथ अपडेट करते हैं। कोई फ्लिकर नहीं। कोई अक्षर खराबी नहीं। कर्सर इधर-उधर नहीं कूदता।

इसे स्मूद बनाने में कुछ मेहनत लगी, लेकिन परिणाम इसके लायक है। Windows पर वॉइस टू टेक्स्ट अब वैसा ही महसूस होता है जैसा होना चाहिए — शब्द वहीं दिखाई देते हैं जहाँ आपका कर्सर होता है, जैसे ही आप उन्हें कहते हैं।

द स्टेल पेस्ट बग

एक तीसरी, छोटी बग भी थी। अगर आपने ट्रांसक्रिप्शन रिकॉर्ड किया, फिर नई रिकॉर्डिंग शुरू की और उसे कैंसिल कर दिया, तो पेस्ट करने पर पुराना ट्रांसक्रिप्शन आ जाता था, खाली कुछ नहीं।

सरल फिक्स, लेकिन ऐसी चीज जो तब ही पकड़ में आती है जब कोई स्पीच टू टेक्स्ट ऐप को आपकी उम्मीद से अलग तरीके से इस्तेमाल करता है।

एक ही दिन में तीन वर्जन

दिन कुछ इस तरह बीता:

v0.2.34 — स्टेल पेस्ट बग ठीक किया।

v0.2.35 — Windows के लिए पहली स्ट्रीमिंग री-राइट। कर्सर ड्रिफ्ट ठीक किया लेकिन अभी भी कुछ खामियां थीं।

v0.2.36 — दूसरी स्ट्रीमिंग री-राइट और एस्टोनियन कैरेक्टर फिक्स। सब कुछ स्मूद।

तीनों वर्जन हमारे सामान्य रिलीज पाइपलाइन के जरिए साइन और शिप किए गए हैं। लेटेस्ट वर्जन पर अपडेट करें, सब कुछ वहीं मिलेगा।

इसका आपके लिए मतलब

अगर आप एस्टोनियन, फिनिश या किसी भी भाषा में बोलते हैं जिसमें स्पेशल कैरेक्टर्स होते हैं — अब यह काम करता है। कोई अक्षर मिस नहीं होंगे।

यदि आप Windows पर Superscribe का उपयोग करते हैं और मौजूदा टेक्स्ट के बीच में डिक्टेट करना पसंद करते हैं — तो अब यह काम करता है। आपका कर्सर स्थान सम्मानित किया जाता है।

यदि आप बस चिकनी, साफ वॉइस टाइपिंग अपने डेस्कटॉप पर चाहते हैं — तो वही आपको मिलता है।

Superscribe एक वॉइस टू टेक्स्ट ऐप है जिसमें स्वचालित समय ट्रैकिंग है Mac और Windows के लिए। एक कीबोर्ड शॉर्टकट दबाएं, बोलें, और आपके शब्द तुरंत किसी भी इनपुट फील्ड में दिखाई देते हैं। आप डिक्टेट करते हुए समय अपने आप ट्रैक होता है — कोई टाइमर, कोई स्प्रेडशीट, कोई यह भूलना कि आपने क्या काम किया।

और अगर कुछ और टूट गया — हमें बताएं। हम बग रिपोर्ट लिखना खत्म करने से पहले ही फिक्स भेज देंगे। जाहिर है, बोलकर।

क्या आप चाहते हैं कि यह व्यवहार में आसान लगे?

अपने अगले असली कार्य पर Superscribe आज़माएं

इसे फॉलो-अप, नोट्स, ईमेल, और क्लाइंट काम के लिए इस्तेमाल करें, फिर तय करें कि यह आपके वर्कफ़्लो में फिट बैठता है या नहीं।

Superscribe आज़माएं
← ब्लॉग पर वापस