शब्दावली
Voice activity detection
वॉइस एक्टिविटी डिटेक्शन (VAD) एक तकनीक है जो ऑडियो स्ट्रीम के उन हिस्सों की पहचान करती है जिनमें भाषण होता है और जो चुप्पी या पृष्ठभूमि के शोर होते हैं।
इसका क्या अर्थ है
VAD एक संकीर्ण प्रश्न का उत्तर देता है: क्या अभी कोई बोल रहा है? यह ऑडियो का लिपि नहीं बनाता या बोलने वाले की पहचान नहीं करता। सॉफ्टवेयर इसका उपयोग चुप्पी के समय को छोड़ने के लिए, प्रसंस्करण शुरू और बंद करने का समय जानने के लिए और लिपि के लिए साफ ऑडियो प्रदान करने के लिए करता है।
लिपि पाइपलाइन में, VAD एक उपयोगी पहला चरण है। लंबी चुप्पी और गैर-भाषण ऑडियो को काटकर पहचान मॉडल चलाने से पहले, यह प्रसंस्करण समय कम कर देता है और पृष्ठभूमि के शोर से अनावश्यक आउटपुट को कम करता है।
यह Autorec से कैसे संबंधित है
Autorec का लिपि चरण आपके कॉल के रिकॉर्ड किए गए ऑडियो पर काम करता है। वास्तव में भाषण कहां होता है यह पहचानने से डिवाइस पर लिपि को कुशल बनाए रखने में मदद मिलती है और कमरे के शोर को लेख में अनावश्यक पाठ में बदलने से रोकता है।
Autorec को आजमाएं
Linux और Windows के लिए एक स्थानीय-प्रथम मीटिंग रिकॉर्डर। यह आपके कॉल का स्वचालित रूप से पता लगाता है, अपनी डिस्क पर रिकॉर्ड करता है, और अपनी मशीन पर स्वयं प्रतिलेखन करता है। एक बार का €20, शुरुआत के लिए एक निःशुल्क टियर के साथ।
Autorec डाउनलोड करें