WellSaid raises $10M to generate synthetic voices

WellSaid raises $10M to generate synthetic voices

Posted on

एआई अपनाने की अवस्था में आपका उद्यम कहां खड़ा है? पता लगाने के लिए हमारे एआई सर्वेक्षण में भाग लें।


सिंथेटिक वॉयस टेक्नोलॉजी विकसित करने वाले स्टार्टअप वेलसाइड लैब्स ने आज घोषणा की कि उसने फ्यूज के नेतृत्व में सीरीज ए राउंड में वोयाजर, क्वालकॉम वेंचर्स और गुडफ्रेंड्स की भागीदारी के साथ $ 10 मिलियन जुटाए हैं। सीईओ मैट हॉकिंग के अनुसार, राउंड, जिसे ओवरसब्सक्राइब किया गया था, कंपनी के आरएंडडी का समर्थन करेगा और अपनी टीम का विकास करेगा।

टेक्स्ट से नेचुरल साउंडिंग स्पीच बनाना AI के क्षेत्र में एक बड़ी चुनौती मानी जाती है और दशकों से एक शोध लक्ष्य रहा है। सामग्री निर्माताओं और उत्पाद डिजाइनरों को मानव वॉयसओवर बनाम टेक्स्ट-टू-स्पीच टूल का उपयोग करते समय गुणवत्ता और मापनीयता के बीच लंबे समय से ट्रेडऑफ़ का सामना करना पड़ा है। लेकिन एआई के साथ, निर्माता, उत्पाद डेवलपर्स, और ब्रांड विभिन्न प्रकार की आवाज शैलियों, लहजे और भाषाओं के साथ बड़े पैमाने पर अनुभवों को शक्ति प्रदान करने की क्षमता रखते हैं। आभासी प्राणी बनाने वाले स्टार्टअप, या एआई द्वारा संचालित कृत्रिम लोगों ने सामूहिक रूप से अब तक उद्यम पूंजी में 320 मिलियन डॉलर से अधिक जुटाए हैं।

वेलसेड को 2018 में एलन इंस्टीट्यूट ऑफ आर्टिफिशियल इंटेलिजेंस में एक शोध परियोजना के रूप में लॉन्च किया गया था, जो कि माइक्रोसॉफ्ट कोफाउंडर पॉल एलन द्वारा शुरू की गई एक प्रयोगशाला है, जो कि प्रमुख एआई अनुसंधान और इंजीनियरिंग के संचालन के मिशन के साथ है। वेलसेड की टीम ने सबसे सजीव सिंथेटिक आवाज बनाने के लिए तैयार किया, जिसमें सीटीओ माइकल पेट्रोचक प्रमुख एआई के निर्माण के लिए आरएंडडी का नेतृत्व कर रहे थे।

हॉकिंग ने ईमेल के माध्यम से वेंचरबीट को बताया, “एक शोध परियोजना के रूप में शुरू हुआ … अब मीडिया और विज्ञापन, प्रौद्योगिकी, विनिर्माण, रक्षा, फार्मास्यूटिकल्स, स्वास्थ्य देखभाल और शिक्षा में हजारों ग्राहकों के साथ एक विकास-चरण स्टार्टअप है।” “व्यवसाय की बुनियादी बातों के संदर्भ में, [due to the pandemic] हमारे मध्य-बाजार और उद्यम ग्राहक [have] त्वरित किया और अपने वॉयसओवर और मीडिया प्रस्तुतियों की एक बड़ी मात्रा को इन-पर्सन से दूरस्थ स्थानों में स्थानांतरित कर दिया। इससे उनकी प्रस्तुतियों में और अधिक चलते हुए टुकड़े और गुणवत्ता के मुद्दे जुड़ गए। ”

एआई-संचालित भाषण

वेलसेड का उपयोग करते हुए, कंपनियां कई प्रकार के वॉयस अवतार चुन सकती हैं और सीधे स्क्रिप्ट से वॉयसओवर बना सकती हैं, जिसमें शैली, लिंग और उत्पादन प्रकार के आधार पर एक या कई आवाजें होती हैं। वे कॉपी में बदलाव कर सकते हैं, रुक सकते हैं या अलग आवाज का इस्तेमाल कर सकते हैं और मंच को अनूठी वर्तनी और उच्चारण के साथ शब्द कहना सिखा सकते हैं। वेलसेड उपयोगकर्ताओं को टीम के सदस्यों के साथ परियोजनाओं और फाइलों को साझा करने के साथ-साथ ब्रांडेड सामग्री के लिए आवाज अवतार बनाने की अनुमति देता है, केवल कुछ घंटों की रिकॉर्डिंग के साथ वास्तविक व्यक्ति की आवाज से अवतार बनाता है।

हॉकिंग के अनुसार, दो वर्षों में, वेलसैड ने अपनी सिंथेटिक आवाजों की स्वाभाविकता में वृद्धि की, जिसका लक्ष्य “मानव समानता” था। जुलाई 2019 के एक अध्ययन में, कंपनी ने प्रतिभागियों से वेलसेड और मानव आवाज अभिनेताओं द्वारा बनाई गई यादृच्छिक रिकॉर्डिंग के एक सेट को सुनने और उन्हें 1 से 5 के पैमाने पर रैंक करने के लिए कहा, जिसमें 5 उच्चतम गुणवत्ता वाला था। आवाज अभिनेताओं ने लगभग 4.5 की औसत रेटिंग हासिल की, जबकि वेलसेड की आवाज ने अपने मानव समकक्षों (4.282) के करीब स्कोर अर्जित किया।

सिएटल, वाशिंगटन स्थित वेलसेड के लिए वर्तमान फोकस, जिसमें 12 कर्मचारी हैं, विभिन्न पाठ लंबाई और शैलियों के साथ-साथ आवाज पीढ़ी को तेज करने के लिए मंच की हैंडलिंग में सुधार कर रहा है। कंपनी ने कहा कि 10 सेकेंड की ऑडियो फाइल बनाने में करीब 4 सेकेंड का समय लगता है।

“उद्यम प्रशिक्षण और कॉर्पोरेट सामग्री के लिए वॉयसओवर बनाने के लिए वेलसाइड स्टूडियो का उपयोग करते हैं। वे उपलब्ध उच्च गुणवत्ता वाली आवाजों और लागत दक्षता हासिल करने के कारण अपने वर्कफ़्लो को अनुकूलित करने के लिए वेलसैड का चयन करते हैं, ”हॉकिंग ने जारी रखा। “उत्पाद डेवलपर्स एकीकृत [our] अपने उपयोगकर्ता अनुभव में आवाज को सक्षम करने के लिए उनके अनुभवों के लिए एपीआई। वे आवाज की गुणवत्ता, बुनियादी ढांचे की मापनीयता और अन्य प्रदाताओं द्वारा बेजोड़ रीयल-टाइम प्रतिपादन पर भरोसा करते हैं। [As for] ब्रांड और निर्माता, [they] अपने स्वयं के और विशिष्ट AI वॉयस अवतार बनाने के लिए WellSaid का उपयोग करें। हम उनकी जरूरतों और उत्पादन विशेषताओं के अनुसार उनकी अनूठी एआई आवाजों को डिजाइन, निर्माण, होस्ट और तैनात करने के लिए उनके साथ साझेदारी करते हैं।”

Microsoft, Amazon, Resemble AI, Synthesia, Deepdub, Papercup, और अन्य से वेलसेड की तकनीक और तुलनीय पेशकशों ने दुरुपयोग और डीपफेक, या सिंथेटिक मीडिया के बारे में चिंताओं को हवा दी है, जिसका उपयोग कमाई कॉल के दौरान अधिकारियों की नकल करने जैसे नापाक उद्देश्यों के लिए किया जाता है। लेकिन हॉकिंग ने कहा कि वेलसेड अभिनेताओं की अनुमति के बिना आवाज अवतार नहीं बनाता है और माइक्रोसॉफ्ट के अधिकारियों ब्रैड स्मिथ और हैरी शम द्वारा प्रस्तावित “एआई के लिए हिप्पोक्रेटिक ओथ” की सदस्यता लेता है।

हॉकिंग ने कहा, “वेलसैड के साथ, जो कंपनियां सिंथेटिक मीडिया को तैनात करने के लिए तैयार नहीं हो सकती हैं, वे अब तकनीक में निवेश कर सकती हैं, क्योंकि यह उन्हें गुणवत्ता का त्याग किए बिना मिशन-महत्वपूर्ण सामग्री का उत्पादन और प्रकाशन जारी रखने की क्षमता देती है।” “हमने जो हासिल किया है उस पर हमें गर्व है और हमारे द्वारा बनाए गए व्यवसाय के लिए आभारी हैं।”

यह नवीनतम दौर वेलसेड की कुल राशि को अब तक बढ़ाकर $12 मिलियन कर देता है।

वेंचरबीट

तकनीकी निर्णय लेने वालों के लिए परिवर्तनकारी तकनीक और लेनदेन के बारे में ज्ञान हासिल करने के लिए वेंचरबीट का मिशन एक डिजिटल टाउन स्क्वायर बनना है।

जब आप अपने संगठनों का नेतृत्व करते हैं तो हमारा मार्गदर्शन करने के लिए हमारी साइट डेटा तकनीकों और रणनीतियों पर आवश्यक जानकारी प्रदान करती है। हम आपको हमारे समुदाय का सदस्य बनने के लिए आमंत्रित करते हैं:

  • आपकी रुचि के विषयों पर अप-टू-डेट जानकारी
  • हमारे समाचार पत्र
  • गेटेड विचार-नेता सामग्री और हमारे बेशकीमती आयोजनों के लिए रियायती पहुंच, जैसे रूपांतरण 2021: और अधिक जानें
  • नेटवर्किंग सुविधाएँ, और बहुत कुछ

सदस्य बने

Leave a Reply

Your email address will not be published. Required fields are marked *