माइक्रोसॉफ्ट ने डीपफेक युग में टेक्स्ट-टू-स्पीच अवतार टूल पेश

सैन फ्रांसिस्को: माइक्रोसॉफ्ट ने विज़न क्षमताओं के साथ एक नया टेक्स्ट-टू-स्पीच फीचर पेश किया है, जो उपयोगकर्ताओं को टेक्स्ट इनपुट के साथ टॉकिंग अवतार वीडियो बनाने और मानव छवियों का उपयोग करके प्रशिक्षित वास्तविक समय इंटरैक्टिव बॉट बनाने में सक्षम बनाता है।

इसे Azure AI स्पीच टेक्स्ट कहा जाता है और यह सार्वजनिक पूर्वावलोकन में उपलब्ध है, यह ग्राहकों को 2डी फोटोरियलिस्टिक अवतार में बोलते हुए सिंथेटिक वीडियो बनाने की अनुमति देता है।
कंपनी ने देर रात ‘माइक्रोसॉफ्ट इग्नाइट’ इवेंट के दौरान कहा, “न्यूरल टेक्स्ट टू स्पीच अवतार मॉडल को मानव वीडियो रिकॉर्डिंग नमूनों के आधार पर गहरे तंत्रिका नेटवर्क द्वारा प्रशिक्षित किया जाता है, और अवतार की आवाज टेक्स्ट टू स्पीच वॉयस मॉडल द्वारा प्रदान की जाती है।” बुधवार।
टेक्स्ट टू स्पीच अवतार के साथ, उपयोगकर्ता अधिक आकर्षक डिजिटल इंटरैक्शन बना सकते हैं। वे संवादी एजेंट, आभासी सहायक, चैटबॉट और बहुत कुछ बनाने के लिए अवतार का उपयोग कर सकते हैं।
टेक्स्ट-टू-स्पीच अवतार को व्यक्तियों और समाज के अधिकारों की रक्षा करने, पारदर्शी मानव-कंप्यूटर संपर्क को बढ़ावा देने और हानिकारक डीपफेक और भ्रामक सामग्री के प्रसार का प्रतिकार करने के इरादे से डिज़ाइन किया गया है।
“इस कारण से, कस्टम अवतार एक सीमित एक्सेस सुविधा है जो केवल पंजीकरण द्वारा और केवल कुछ उपयोग के मामलों के लिए उपलब्ध है। अपने व्यावसायिक अनुप्रयोगों में सुविधा तक पहुंचने और उपयोग करने के लिए, अपना उपयोग मामला यहां पंजीकृत करें और पहुंच के लिए आवेदन करें, ”कंपनी ने कहा।
कंपनी इस समय दो अलग-अलग टेक्स्ट-टू-स्पीच अवतार फीचर पेश कर रही है: प्रीबिल्ट टेक्स्ट-टू-स्पीच अवतार और कस्टम टेक्स्ट-टू-स्पीच अवतार।
“Microsoft अपने ग्राहकों के लिए Azure पर आउट-ऑफ़-बॉक्स उत्पादों के रूप में प्रीबिल्ट टेक्स्ट-टू-स्पीच अवतार प्रदान करता है। ये अवतार टेक्स्ट इनपुट के आधार पर विभिन्न भाषाएं और आवाजें बोल सकते हैं। ग्राहक विभिन्न विकल्पों में से एक अवतार का चयन कर सकते हैं और इसका उपयोग वास्तविक समय अवतार प्रतिक्रियाओं के साथ वीडियो सामग्री या इंटरैक्टिव एप्लिकेशन बनाने के लिए कर सकते हैं, ”कंपनी ने कहा।