إذا شعرت ببعض الغرابة عندما يتم الرد عليك بواسطة ذكاء اصطناعي وله صوت آلي ، فستحب هذه الأخبار. أ مايكروسوفت أعلن عن ذكاء اصطناعي قادر على تقليد أي صوت بشري في أقل من خمس ثوان ، VALL-E.
يستمع البرنامج ويجمع ويقلد الصوت البشري في سياقات مختلفة. المكانة التي يجب أن تصل إليها الشركة هي البرمجيات "النص إلى الكلام"أو" تحويل النص إلى كلام "، في ترجمة مجانية.
شاهد المزيد
تنبيه: هذا النبات السام أوقع شابًا في المستشفى
تطور Google أداة الذكاء الاصطناعي لمساعدة الصحفيين في...
أكثر طبيعية وأقل آلية
فكرة هذا الذكاء الاصطناعي هي على وجه التحديد جعل الصوت الآلي طبيعيًا قدر الإمكان. أكثر من ذلك ، وفقًا لمايكروسوفت ، إنها محاولة لتجنب الأصوات "غير الشخصية" ، مثل تلك الموجودة اليوم في تطبيقات مثل مترجم جوجل.
اعتمدت الشركة على أكثر من 60 ألف ساعة من التسجيلات. كانت الأصوات بمثابة أساس للذكاء الاصطناعي لتحديد الفروق الدقيقة ونغمات الصوت. بالإضافة إلى ذلك ، كان من الممكن أيضًا تحديد فكاهة الكلام. استمع أدناه.
يقوم VALL-E أيضًا بتجميع الاختلافات الصوتية لنفس نص الإدخال. pic.twitter.com/Yy9hj05Qa3
- Amogh Vaishampayan (@ amogh42) 7 يناير 2023
يمكن مطابقة الذكاء الاصطناعي الذي يحاكي الصوت البشري
يمكن دمج VALL-E مع أنظمة الذكاء الاصطناعي الأخرى ، وفقًا لمايكروسوفت. مثال على ذلك هو GPT-3، محادثة OpenIA ومنشئ النص.
كلا التقنيتين توليدي. هذا يعني أنه يمكنهم إنشاء محتوى من العينات. لذلك ، فهم بحاجة إلى قاعدة بيانات كبيرة للعمل بشكل جيد.
حتى الآن ، يعمل الذكاء الاصطناعي الذي يحاكي الصوت البشري باللغة الإنجليزية فقط. من المحتمل أنه في الأشهر المقبلة ، ستتوفر أيضًا لغات أخرى - بما في ذلك لغتنا البرتغالية.
جاء ليبقى
هذا مجرد مثال آخر على كيف أصبح الذكاء الاصطناعي جزءًا من حياتنا اليومية أكثر فأكثر. إذا كان هذا الموضوع قبل ذلك موضوعًا حصريًا لأفلام الخيال العلمي أو لطلاب البرمجة ، فهو اليوم جزء مهم من روتيننا.
لذلك من الجيد أن تعتاد على إمكانية التعامل مع هذه التقنية أكثر فأكثر.
تخرج في الاتصال الاجتماعي في الجامعة الاتحادية في غوياس. شغوف بالوسائط الرقمية والثقافة الشعبية والتكنولوجيا والسياسة والتحليل النفسي.