Om du känner en viss konstighet när du blir besvarad av en artificiell intelligens och den har en robotröst kommer du att gilla den här nyheten. A Microsoft tillkännagav en AI som kan imitera vilken mänsklig röst som helst på mindre än fem sekunder, VAL-E.
Programmet lyssnar, syntetiserar och imiterar den mänskliga rösten i olika sammanhang. Den nisch som företaget ska nå är mjukvara "text till tal” eller ”text-till-tal”, i fri översättning.
se mer
Varning: DENNA giftiga växt landade en ung man på sjukhuset
Google utvecklar AI-verktyg för att hjälpa journalister i...
Mer naturligt, mindre robotiskt
Tanken med denna AI är just att göra en automatiserad röst så naturlig som möjligt. Mer än så är det enligt Microsoft ett försök att undvika ”avpersonifierade” röster, som de som finns idag i applikationer som t.ex. Google översättare.
Företaget förlitade sig på mer än 60 000 timmars inspelningar. Ljudet fungerade som grund för AI: n för att identifiera röstens olika nyanser och toner. Dessutom gick det också att identifiera talet humor. Lyssna nedan.
VALL-E syntetiserar också röstvariationer för samma inmatade text. pic.twitter.com/Yy9hj05Qa3
— Amogh Vaishampayan (@amogh42) 7 januari 2023
AI som imiterar mänsklig röst kan matchas
VALL-E kan kombineras med andra AI: er, enligt Microsoft. Ett exempel är GPT-3, en OpenIA-konversations- och textgenerator.
Båda teknikerna är generativa. Det betyder att de kan skapa innehåll från prover. Därför behöver de en stor databas för att fungera bra.
Än så länge fungerar AI som imiterar mänsklig röst bara på engelska. Det är möjligt att andra språk – inklusive vår portugisiska – också kommer att finnas tillgängliga under de kommande månaderna.
kom för att stanna
Detta är bara ytterligare ett exempel på hur AI blir mer och mer en del av vårt dagliga liv. Om det tidigare var ett exklusivt ämne för science fiction-filmer eller programmeringsstudenter, är det idag en viktig del av vår rutin.
Därför är det bra att vänja sig vid möjligheten att hantera denna teknik mer och mer.
Examen i social kommunikation vid Federal University of Goiás. Brinner för digitala medier, popkultur, teknik, politik och psykoanalys.