Jeśli czujesz się dziwnie, gdy odpowiada Ci Sztuczna Inteligencja i ma ona głos robota, ta wiadomość Ci się spodoba. A Microsoftu ogłosił sztuczną inteligencję, która jest w stanie naśladować każdy ludzki głos w mniej niż pięć sekund, VALL-E.
Program słucha, syntetyzuje i naśladuje ludzki głos w różnych kontekstach. Niszą, do której ma dotrzeć firma, jest oprogramowanie”Tekst na mowę” lub „zamiana tekstu na mowę”, w wolnym tłumaczeniu.
Zobacz więcej
Uwaga: TA trująca roślina spowodowała, że młody mężczyzna wylądował w szpitalu
Google opracowuje narzędzie AI, które pomoże dziennikarzom w…
Bardziej naturalny, mniej robotyczny
Ideą tej sztucznej inteligencji jest właśnie uczynienie zautomatyzowanego głosu tak naturalnym, jak to tylko możliwe. Co więcej, według Microsoftu, jest to próba uniknięcia „zdepersonalizowanych” głosów, takich jak te, które istnieją dzisiaj w aplikacjach takich jak tłumacz Google.
Firma polegała na ponad 60 000 godzin nagrań. Dźwięki posłużyły jako podstawa dla sztucznej inteligencji do identyfikacji różnych niuansów i tonów głosu. Ponadto możliwe było również zidentyfikowanie humoru mowy. Posłuchaj poniżej.
VALL-E syntetyzuje również wariacje głosowe dla tego samego tekstu wejściowego. pic.twitter.com/Yy9hj05Qa3
— Amogh Vaishampayan (@amogh42) 7 stycznia 2023 r
Można dopasować sztuczną inteligencję naśladującą ludzki głos
Według firmy Microsoft VALL-E można łączyć z innymi AI. Przykładem jest GPT-3, konwersacja OpenIA i generator tekstu.
Obie technologie są generatywne. Oznacza to, że mogą tworzyć treści z próbek. Dlatego potrzebują dużej bazy danych, aby dobrze działać.
Jak dotąd sztuczna inteligencja imitująca ludzki głos działa tylko w języku angielskim. Niewykluczone, że w najbliższych miesiącach dostępne będą również inne języki – w tym nasz portugalski.
przyszedł zostać
To kolejny przykład tego, jak sztuczna inteligencja staje się coraz bardziej częścią naszego codziennego życia. Jeśli wcześniej był to temat wyłącznie dla filmów science fiction lub studentów programowania, dziś jest ważną częścią naszej rutyny.
Dlatego dobrze jest przyzwyczajać się do możliwości coraz szerszego obcowania z tą technologią.
Ukończył komunikację społeczną na Uniwersytecie Federalnym w Goiás. Pasjonat mediów cyfrowych, popkultury, technologii, polityki i psychoanalizy.