信じられない! マイクロソフト、人間の声を数秒で模倣する AI を発表

人工知能がロボットのような声で応答することにある種の違和感を感じる人は、このニュースを気に入るはずです。 あ マイクロソフト 5秒以内にあらゆる人間の声を模倣できるAI「VALL-E」を発表した。

このプログラムは、さまざまな状況で人間の声を聞き、合成し、模倣します。 同社が到達すべきニッチはソフトウェアだ」テキスト読み上げ」または「テキスト読み上げ」(意訳)。

続きを見る

警告: この有毒植物により、若者が病院に運ばれました

Google、ジャーナリストを支援する AI ツールを開発…

ロボット的ではなく、より自然に

このAIのアイデアはまさに、自動音声を可能な限り自然なものにすることです。 Microsoft によれば、それ以上に、今日のアプリケーションに存在するような「非個人化された」音声を避ける試みでもあるとのことです。 Google翻訳者.

同社は 60,000 時間以上の録音に依存していました。 音声は、AI が声のさまざまなニュアンスやトーンを識別するための基礎として機能しました。 さらに、スピーチのユーモアを特定することもできました。 以下でお聞きください。

VALL-E は、同じ入力テキストの音声バリエーションも合成します。 pic.twitter.com/Yy9hj05Qa3

— アモグ・ヴァイシャンパヤン (@amogh42) 2023 年 1 月 7 日

人の声を模倣したAIによるマッチングが可能

Microsoftによれば、VALL-Eは他のAIと組み合わせることができるという。 例としては、 GPT-3、OpenIA 会話およびテキスト ジェネレーター。

どちらのテクノロジーも生成的です。 これは、サンプルからコンテンツを作成できることを意味します。 したがって、適切に実行するには大規模なデータベースが必要です。

これまでのところ、人間の声を模倣するAIは英語でのみ機能します。 今後数か月以内に、ポルトガル語を含む他の言語も利用できるようになる可能性があります。

泊まりに来た

これは、AI が私たちの日常生活の一部になりつつあることを示すもう 1 つの例にすぎません。 以前はこれが SF 映画やプログラミングの学生だけの話題であったとしても、現在では私たちの日常の重要な部分となっています。

したがって、このテクノロジーを扱う可能性にどんどん慣れていくのが良いでしょう。

ゴイアス連邦大学でソーシャルコミュニケーションを卒業。 デジタル メディア、ポップ カルチャー、テクノロジー、政治、精神分析に情熱を注いでいます。

instagram story viewer
RMS タイタニック: 船の本当の歴史、面白い事実

RMS タイタニック: 船の本当の歴史、面白い事実

RMS タイタニック 当時最大かつ最も豪華な客船の 1 つでした。 知られるようになったタイタニック号は、ホワイト スター ライン社の要請により、北アイルランドで 20 世紀初頭に建造されました...

read more
氷山:それが何であるか、どのように形成されるか、危険性

氷山:それが何であるか、どのように形成されるか、危険性

氷山 氷の海を横切って浮かぶ大きな氷の塊です。 地球. それらはから派生しています 氷河 または棚氷は、このため、淡水で構成されています。 氷山構造のごく一部が海面上にありますが、最大の部分は海...

read more
農業システム:分類と特徴

農業システム:分類と特徴

農業システム 畑での土壌管理と栽培のための技術と実践のセットです。 生産プロセスで使用される技術、生産規模、労働力などの特性を考慮すると、農業システムは次の 2 つの主要なカテゴリに分類されます...

read more