信じられない! マイクロソフト、人間の声を数秒で模倣する AI を発表

人工知能がロボットのような声で応答することにある種の違和感を感じる人は、このニュースを気に入るはずです。 あ マイクロソフト 5秒以内にあらゆる人間の声を模倣できるAI「VALL-E」を発表した。

このプログラムは、さまざまな状況で人間の声を聞き、合成し、模倣します。 同社が到達すべきニッチはソフトウェアだ」テキスト読み上げ」または「テキスト読み上げ」(意訳)。

続きを見る

警告: この有毒植物により、若者が病院に運ばれました

Google、ジャーナリストを支援する AI ツールを開発…

ロボット的ではなく、より自然に

このAIのアイデアはまさに、自動音声を可能な限り自然なものにすることです。 Microsoft によれば、それ以上に、今日のアプリケーションに存在するような「非個人化された」音声を避ける試みでもあるとのことです。 Google翻訳者.

同社は 60,000 時間以上の録音に依存していました。 音声は、AI が声のさまざまなニュアンスやトーンを識別するための基礎として機能しました。 さらに、スピーチのユーモアを特定することもできました。 以下でお聞きください。

VALL-E は、同じ入力テキストの音声バリエーションも合成します。 pic.twitter.com/Yy9hj05Qa3

— アモグ・ヴァイシャンパヤン (@amogh42) 2023 年 1 月 7 日

人の声を模倣したAIによるマッチングが可能

Microsoftによれば、VALL-Eは他のAIと組み合わせることができるという。 例としては、 GPT-3、OpenIA 会話およびテキスト ジェネレーター。

どちらのテクノロジーも生成的です。 これは、サンプルからコンテンツを作成できることを意味します。 したがって、適切に実行するには大規模なデータベースが必要です。

これまでのところ、人間の声を模倣するAIは英語でのみ機能します。 今後数か月以内に、ポルトガル語を含む他の言語も利用できるようになる可能性があります。

泊まりに来た

これは、AI が私たちの日常生活の一部になりつつあることを示すもう 1 つの例にすぎません。 以前はこれが SF 映画やプログラミングの学生だけの話題であったとしても、現在では私たちの日常の重要な部分となっています。

したがって、このテクノロジーを扱う可能性にどんどん慣れていくのが良いでしょう。

ゴイアス連邦大学でソーシャルコミュニケーションを卒業。 デジタル メディア、ポップ カルチャー、テクノロジー、政治、精神分析に情熱を注いでいます。

instagram story viewer
地球上で見たことのない2つの鉱物が15トンの隕石から発見される

地球上で見たことのない2つの鉱物が15トンの隕石から発見される

カナダにあるアルバータ大学の研究者らは、ソマリアで発見された重さ15トンで世界第9位を占めていたエル・アリ隕石の一部を分析した。 ランキング これまでに地球上で発見された中で最大の小惑星の破片。...

read more

これら 5 つの言語は 6,000 年以上前のものですが、今でも使用されています

たとえそうは見えなくても、最古の言語は何千年も前から存在しています。 一部の研究者によると、その起源は 6,000 年前に遡ります。 言語は、コミュニティ内の人々の間のコミュニケーションメカニズ...

read more

DNAは簡単な環境調査で特定できる

シーケンス技術の進歩 DNA さまざまな環境からサンプルを収集できるようになり、それぞれの環境に存在する DNA が明らかになりました。 特殊な機器を使用して特定の DNA 配列を検索する必要が...

read more