MicrosoftのAIはわずか3秒で音声を再生できる

の進歩 テクノロジー 家の床を掃除できる装置、会話する装置、そして今ではそれを模倣するロボットなど、さまざまな分野で注目されています。 人間の声. Microsoft の画期的な人工知能 (AI) は、わずか 3 秒以内に人間の声を模倣することができます。

一般に、人工知能の音声はロボットに非常に特徴的であり、会話が「」であることが顕著です。ロボット化された”. のトレーニング AI 人間の声を再現するには、人間が英語で話す音声を 60,000 時間必要としました。

続きを見る

警告: この有毒植物により、若者が病院に運ばれました

Google、ジャーナリストを支援する AI ツールを開発…

電話 アイヴァリー、プログラムはテキストからスピーチを作成し、話されている内容を通して感情を伝えることもできます。テクノロジーが人間の言語に属する表現を使用するという事実に加えて、声のトーンも変更できるものです。

ポルトガル語では、 マイクロソフトのAI 一種の「テキスト読み上げ」（テキスト読み上げ) であり、ニューヨーク市 (米国) のコーネル大学で技術研究の対象となっています。基本的に、この技術は人間の音声を音声品質でわずか 3 秒で再現できます。

さまざまな方法で複製されたテキストの小さな抜粋が使用されます。同じテキストでもさまざまな読み方ができるため、伝えられる内容にさまざまな感情が生じます。

ほとんどの場合、AI はテキストを完璧に再現しますが、いくつかの特定の点でその特徴がよりロボットらしくなります。いずれにせよ、テストのほとんどにおいて、音声は読み上げられたテキストをうまく表現することができました。

AI VALL-E は、たとえば、権限がなくても音声を完全にシミュレートすることができます。したがって、倫理が尊重されない場合、創造の範囲は実質的に悪なものになる可能性があります。電話詐欺や政治家からのメッセージの再現に簡単に使用される可能性があります。 フェイクニュース、例えば。

このため、Microsoft の人工知能は一般公開されておらず、サンプル開示調査のみが使用可能です。

映画やシリーズ、映画に関わるすべてのことが大好きです。ネットワークに積極的に興味を持ち、常にウェブに関する情報に接続しています。