MicrosoftのAIはわずか3秒で音声を再生できる

の進歩 テクノロジー 家の床を掃除できる装置、会話する装置、そして今ではそれを模倣するロボットなど、さまざまな分野で注目されています。 人間の声. Microsoft の画期的な人工知能 (AI) は、わずか 3 秒以内に人間の声を模倣することができます。

一般に、人工知能の音声はロボットに非常に特徴的であり、会話が「」であることが顕著です。ロボット化された”. のトレーニング AI 人間の声を再現するには、人間が英語で話す音声を 60,000 時間必要としました。

続きを見る

警告: この有毒植物により、若者が病院に運ばれました

Google、ジャーナリストを支援する AI ツールを開発…

電話 アイヴァリー、プログラムはテキストからスピーチを作成し、話されている内容を通して感情を伝えることもできます。 テクノロジーが人間の言語に属する表現を使用するという事実に加えて、声のトーンも変更できるものです。

Microsoft、音声を模倣する AI ソフトウェア「VALL-E」を開発

ポルトガル語では、 マイクロソフトのAI 一種の「テキスト読み上げ」(テキスト読み上げ) であり、ニューヨーク市 (米国) のコーネル大学で技術研究の対象となっています。 基本的に、この技術は人間の音声を音声品質でわずか 3 秒で再現できます。

さまざまな方法で複製されたテキストの小さな抜粋が使用されます。 同じテキストでもさまざまな読み方ができるため、伝えられる内容にさまざまな感情が生じます。

ほとんどの場合、AI はテキストを完璧に再現しますが、いくつかの特定の点でその特徴がよりロボットらしくなります。 いずれにせよ、テストのほとんどにおいて、音声は読み上げられたテキストをうまく表現することができました。

テスト時の対位法

AI VALL-E は、たとえば、権限がなくても音声を完全にシミュレートすることができます。 したがって、倫理が尊重されない場合、創造の範囲は実質的に悪なものになる可能性があります。 電話詐欺や政治家からのメッセージの再現に簡単に使用される可能性があります。 フェイクニュース、 例えば。

このため、Microsoft の人工知能は一般公開されておらず、サンプル開示調査のみが使用可能です。

映画やシリーズ、映画に関わるすべてのことが大好きです。 ネットワークに積極的に興味を持ち、常にウェブに関する情報に接続しています。

instagram story viewer
接続詞:それは何ですか、機能、分類

接続詞:それは何ですか、機能、分類

で 接続詞 機能が 収集または関連付ける 祈り 同じステートメントで. 接続詞機能を持つ単語が2つ以上ある場合、それは 接続詞句. 接続詞および接続句は、2つ以上の文または単語を結合することを目...

read more
南部地域:地図、州、首都、一般データ

南部地域:地図、州、首都、一般データ

THE 南地域 ブラジルの特徴の1つとして 植民地化と定住の過程におけるヨーロッパの強い存在感. このように、それは州が南回帰線の下にある国で唯一のものであるため、建築、料理、人口、さらには気候...

read more
ウイルス。 ウイルスの定義とその分類

ウイルス。 ウイルスの定義とその分類

ウイルスは小さな存在で、直径は約0.1 µmで、寸法は電子顕微鏡でしか観察できません。 それらは基本的に核酸で構成されており、DNAまたはRNAは、と呼ばれるタンパク質の殻に囲まれています。 キ...

read more