生成AIで音声コンテンツが気軽に作れるようになった。しかし環境音などノイズの分離や、他の言語への翻訳などは便利な半面、注意も必要に
00:47 ElevenLabsが公開した「Voice Isolation」(環境音バリバリの音源から人の声だけ分離する音声生成AI)を試してみた
01:51 <Voice Isolationした音源> ※USJのレストランで収録したもの
02:46 環境音がパッとなくなるところを聞くと、簡単にできるのはいいかも
03:33 が、現状では自分の声が違う言語を話したり、実際には話していない単語をしゃべっているという結果に
04:08 韓国語・ヨーロッパ系の言語に聞こえる部分から日本語にモーフィング
05:49 英語ではない言語でやると、isolateというよりは別物。音声含めて”生成”されていることを実感
08:15 Voice Isolatorのクオリティが上がったら、インタビューや対談、会議などユースケース広がりそう
09:21 TED Talksの動画に追加された新機能:講演者が話す言語と違う言語で(映像内の本人が)話しリップシンクする
11:43 違う言語にしたとき、本来の言語で伝えていた細かいニュアンスはどうなるか
13:35 これは技術で可能にしているものというような注意書きが必要になるかも
18:28 AIよりもコンテンツを英語化するほうが文化破壊で、仕事を奪われるという翻訳家の話
22:14 TED Talksの例は、発信したいコンテンツを持つ人たちが多くの人たちに伝えるために技術を使うユースケース
24:26 音楽のリミックスと、二次創作を許可して流通させる仕組み(クリエイティブコモンズ)
取り上げた情報へのリンク:
テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。
及川卓也 @takoratta
プロダクトマネジメントとプロダクト開発組織づくりの専門家
自己紹介 ep1, ep2
関信浩 @NobuhiroSeki
アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋
自己紹介 ep52
上野美香 @mikamika59
マーケティング・プロダクトマネジメントを手掛けるフリーランス
自己紹介 ep53