生成AIの時代、どうやって「声の権利」を守る?人気俳優も参加する新事業「VOICENCE」の挑戦とは

NTT西日本の新事業「VOICENCE」では、提供者の声を元に、独自技術により表情豊かな音声を多言語で表現。声の権利と価値を守り、企業や生活者が安心して楽しめる「本当の声」を提供することで、新たな経済圏の確立を目指すという。

生成AIの急速な発展に伴い、コンテンツの無断利用などの問題が増えている。

特に音声の領域においては、ガイドラインや法律が整っておらず、声優や俳優、アーティストなどの声が第三者によって無断で生成・利用される事例などが社会課題となっている。

そうした中、NTT西日本は実演家の「声の権利」を保護し、実演家本人の承諾の元、声を独自の生成AIと組み合わせ、適切な形で企業や生活者に届ける事業「VOICENCE」(ヴォイセンス)を始動した。

10月下旬、同事業の発表会で、その背景や事業内容の詳細などが語られた。

生成AIの発展による「声の不正利用」の是正に挑戦

NTT西日本代表取締役社長の北村涼太さん
NTT西日本代表取締役社長の北村涼太さん
NTT西日本

発表会の冒頭では、同社代表取締役社長の北村涼太さんが登壇。生成AIの発展による「声の権利」を取り巻く現状について説明し、事業発足の背景については「この社会課題を事業機会と捉え、声の価値を守り、未来へつないでいくための新規事業に踏み切った」と話した。

また、マーケットやテクノロジーの進化に柔軟かつ迅速に対応するために、本事業の推進チームを「社内カンパニー」という独立の組織として設立したといい、本事業に注ぐ熱量をアピールした。

続いて、VOICENCEのカンパニー長とCEOを務める花城高志さんが登壇。本事業の詳細や社会的意義、サービスを支えるテクノロジーについて説明した。

花城さんが登壇すると、会場には本サービスの内容に関する流暢な英語のスピーチが流れた。その声は花城さんが事前に提供した声を元に独自開発の生成AIが再現したものだといい、豊かな言葉の抑揚や自然な発音で取材陣を驚かせた。VOICENCEでは、このように声を数分録音するだけで、生成AIが自由に、多言語で話せるという。

これは同社の音声処理技術によるもので、「音声印象制御技術」が声の印象を表す11個の「形容詞対」によって話者の口調や印象を変化させ、「多言語合成技術」が実演家の声色のまま、言語のみを変化させている。多言語合成技術は現在、日本語、英語、中国語、韓国語、フランス語、スペイン語に対応しているという。 

「本物のAI」で声の権利と価値を守り、企業や生活者へ届ける

VOICENCEのカンパニー長・CEOの花城高志さん
VOICENCEのカンパニー長・CEOの花城高志さん
NTT西日本

VOICENCEのもう1つの特徴が、信頼を設計するトラスト技術の導入だ。実演家本人の声から生成されたことを証明する「声の真正性証明書」を発行することで、その音声が無断音声やフェイク音声ではないことを証明するという。また、許諾された範囲内の使用方法以外での不正使用を検知できるため、実演家が安心して声を提供できる仕組みになっている。

花城さんは「声優やアーティストなど、豊かな声の表現力が日本のカルチャーの源泉となっている」と声の持つ価値について語るとともに、「誰もが声を作り発信できる時代に、声を守りそれを次の価値として届けていく仕組みが整っていない」と話し、改めて現状に警鐘を鳴らした。

そうした中で、本事業では本人の承諾と契約に基づき、信頼できる技術で声の権利を守り、企業や生活者に安心して声を届けることのできる生成AIを「本物のAI」(声の不正利用やフェイク音声ではないAI)と定義している。

VOICENCEの第一歩として、声を安全に保管・管理・活用し、実演者とコミュニケーションを取れるプラットフォームの運用が開始されている。プラットフォームには現在、春日望さん(声優)や別所哲也さん(俳優)、花江夏樹さん(声優)が声を提供するパートナーとして参加している。

今後、企業をはじめとしたクライアントが直接アクセスし、音声コンテンツ企画・制作などをトータルプロデュースできるプラットフォームを目指すという。花城さんは「声を安全に預かり、正しく活用し、その価値を高めていく。新しい声のインフラを作ること。声を守り育て届ける。声の経済圏を作る。それがVOICENCEです」とアピールし、事業説明を締め括った。

声優の声を、海外のファンに「そのまま」外国語で届ける?

トークセッションの様子
トークセッションの様子
NTT西日本

発表会後半の声の権利をめぐるトークセッションでは、NTT社会情報研究所の荒岡草馬さんと日本音楽事業者協会の中井秀範さん、さらにプラットフォームに参加している春日望さんと別所哲也さんも登壇。また、VOICENCEが生成した声を使用したバーチャルタレントの「KizunaAI」とデモンストレーションを実施した。

経営者としてコンテンツライツ事業にも取り組んでいる別所さんは、本事業について「実演家にとって声は財産なので、法的に犯されてしまうことは怖いことです。Web3(特定の管理者がいない分散型の次世代インターネット)の時代に、声の権利と保護に関する革新が起きることは、とても嬉しいです」とコメント。

春日さんは「法律や権利の話は多くの俳優や声優が頭を抱えている問題ですが、弁護士でも権利周りの知識は千差万別なので、そこに特化した企業が間に入って保護やサポートをしてくれるのは心強いですね」とサービスに寄せる期待を表明した。

さらに中井さんは「サブスクリプションサービスに代表されるように、以前は音楽や音声で起きたイノベーションが数年遅れて映像領域でも起きるという流れが一般的でした。しかし生成AIの発展により、近年はそのギャップが極めて小さいものになっているように感じます。そのため、急速な発展をカバーする権利や保護に関するガイドラインが整っておらず、各所焦っている現状はあるのではないでしょうか」と話し、いずれもインフラの整備に関する課題を感じていることがわかった。

こうした声を受けて、「声の権利」や生成AIの社会的ルール形成に関する研究を推進している荒岡さんは深く頷き、「声自体には現状では権利性が認められておらず、法律も判例もないので、誰かに勝手に使われても権利主張ができない状況です。実際、声を提供したい人の中には『自分の声で仕事をしたいけど無断で使われたくない』という意見が、声を利用したい人の中には『音声サービスを提供したいけど、何がリスクかわからない』という意見もあります」と具体的な問題を指摘。

社会情報研究所では、諸外国の動向や有識者との意見交換、社会調査を進めて声の権利を明らかにすることで、今後ガイドラインのように多くの人が参照できる形でのアウトプットを目指すという。

デモンストレーションで驚きの表情を浮かべる別所哲也さん
デモンストレーションで驚きの表情を浮かべる別所哲也さん
NTT西日本

デモンストレーションでは、春日さんが声を提供しているバーチャルタレントの「KizunaAI」が登壇。音声制御技術で様々な抑揚とテンションでトークを展開したのち、別所さんと英語で会話をする場面もあった。

感情のこもった声色でのスムーズな回答に別所さんは驚きの表情を浮かべ、「これだけのクオリティでオリジナルの声優の声を、言語だけ変換して海外で届けられるというのは、ファンにとっても嬉しい体験になりそうですね」とサービスの汎用性に触れつつ、事業展開への期待の声を寄せた。

トークセッションを終えて、花城さんは「技術の進化だけではなく、適正利用を支えるモニタリングや相談体制など、運用の仕組みを整えていきたいと思います」「何よりもファンやユーザーの皆様が安心して音声を楽しめる社会を作っていきたいと思います」と改めて志を表明し、発表会を締め括った。 

注目記事