スマートスピーカーに"AIによる差別"はあるのか

ＡＩを使ったスマートスピーカーに話しかけてもきちんと認識されず、「わかりません」を繰り返したり、全く関係ない反応をしたりする。そこに"ＡＩによる差別"はあるのか――そんな実験をワシントン・ポストが公開している。

By Richard Royle (CC BY 2.0)

ポストの実験でカギになっているのは、英語の発音のアクセント（なまり）に対する、聞き取り精度の差だ。

米国のネイティブと、中国やインドなどの出身の非ネイティブを比較すると、その聞き取り精度には１０％程度の違いが出た、という。

ＡＩが学習データの偏りによって、肌の色や性別で差別を生むという"ＡＩのバイアス問題"は、こんなところにも影を落としているようだ。

●ネイティブと非ネイティブの差

ワシントン・ポストが実験に使ったのは、市場を席巻するアマゾン・エコーとグーグル・ホームの２機種（ポストのオーナーが、アマゾンＣＥＯのジェフ・ベゾス氏であるという情報開示はしている）。

２つの専門機関の協力で、米国とカナダ、あわせて２０都市、１００人以上を対象に全部で数千件にのぼる音声コマンドを試してもらった、という。

専門機関の１つ、テクノロジー製品のローカライズを手がける「グローバルミー」が、まず７０の音声コマンドについて検証している。

その結果、グーグル・ホームの音声認識の精度が８３％だったのに対し、アマゾン・エコーの精度は８６％。

さらに、米国のネイティブは地域によって「西部」「中西部」「東部」「南部」、移民は第一言語によって「インド」「中国」「ヒスパニック」の７分類で比較した。

ネイティブに対する音声認識でも、グーグルとアマゾンでは違いが出ている。

グーグルでは「西部」「中西部」「東部」「南部」の順で精度が下がっていくが、アマゾンでは「南部」「東部」「西部」「中西部」の順。

非ネイティブでは、両社とも「インド」「中国」「ヒスパニック」の順で精度が落ちていた。

グーグルでは、最も精度の高かった「西部」（８６％）と、同じ米国内で最も精度の低かった「南部」（８３．１％）でも約３ポイントの開き。さらに最も精度の低かった「ヒスパニック」（７９．８％）と比べると６ポイントを超す開きがあった。

同様にアマゾンでも、最も高かった「南部」（８９．１％）と、米国内で最も低かった「中西部」（８７％）で約２ポイントの開き。最も低かった「ヒスパニック」（８１．８％）とは７ポイントを超す開きがあった。

「次の曲をかけて」「ソウルをかけて」「全部の曲をかけて」「最近かけたプレイリストをかけて」「もう一度かけて」といった、コンテンツ操作に限ると、発音による認識精度の違いはさらに広がった。

グーグルでは、最も高かった「東部」（９１．８％）と最も低かった「ヒスパニック」（７９．９％）で１１．９ポイントの開き。

アマゾンでも最も高かった「南部」（９１．０％）と最も低かった「中国」（８１．５％）で９．５ポイントとなった。

●「ニュースの見出し」読み上げを比較する

もう１つの専門機関、音声テストのベンチャー「パルスラボ」が行ったのは、３本のニュースの見出しを対象者に読み上げてもらい、それをアマゾン・エコーで使われているＡＩ「アレクサ」の認識結果と比較する、という実験だ。

スマートスピーカーでは、まずユーザーが話しかけた言葉を音声認識で文字化し、その文字化された文章から自然言語処理でコマンドとして認識し、指示を出す、という処理をしている。

実験では、元のニュース見出しと、音声認識で文字化したものが、どれぐらい違っているかを数値化（「レーベンシュタイン距離」）し、ネイティブと非ネイティブで比較している。

「レーベンシュタイン距離」では、元の文字列と出力（音声認識）された文字列の違いを、その修正回数（挿入・削除・置換）でカウントするため、数値が高い方が認識精度は低いことになる。

それによると、ネイティブと非ネイティブを比較すると、非ネイティブの方が３０％も数値が高かった、という。

●"ＡＩによる差別"の問題

ポストがこんな実験をするのは、ＡＩによる人種や性別の"差別"が大きな問題としてクローズアップされてきているからだ。

米ウィスコンシン州などでは、判決の参考データとして、被告の再犯可能性を予測する「再犯予測プログラム」が使われている。だが、機械学習によると見られるこの「再犯予測プログラム」が、黒人に対し、高い再犯予測をすることが、２０１６年のプロパブリカの報道で明らかになっている。

※参照：見えないアルゴリズム：「再犯予測プログラム」が判決を左右する（08/06/2016）

アマゾンの顔認識ＡＩ「レコグニション」が、２８人の連邦議会議員を逮捕歴のある人物として誤認識した――米自由人権協会（ＡＣＬＵ）は２０１８年７月２６日、公式ブログでそんな実験結果を明らかにした。

実験に使ったのは、ネットで入手可能だった２万５０００人分の逮捕写真。これを「レコグニション」に入力して「犯罪者データベース」を構築。

このデータベースに、５３５人の上下両院の連邦議会議員の顔写真を判定させたところ、２８人が「犯罪者」と認識されたのだという。

また、マサチューセッツ工科大学メディアラボのジョイ・ブオラムウィニ氏らの研究によると、顔認識のシステムでは、有色人種や女性の誤認識率が高いことが判明。色白の男性の誤認識率は０．８％だったのに対し、色黒の女性の誤認識率は３４．７％だったという。

ＡＣＬＵの実験でも、誤認識した２８人のうち有色人種は３９％で、連邦議会全体での割合、２０％を上回っていた、という。

ＡＣＬＵの実験結果を受け、「犯罪者」と誤認識されたエドワード・マーキー上院議員を含む、上院民主党の５人の議員は７月末、連名で議会の補佐機関である会計検査院（ＧＡＯ）に対し、政府機関における顔認識テクノロジーの使用状況と問題点について、調査を要求している。

犯歴や顔といったデータでは、肌の色などが"バイアス"のポイントとなった。

そして音声認識の場合は、結果的に米国英語のネイティブか非ネイティブか、つまり移民かどうかが、ＡＩによる不公平な取り扱い、つまり「言語の壁」によるある種の"バイアス"を生み出しているとは言えそうだ。

●出荷は１８７％の伸び

市場調査会社「カナリス」が８月１６日に発表した２０１８年第２四半期の調査結果では、スマートスピーカーのグローバル市場の出荷台数は１６８０万台で、前年同期比１８７％の伸び。

グーグル（ホーム）が３２．３％、前年同期比４４９％という伸びを示してシェア１位となっており、２位はアマゾン（エコー）（２４．５％、前年同期比マイナス１４％）。この２社で市場の６割近くを占める。

３位はアリババ（天猫精霊、同１７．７％）、４位はシャオミ（ＭｉＡＩスピーカー、同１２．２％）。

アマゾンは前年同期には８割を超すシェアを占めていたが、２０１８年第１四半期に、初めて１位をグーグルに奪われていた。

またコムスコアが２０１８年４月に発表したデータでは、米国のスマートスピーカーの利用家庭は１８７０万世帯、ＷｉＦｉのある家庭の２０％にあたるという。

発展途上ではあるが、利用が徐々に広がっていることは間違いなさそうだ。

ポストの実験の結果に対し、アマゾンはこうコメントしている。

特定の音声パターンやアクセントの音声をよりたくさん聴くことで、理解がしやすくなります。アレクサの場合も、同様です。より多くの人々が、多様なアクセントで、アレクサに話しかけることで、アレクサの理解も改善されていきます。

グーグルも同様のコメントをしている。

データセットを拡充していくことで、グーグル・アシスタントの音声認識を引き続き改善していきます。

まだデータが十分ではない、との釈明だ。

アマゾンの場合は言語設定で、英語だけでも「米国」「カナダ」「英国」「インド」「オーストラリア／ニュージーランド」と分かれており、個別のデータが拡充することで精度が上がるということはあるだろう。

●ＡＩとのコミュニケーション

私が自宅で使っているアマゾン・エコーも、音声認識は満足のいくものではない。

アマゾン・エコーでは履歴を見れば、アレクサが音声をどう認識したか、テキストで確認できる。

最近のやりとり、はこんな感じだ。

「（カナダ人のミュージシャン）Mocky（モッキー）をかけて」とアレクサに日本語で話かけたところ、アレクサは「モンキーをかけて」と認識。

「Godiego（ゴダイゴ）の『モンキー・マジック』を再生します」と往年の名曲をかけてくれた。

さらに英語で、「Play Goldberg Variations（ゴルトベルク変奏曲をかけて）」と言ったつもりが、アレクサは「play cold the belk version」と認識。

「Here's a sample of The Cold Hard Truth (Karaoke Version), by A-Type Player」と応答。米カントリー歌手、ジョージ・ジョーンズの曲をカラオケで流し始めた。

ＡＩとのコミュニケーションは、まだハードルが高い。

--------

■新刊『信じてはいけない　民主主義を壊すフェイクニュースの正体』（朝日新書）

（2018年8月26日「新聞紙学的」より転載）

ai バイアスアマゾンアレクサグーグル

注目記事

スマートスピーカーに"AIによる差別"はあるのか

●ネイティブと非ネイティブの差

●「ニュースの見出し」読み上げを比較する

●"ＡＩによる差別"の問題

●出荷は１８７％の伸び

●ＡＩとのコミュニケーション

関連記事

注目記事

注目記事

●ネイティブと非ネイティブの差

●「ニュースの見出し」読み上げを比較する

●"ＡＩによる差別"の問題

●出荷は１８７％の伸び

●ＡＩとのコミュニケーション

関連記事

注目記事

NEWS 記事一覧