2015年12月19日 02時30分 JST | 更新 2015年12月19日 02時30分 JST

膨大なテキストデータを分析――企業のリスク回避やチャンス獲得を目指す最新技術があった

メールやSNSなどのテキストデータを分析すれば、企業のリスク管理や、新サービスの開発に役立てられる。「テキスト含意認識」の最新技術とは?

Caspar Benson via Getty Images
A pile of various white block letters from the alphabet

身の回りに溢れている、メールやSNSをはじめとする膨大なテキストデータ。これをビッグデータとして分析し、企業活動に利用したいというニーズが高まっている。NECでは、「テキスト含意認識技術」と呼ばれる技術を活用したソリューションを提供している。

「テキスト含意認識技術」によりテキストデータを、企業活動のリスク監視や、製品・サービスの開発など、さまざまなことに役立てられるそう。

この技術の基本は、2つの文章が同じ意味かどうかを判定することだ。

たとえば「お客様のところでプレゼンだ」と「客先で発表だ」という2つの文章。この2つは、字面は違うが、意味は似ている。

では、「お客様のプレゼン資料をもらった」という文はどうだろうか?字面は似ているが、意味は違う。

こうした判定を行うことが「テキスト含意認識」であり、メールや報告書、SNSなどの大量のテキストデータ上でこうした判定を行う技術が、NECの「テキスト含意認識技術」である。

リスク回避から、チャンスをつかむまで

では実際にどんな場面で役立っているのだろうか? そのひとつがメールなど大量に流れてくるテキストを「監視」したいという要望だ。

例えば、ある企業のリスク管理担当部門が、報告書やメールから社員のコンプライアンス違反をチェックすることで監視しているケース。従来であれば、管理者は大量の報告書やメールを読んでチェックしなければならない。

ここで、テキスト含意認識技術を利用すれば、はじめに禁止事項にあたる文を登録しておくことで、大量のテキストの中から、禁止事項にあたる文と同じ意味を含む文をピックアップできる。それにより、管理者が疑わしい文が含まれた報告書やメールを漏れなくチェックでき、リスク監視を効率的にできるというわけだ。

一方、監視というのはリスクを発見するだけではなく、チャンスを見出すことにもつながるという。

たとえば、SNSなどに書き込まれたテキスト情報を分析し、従来は気付くことのなかった購買ニーズを読み取り、該当の商品の情報やクーポンを配信することで、売上の向上につなげられるかもしれない。

また、企業などに寄せられるお客さまの声などから、同じ意見や要望をまとめることも可能だ。

膨大なアンケートのテキストデータを読み込ませると、同じ意味のものを自動でまとめられる。さらに、そのグループの要旨がよく分かる「代表文」も一緒に示されるため、どういうグループか、すぐに理解できる。それを製品やサービスに関する課題を発見するために役立てられるのだ。

テキスト含意認識技術は、テキストデータであればどのような場合でも活用できる。メールでもSNSのコメントでも、コールセンターの記録メモでも対応可能だ。

国際的な評価コンテストで第1位を獲得

NECのテキスト含意認識技術は、文中における重要な単語や、主語・述語などの文の構造まで考慮した分析を行う。これにより、同じような単語があっても、文の意味が違うことを認識でき、さらにその精度の高さが評価されている。

米国国立標準技術研究所(NIST)が主催する評価コンテストで世界第1位の評価を獲得している。

また、約700万文のテキストデータの中から、同じ意味の文を探し出すのに、約0.2秒で処理する高速化を実現している。

どんな事業で役立っているの?

銀行・証券や製造業など企業向けのビジネスを展開している企業では、テキスト含意認識技術を応用した「情報ガバナンス強化ソリューション」を導入している。

これは、営業職員が作成する文書の中に厳しく管理すべき重要情報が含まれているかを、即座に判定する仕組み。企業の情報資産の管理を強化できると期待されている。

また、コンシューマ向けビジネスを展開している多くの企業では、お客さまから聞いた要望事項を、お客さまの声データとしてストックしている。

これまでは、手作業で分類・整理していたお客さまの声を、種類に応じて見出しをつけながら自動でグループ化することができるようになった。これにより顧客向けサービスの品質改善に一層注力できるようになり、顧客満足度の向上につなげられる。

このほか、コールセンターで利用されるケースも多い。お客さまからの不満や要望をまとめる時間を短縮することで、速やかに、サービスや製品の改善に役立てられる。コールセンターでは、音声認識とテキスト含意認識技術を組み合わせたいという要望もあり、NECではその実現に向けて研究・開発を進めている。