NTTドコモは、スマホやロボットに話しかけるだけで対応してくれる音声UI(ユーザーインターフェース)の普及に本腰を入れ始めた。2017年にオープン化した同社のAI(人工知能)エージェント基盤の商用化を目指す。

エヌ・ティ・ティレゾナント(東京・港)は、ドコモのAIエージェント基盤を活用して音声対話型恋愛相談ロボットを開発した
エヌ・ティ・ティレゾナント(東京・港)は、ドコモのAIエージェント基盤を活用して音声対話型恋愛相談ロボットを開発した

 「音声UIを本格的に普及させたい」と熱っぽく語るのは、NTTドコモ イノベーション統括部クラウドソリューション担当の秋永和計担当課長だ。そのための施策も実施している。

 ロボットやドア、自動車などあらゆるものに音声応答機能を手軽に装備できる同社の「AIエージェント基盤(API)」を誰でも使えるようにしたのが17年。18年度中にはAIエージェント基盤の商用開始を目指している。同基盤をマネタイズするための仕掛けとして、利用した分だけお金を支払う課金モデルを予定。さらに、さまざまなものに音声応答機能を提供し、音声UIを普及させるためのソリューションを用意している。

 ちなみにAIエージェント基盤は、音声認識エンジン、自然言語処理エンジン、音声合成エンジン、ユーザー認証機能、API制御機能、オーサリングツールなどで構成されている。

自宅のドアと音声対話できる

 ドコモのAIエージェント基盤を活用したさまざまな取り組みは水面下で進められ、その一部が公表されている。その一つがYKKの未来ドア「UPDATE GATE」だ。ただし、このケースは、ドコモが音声対話部分のみで協力している。

 「UPDATE GATE」は、ドアがエージェントになって、出かける前に交通情報や天候情報など、家族一人ひとりに合った情報を伝えてくれる。現在、20年の発売に向けて「YKK AP ショールーム新宿 特設ギャラリー」で一般公開している。

YKKの未来ドア「UPDATE GATE」のイメージ。交通情報などを教えてくれる
YKKの未来ドア「UPDATE GATE」のイメージ。交通情報などを教えてくれる

 顔認証によって人を判別し、ドア自動開閉する方法によるセキュリティーも実現できる。「高齢者やペットの見守り、介護サービスや宅配業者とのやり取りなど、社会課題の解決にも貢献するドア」(YKK)にもなる。

音声対話型恋愛相談ロボット

 もう1つの取り組みが、エヌ・ティ・ティレゾナント(東京・港)の音声対話型恋愛相談ロボット(冒頭の写真)だ。同社には、「教えて!goo」のAI「オシエル」がある。このサービスは、「恋愛相談」に対して、AIがアドバイスを提供するもの。投稿された質問内容を理解し、教えて!gooが持つQ&Aデータを活用して、最適な回答を提供できる。18年春、このオシエルとドコモのAIエージェント基盤を活用してを開発したのが音声対話型恋愛相談ロボットで、AI関連の展示会に出展した。

 ドコモの秋永氏は「当社はこれまで音声対話サービスの「しゃべってコンシェル(現マイデイズ)」をはじめとした自社のコンシューマーサービスにAIエージェント基盤を活用してきたが、ほかの会社にも活用していただくようにした。YKKさんやエヌ・ティ・ティレゾナントさんには当社から『耳と口』を提供させていただいた」と解説する。

 AIエージェント基盤の中核となるのは「AIエージェントAPI」。NTTグループのAI「corevo」にある「先読みエンジン」と「多目的対話エンジン」、そして「IoTアクセス制御エンジン」の3つのエンジンによって構成されている。

 先読みエンジンは、一人ひとりに合わせた情報を適切なタイミングで提供することができる。ドコモのAI技術を活用した自動車向け音声エージェントサービスである「AIインフォテインメントサービス」などでつちかった行動分析技術によって実現している。

 多目的対話エンジンは、自然な対話を通したサービスを提供できる。18億回以上の利用実績がある「マイデイズ」などでつちかった自然言語処理技術によって開発された。

 IoTアクセス制御エンジンは、異なる通信規格のIoT機器を1つのアプリケーションで制御することができる。121社の企業が参画するデバイスWebAPIコンソーシアムで議論・検討中のさまざまなデバイスとの連携を実現する仕組みであるデバイスWebAPIの技術に基づいている。

2つのエージェントが対応

 AIエージェントの利用イメージはこうなる。例えば、あなたをよく知る「メインエージェント」が「ご用はございますか?」と声をかけてくれて、あなたがメインエージェントに「○○○○○してほしいな!」と呼びかけるとしよう。すると、そのメインエージェントは文字通りサービス提供のエキスパートである「エキスパートエージェント」を呼び出してくれる。そしてエキスパートエージェントが交代して、あなたが求めるサービスを提供する。

 エキスパートエージェントは、既に17年8月に開発環境をリリース済み。メインエージェントについては、YKKやエヌ・ティ・ティレゾナントのような企業にトライアル提供している。今年度内に一般提供する予定だ。冒頭で書いたように、利用した分だけお金を支払う課金モデルを予定している。

簡単に開発できる体制に

 音声UIに対する期待は大きいものの、スムーズな対話を可能にする音声シナリオの開発など、簡単に普及させるのは難しいといわれている。そこでドコモは、SDK(ソフトウエア・ディベロップメント・キット)の提供だけにとどまらず、「ソリューションテンプレート」という施策も提供している。

 このソリューションテンプレートは現状で3つある。その1つとしては、店舗の店頭で案内してくれる音声対話エージェントを用意している。お店の情報は入れる必要があるが、表示UIであるタブレットを備えており、キャラクターを自由に変えられる。いわゆるセミオーダー型で、声のトーンなども自由に変えられるようになっており、店の図面などもディスプレーに表示できる。「音声UIだけでなく、表示UIと組み合わせてより分かりやすくしている」(秋永氏)という。

 もう1つが大型サイネージだ。現在、空港やデパートなどでも使えるタイプを開発している。3つ目が飲食店向けの音声注文ができるエージェントだ。これも現在開発中。ほかにも作成を検討しているソリューションテンプレートは複数あるという。

最新技術を活用しやすい仕掛け

 ドコモは、ハードウエアスタートアップ企業のハタプロ(東京・港)とジョイントベンチャー共同事業「39Meister」を行っている。ドコモが持つ、LPWA(Low Power Wide Area=低消費電力で遠距離通信を可能にする通信方式)やAIなどの最新技術と事業化ノウハウ、ハタプロのリーン型ハードウエア開発ノウハウを組み合わせることによって、さまざまな領域でIoTプロダクトの開発を受託している。スピーディーに開発を進めるのが特徴で、企画から開発、コンサルティングまで受託している。

 実はエヌ・ティ・ティレゾナントの音声対話型恋愛相談ロボットは、39Meisterが開発した。18年2月から相談を受けて、1カ月半という短期間で開発。4月のAI関連展示会に出展した。

 「39Meisterでは、お客さまの課題を短期間で対応していくことを強みにしている。新規事業を複数検討していると、新規事業同士がつながることで、事業が加速することがある。AIエージェント基盤では、事業継続性も含めてNTTドコモの強みを生かしている」(ドコモ イノベーション統括部グロース・デザイン担当主査の中島義明氏)という。

 下の写真は音声対話型恋愛相談ロボットの内部だ。上の部分がAIエージェント基盤とつながる頭脳に相当する。下の部分にはスピーカーがあり、発話する。発話があると、手と羽が動く仕組みになっている。ちなみに、話す言葉に応じて可動パーツ(モーターなど)やLED(発光ダイオード)が動作する仕組みになっているのが、ハタプロの汎用ロボット基盤「カスタマイズック」だ。管理画面は、ドコモのAIエージェント基盤につながっている。なお、ログ管理には、ブロックチェーンの仕組みを用いて、データ改ざんの有無が分かるようになっている。

1カ月半という短期間でハードウエアを組み上げた
1カ月半という短期間でハードウエアを組み上げた

 39Meisterはこれまで、16年より数百社から受託している。メリットは3つある。まずは、ワンストップ発注が可能なこと。IoT事業の初期企画からハードウエア開発、プロモーションなどさまざまなプロセスに総合的に対応し、各プロセスに応じた多様なパートナーとの連携を39Meisterがワンストップで対応する。

 2つ目は最新の技術・開発手法を取り入れられること。多岐にわたるIoTの課題に対して、AIやLPWAなど最新の技術と、デザイン思考やリーン開発などの最新手法を活用して、一緒に解決する。3つ目は、異なる企業文化を取り込めることだ。スタートアップと大手の混成チームが両社のノウハウを統合し、そのうえでさまざまな企業の案件に対応している。