ホンダは深層学習と自然言語処理技術などの人工知能(AI)を活用して感性を定量評価する手法を開発した。新車開発の過程で外装デザインのイメージを用意するだけで、顧客がどう思うかが分かるようになる。
「燃費などの性能と違い、デザインのよしあしは感覚性、(開発段階における)機密性からも立証が難しく、定量評価の術が求められていた」
こう話すのは、本田技研工業(ホンダ)企業プロジェクトの加藤拓巳氏だ。
デザインに関する定量評価の難しさを解決するために加藤氏は、クルマのエクステリア(外装)デザインに関して、「おしゃれ」とか「かわいい」といった感性価値を定量評価する手法(アルゴリズム)を考案した。実際にアルゴリズムを開発し、精度90%で定量評価できることを検証した。「今後、改良することによって精度はまだまだ上げられる」(加藤氏)と言う。
具体的にどんな方法で感性価値を定量評価するアルゴリズムを確立したのかという説明の前に、自動車メーカーが抱える直近の課題について触れたい。
感性に訴えるクルマの開発へ
加藤氏は自動車業界が抱える競争環境の変化について、こう解説する。
「これまでは燃費性能のように、数字で評価しやすい性能の勝負だった。しかし最近は、いくら燃費性能を上げても、それだけでは評価されなくなった。コストで勝負するか、そこから抜け出して情緒的価値とか意味的価値といった感性に訴えるクルマの開発が求められるようになってきた。つまり、顧客の心を捉えるクルマのデザインが重要になってきたのだ」
しかし、「会計的にもデザインの費用が定義されていないように、デザインを定量的に評価することは非常に難しく、統一評価指標はいまだに定義されていない」(加藤氏)と言う。
感性工学では、実際に顧客に見てもらったり、触ってもらったりして様々な項目で点数をつけて評価してもらうアプローチが一般的だ。ところが、自動車メーカーなど製造業では、新製品のデザインに高い機密性が求められるので、顧客の声をたくさん聞いて判断することはできないという事情がある。
「顧客の感性を少数のサンプルで定量的に評価するために、近年はニューロサイエンスの利用が活発になっているが、脳の血流などを調べられるMRI(磁気共鳴画像装置)といった重厚な設備が必要になり高い費用がかかる」(加藤氏)という課題があった。
深層学習と独自の自然言語処理
そこで加藤氏は、国内8社の市販車46車種について計9400枚の画像を集めて、それぞれのデザインが感性価値としてどう評価されているのかを学習して作り出すアルゴリズムの開発を思いついた。
前準備として、デザインについては、背景が白いものを人手で選定して、画像のサイズは256×256ピクセルに修正。画像を回転させたり明暗を変更したりすることでデータ数を増やした。
顧客の声については、2014年1月1日から2015年9月14日までの期間に質問回答サイト「Yahoo!知恵袋」やクルマ専門のSNS(ソーシャル・ネットワーキング・サービス)「みんカラ」などから収集した約52万6000件を使った。感性ワードは「かわいい」「おしゃれ」「きれい」「おもしろい」「楽しい」「洗練」「高級」「美しい」「斬新」「スタイリッシュ」「スポーティ」「シック」「モダン」「ファミリー」の14語となった。
これら14語の類似表現の特定に「ウィキペディア日本語版」を利用し、類似度がある一定以上のものを採用している。例えば「斬新」を表現する言葉にも、「奇抜」「ユニーク」など色々ある。それを主観的に決めるのではなく、ウィキペディア掲載の情報から統計的に決めた。
実際に開発した感性を定量評価するアルゴリズムはこうだ。まず深層学習の一種であるCNN(畳み込みニューラルネットワーク)を使い、クルマの外装の画像からデザインの特徴量を抽出。独自の自然言語処理技術などで構成する意味理解アルゴリズムによって、顧客の声から各クルマに感性ワードをタグ付けする。
デザインの特徴量と感性タグをセットにした教師データを、機械学習では精度が高いとされているサポートベクターマシンで学習させて学習済みモデルを作成。この学習済みモデルが、感性を定量評価するアルゴリズムになる。

このアルゴリズムを使って、新しいクルマのデザインがどう言われるかを推定する。新しいクルマの画像をこのアルゴリズムにかけると、14の感性ワードの構成比が出る。どんなことを言われるかの推定だけでなく、どのクルマに何%似ているかも評価できる。
CNNの層は8層。4096次元の特徴量を使っている。自然言語処理については、独自に開発した構文解析を使っている。
構文解析は、様々な表現を正しく捉えるように工夫されている。「すごい」や「若干いいよね」などの強弱表現、「もう恋なんてしないとは言わない」などの多重否定の表現、「昔は良かった」などの比較表現、「ホンダのフィットっていいの?」などの肯定疑問について、正しく把握できる点が市販されている構文解析と違うところという。
加藤氏は「既存のテキスト・マイニング・ツールではできない意味理解を可能にしている。辞書の精度を上げている点と、ルールを作り込んでいる点にポイントがある」と話す。
7車種対象に精度検証
感性の定量評価アルゴリズムの精度検証では、前述した意味理解アルゴリズムに、7つの対象車種(トヨタ自動車の「ランドクルーザー」と「アルファード」、マツダの「CX-3」と「アクセラ」、富士重工の「XV」、三菱自動車の「デリカD:3」、ホンダの「NSX」)の顧客の声を投入し、感性をスコアリングして、真解とした。開発したデザイン感性定量評価アルゴリズムに対象車種の画像を投入し、感性をスコアリングした。両者の差分を取ったところ、対象車種のいずれも10%以下の誤差だった。

今後は、今回使っていない高級ミニバンの画像や、2次元ではなく3次元の画像を使うことを検討。今回排除できなかった走りに関する発言についても排除して、デザインの発言に絞り込むことによって、さらに精度を上げていく。