米ファスト・カンパニー

顔認証をする米アマゾン・ドット・コムの技術「レコグニション」。これを米政府に提供しないよう同社株主が求めるなど物議をかもしている。一方、ユーザー生成コンテンツ(UGC)が日々膨れ上がるなか、不快な動画が含まれないかを自動認識する企業サイドの関心も高く、多くの企業がこのレコグニションを利用している。その実像に迫った。

アマゾンの「レコグニション」は物議をかもす(写真/Shutterstock)
アマゾンの「レコグニション」は物議をかもす(写真/Shutterstock)

 物議をかもすアマゾンのコンピュータービジョン技術「レコグニション」が今、食べ物のウェブサイトからわいせつ画像を排除するために使われている。

 まあ、とにかく1つのケースではそうだ。英ロンドンに本社を構える料理宅配サービスのデリバルーは、コンテンツモデレーション(コンテンツを監視し、不適切な内容を削除すること)の明確な課題を抱えている。同社の顧客は、注文した料理に何か問題があった時、苦情とともに料理の写真を送ってくることが多い。そして、しばしば料理の写真に自分のわいせつ画像を混ぜ込ませる。本当の話だ。

 デリバルーの従業員は、もちろんそんなものは見たくない。このため同社は、不快な写真を自動認識し、人の目に届く前に写真をぼかしたり、削除したりするのにレコグニションを使っているのだ。

 デリバルーが抱える問題は、次第に深刻化する問題のやや奇怪な輪郭を表している。多くのインターネット企業は何らかの形で、UGCと大きく関係している。近年、こうしたUGCの中に人間性の闇の部分が見えることが増えてきた。フェイクニュースや暴力的なコンテンツ、ディープフェイク(AI=人工知能=を利用した人物画像合成)、いじめ、ヘイトスピーチなどの不快なコンテンツが各サイトにどんどん投稿されるようになると、コンテンツモデレーションの重要性が高まった。

 もし米フェイスブックであれば、この面倒な問題に対処するために自前のAIを開発するか、コンテンツモデレーターの軍団を雇うことができる(両方やってもいい)。だが、経営資源が少ない比較的小さな企業には、その選択肢がない。ここでアマゾンのコンテンツモデレーションサービスの出番となる。

法執行機関への顔認証サービス提供で批判を浴びているが……

 このサービスは、「AWS(アマゾン・ウェブ・サービス)」の画像分析サービス「レコグニション」の一部だ。レコグニション自体、米移民税関捜査局(ICE)に顔認証サービスを進んで提供するアマゾンの意思もあって、否定的な報道の的になってきた。レコグニションのウェブサイトでは、他にも監視志向のアプリケーションを見つけられる。動画内のどの角度からも車のナンバープレートを読み取れる機能や、カメラに映った人がたどった道のりを追跡できる機能などだ。

 アマゾンは最近初めて、わいせつ画像や暴力的な画像を探してUGCを監視するためのレコグニションの活用について語り始めた。コンテンツモデレーションサービスは、企業のウェブサイトに投稿された画像や動画の中から、危険なコンテンツや侮辱的なコンテンツを自動で探知する。

顧客の要請で開始した成長ビジネス

 そして、これは成長ビジネスだ。アマゾンのAI担当バイスプレジデント、スワミ・シバスブラマニアン氏は筆者に、「私たちは今、ソーシャルメディア上で毎日2~3枚の写真を友人や家族とシェアしているため、UGCの役割は前年比で爆発的に拡大している」と話してくれた。同氏によれば、アマゾンは何社もの顧客企業のリクエストに応えて、2017年にコンテンツモデレーションサービスの提供を始めたのだという。

 企業は、ユーザーがアップロードする画像を点検するために人間を雇う代わりに、レコグニションに使用料を支払う。AWSの他のサービスと同様、コンテンツモデレーションサービスは従量制モデルを用意しており、ニューラルネットワークによって処理された画像の数に基づいて価格が設定されている。

 驚くまでもなく、このCMS(コンテンツ管理システム)の最初のユーザーには、ユーザープロフィルにアップロードされるセルフィ―(自撮り写真)を把握したいデートサイトやマッチメーキングサイトが含まれる。アマゾンによると、マッチメーキングサイトのコーヒー・ミーツ・ベーグルやシャーディの他、他社がデートサイトを構築するのを支援するポルトガルのウェブサイト、ソウルなどがこの目的のために同社のCMSを利用している。

 AIはただ裸体が映ったコンテンツを探しているだけではない。レコグニションのニューラルネットワークは、武器の画像や暴力、あるいは一般的に不快なコンテンツなど、あらゆるタイプの疑わしいコンテンツを探知するよう学習されている。

不適切画像が処理される仕組み

 AWSの他の機能同様に、レコグニションの新しいコンテンツモデレーション機能はクラウド上で動く。企業はこのサービスに対し、どんなタイプの問題画像を探知したいのか指示できる。次に、ユーザーによって生成された写真と動画──多くの場合、そもそもAWS上に蓄積されたものだったりする──を入力する。

 アマゾンのディープニューラルネットワーク(深層学習などで利用される多層のニューラルネットワーク)は、内容を把握するために画像を処理し、潜在的にいかがわしいイメージに対して注意喚起のフラグを立てる。そのうえで個々のイメージに付けたラベルに対する自信の度合いを示すスコア(パーセンテージで表示)とともに、イメージの内容に関するメタデータ(付随情報)を出力する。

 次にそのコードが顧客側のソフトウエアに送られる。すでにプログラムに書き込まれた個別企業のルールに基づいて、フラグが立てられた画像への対処法を決めるソフトだ。このソフトは特定の画像を自動的に削除するかもしれないし、そのまま投稿を認めるかもしれない。また、一部をぼかすか、確認のために人間に送ることもある。

有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>