近年、世界的に注目が集まっているコンピュータービジョン(CV)。2010年代に入り、文字認識や顔認証、医療画像を基にした疾病の検知など、注目の技術としてさまざまな領域で活用の幅が広がっています。連載第1回では、CVの歴史を活用例とともに解説し、なぜ近年になって爆発的に注目度が向上したのかをひもといていきます。
【1】20世紀のコンピュータービジョン
コンピュータービジョン(CV)という研究分野は数十年前から存在し、ビジネス分野での活用にも長い歴史があります。今、私たちがスマートフォンやタブレットのような家庭用デバイスで簡単に高度な機能を利用できるようになったのは、多くの研究者による知識の蓄積が重ねられているためです。
その歴史を見ていく前に、CVとはどのような技術なのかという認識を確認していきます。CVとは、人間が視覚を通じて脳内で行う一連の過程をコンピューター上で再現し、自動化することを目指す研究分野です。この研究分野にはデジタルデータとして画像を取得し、処理を進め、画像から特定の要素を認識した上で、必要に応じた情報を提示するまでの一連の流れに関連するすべての研究が含まれています。
CVの研究は、1959年にアナログ写真を電子化するところから始まりました。今ではスマートフォンやデジタルカメラが普及し、誰でもデジタル画像を作ることが可能ですが、当時としては、類を見ない革新的な出来事でした。その後、63年には2次元画像に写るオブジェクトを3Dオブジェクトとしてコンピューター上に表示させることに成功しています。これらの成功はコンピューターの原型ができたばかりの世界においてとても鮮烈で、多くの研究者が短期間でのAI(人工知能)の実現を信じてしまうほどの衝撃を与えました。
CVの進歩はAIの実現と同様に楽観的に考えられ、60年代には多くの野心的なプロジェクトが開始されました。しかし、そのどれもが成功には至りませんでした。失敗の一例として挙げられるのが、66年にマサチューセッツ工科大学(MIT)で開始された、「カメラをコンピューターに接続し、コンピューターに見たものを説明させる」というプロジェクトです。このプロジェクトで特筆すべき点は、教授が学生に対し、ひと夏の間に仕上げることを依頼している点です。当時の技術進歩に対する楽観的な見解が顕著に表れているプロジェクト失敗談と言えるでしょう。
60年代の後半には、AI研究への諦めとともに下火になっていたCV分野の研究ですが、70年代半ばには、画像に写る世界の構造をデジタルで構築し直し、コンピューターにオブジェクトを理解させるという野心的なプロジェクトが進められるようになりました。これらのプロジェクトではオブジェクトの縁を抽出した上でオブジェクト構造の位相を確認し、ゴールとして設定された位置、順序にブロックを積み重ねることに成功しました。70年代にはCVの研究が下火になった時期がありつつも、最終的には画像認識の基礎となる数々のアルゴリズムが生み出されました。
80年代には、第2次AIブームと呼ばれるAI研究の盛り上がりが訪れます。2010年代の技術革新の基礎となるニューラルネットワークの概念が生まれたのも80年代です。現在、多くの画像認識AIに用いられているニューラルネットワークですが、この概念の原型といわれるネオコグニトロンを最初期に提唱したのは、日本人研究者の福島邦彦氏で、一部では、ディープラーニングの父とも呼ばれています。
この記事は会員限定(無料)です。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー