「MidJourney」「Stable Diffusion」などの高性能な画像生成AI(人工知能)の公開を皮切りに、AIによるコンテンツ生成サービスが続々と一般化され、話題を集めている。この潮流がなぜ起きたのか、そしてビジネスにどう影響を及ぼす可能性があるのか、THE GUILD(東京・港)の代表で、インタラクションデザイナーの深津貴之氏に聞いた。

インタラクションデザイナーの深津貴之氏に、コンテンツ生成AIがもたらす未来について聞いた。深津氏は、都市情報デザインを大学で学んだ後、英国にて2年間プロダクトデザインを学ぶ。2005年に帰国し、tha(東京・渋谷)に入社。13年にTHE GUILDを設立。note(東京・港)の CXOも務める
インタラクションデザイナーの深津貴之氏に、コンテンツ生成AIがもたらす未来について聞いた。深津氏は、都市情報デザインを大学で学んだ後、英国にて2年間プロダクトデザインを学ぶ。2005年に帰国し、tha(東京・渋谷)に入社。13年にTHE GUILDを設立。note(東京・港)の CXOも務める

 テキストを打つだけでAI(人工知能)がイラストを自動生成してくれる。一昔前なら夢のような技術が今、誰でも使える状態になり、話題となっている。

 米Googleの高性能な自然言語処理モデル「BERT」や、米OpenAIの超高精度の文書生成言語モデル「GPT-3」などが登場し、AI技術はここ数年で大きく進化。産業界での活用は間違いなく進んでいる。そんな中、画像生成AIが急速に広がったことで、AIが多くの人の手元にまで“下りてきた”。それが今だ。

 今訪れている波の端緒となったのは、「MidJourney(ミッドジャーニー)」の登場だろう。

 テキストによる指示(プロンプト)を打ち込むだけで、AIがそのイメージに沿った画像をつくり出す。以前からクローズドベータ版として一部ユーザーには知られていたが、22年7月にはオープンベータ版として公開された。その結果、SNSにはMidJourney生成の多種多様な画像が投稿され、さながらAIお絵かきブームともいえる状態になった。

 そんな中、より大きな衝撃を与えたサービスがある。英Stability AIの「Stable Diffusion(ステーブル ディフュージョン)」だ(一般向けのサービス名は、「DreamStudio」)。

 MidJourneyよりも高性能といわれるうえ、何とソースコードからモデルまで、世界中に誰でも利用可能な状態で全公開。それも、スーパーコンピューターなどもいらない。ちょっとパワーのあるノートPC単体でも十分に動いてしまう。

 その“異常事態”について、THE GUILDの代表で、インタラクションデザイナーの深津貴之氏はこう表現する。

 「世界変革の前夜は思ったより静か」。

 同氏は、22年8月22日にStable Diffusionに関する記事を、同サービスが本格公開される前にnoteに投稿。これから来るであろう大変革の足音を予感させる記事は、SNSでも大いに話題になった。

▼関連リンク(クリックで別ページへ) 深津氏、note投稿記事「世界変革の前夜は思ったより静か」

 実際、Stable Diffusionの公開の余波はすさまじく、その後は爆発的にAIによる自動生成サービスが公開されることになる。テキスト(プロンプト)を基点に、動画を生成するもの、3Dオブジェクトを生成するもの、漫画を生成するものなど……。まさに生物の種が爆発的に増えた「カンブリア期のような状態」(深津氏)になっている。

 そこで今回は、このAI革命の波が起こす変化について、改めて深津氏に聞いた。

画像生成AIは、「活版印刷」発明の再来か

――なぜ、画像生成AIがここまで話題になっているのでしょうか。また、Stable Diffusionの何が革命的なのでしょうか。

深津貴之氏(以下、深津) Stable Diffusionに代表される高品質な画像生成AIは、個人的な感覚としては「活版印刷」や「カメラ」といった発明に近いと考えています。

 さらに、それがオープンソース化された。これは活版印刷機やカメラが庶民に無料で配られることが同時に起きたようなもの。通常、テクノロジーは一定期間、権力者やお金持ちに占有されることが歴史の常でした。AIでいえば、ビッグテックがサーバー側で独占するものだった。それを、Stable Diffusionは変えてしまった。いきなり万民に“民主化”されることまでセットで起きたのですから、異常事態、特異点だと思っています。

 なぜ、こんなことが起きたのか。技術的に優れていることはもちろんですが、大きいのはStable Diffusionを開発したStability AIのCEOの思想的なものがあります。CEOのエマード・モスターク氏は、オープンソースの推進派であり、テクノロジーがビッグテック企業に占有されている世界はフェアではないという考え方を持っています。

 従来の価値観でいうならば、これほどの性能のAIは、技術を内部に隠蔽し、サービスとして、もしくはAPI(アプリケーション・プログラミング・インターフェース)などで外の人に触れられるようにするのが一般的です。そうして技術を独占することで、優位性を保ち、権力や富を得るわけです。Stability AIはまさに正反対。

 活版印刷が幅広く出回ったことで、書籍や印刷物の量と質、幅と広さが圧倒的に増えたように、画像に関しても同じ事が起きる可能性があると感じました。

深津氏がStable Diffusionで作成したイラスト(1)
深津氏がStable Diffusionで作成したイラスト(1)
深津氏がStable Diffusionで作成したイラスト(2)
深津氏がStable Diffusionで作成したイラスト(2)
深津氏がStable Diffusionで作成したイラスト(3)
深津氏がStable Diffusionで作成したイラスト(3)

――画像生成AIが広がっていくと、これから社会はどう変わっていくのでしょうか。

深津 AIと人間の大きな違いは何かというと、労働集約性にあると思います。人間が1日8時間で3日、つまり24時間をかけて1枚の絵を描くとします。対してAIは、数秒で画像を生成し、かつ24時間動けるわけです。

 これが起きると、何が起きるのか――。

このコンテンツ・機能は有料会員限定です。

有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>
11
この記事をいいね!する