中国インターネット検索最大手の百度(バイドゥ)は2022年8月にAI(人工知能)芸術コンテンツ生成プロダクト「文心一格(ウェンシンイーガー)」を発表して以来、AIGC(AI生成コンテンツ)領域における技術の刷新とその普及を加速させている。ウェンシンイーガーは、既に一般向けに公開されており、一般ユーザーの誰もが使用することができる。今回は、そのウェンシンイーガーを深掘りすると同時に、バイドゥのAIGC領域における取り組みについて注目したい。
バイドゥのAIGCプロダクト「文心一格」とは
絵画の描写やイラストの作成、そしてデザインなどのビジュアルコンテンツの創作は、一般的にハードルが高く、時間と手間がかかる。普通の人々にとっては、自前でこういった創作は難しい。一方で、専門のコンテンツクリエイターにとっては、これらの創作には多くの時間を費やすことになる。
そこでバイドゥが2022年8月に発表したのが、ウェンシンイーガーだ。これは、バイドゥのAIオープンプラットフォーム「百度大脳(バイドゥブレーン)」の最新技術である知識増大ファンデーションモデル「文心(ウェンシン)」を活用したAI芸術コンテンツ生成プロダクトで、ユーザーはこのプロダクト上で1つの文章を入力するだけで、AIが自動でクリエイティブな画像を生成する。
このプロダクトを使用することで、一般的なユーザーは、極めて容易に芸術コンテンツの創作ができると同時に、自分の考えを基にカスタマイズした作品を大量に生成することができ、それを日常生活の中でそのまま使用できる。一方で、専門のコンテンツクリエイターは、コンテンツ制作の効率を大幅に向上でき、その創作に関わるインスピレーションを呼び起こすことにつなげられる。例えば、ユーザーは、数日ほどで数千枚の画像の生成をウェンシンイーガーにより完了させた後、それらから得たヒントを基に、新たに本格的な画像の制作を行うことができる。
AI生成コンテンツに関わる3つの課題を最新技術で突破
バイドゥによれば、ウェンシンイーガーには、3つのチャレンジングな課題があるという。それは、(1)いかにユーザーのニーズを正確に理解し、ユーザーが入力する記述の難易度を下げるか、(2)いかにユーザー側の作画スタイルの多様なニーズに対応するか、(3)そしていかに出力結果を最適化し、ユーザーの創作ニーズを一定のクオリティーで満たすか、というものだ。
バイドゥは、これら3つの課題を解決するために、テキストとナレッジを入力素材としてオリジナルコンテンツ生成と二次創作が可能な文生図(ウェンシェントゥー)システムを研究開発している。このシステムは、以下の3つの成果を出している。
この記事は会員限定(無料)です。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー