※日経エンタテインメント! 2022年12月号の記事を再構成
MTVジャパンやユニバーサルミュージックなどで新規事業開発を担ってきた鈴木貴歩氏が、エンターテックの最新キーワードとキーパーソンを探る連載。今月は、「AIによる画像生成」に迫ります。
近年、様々なジャンルでAIの活用が進んでいます。そのなかで注目を集めているのが「画像生成AI」です。今や、テキストを打ち込むだけで、AIが自動的にイラストや画像を作成してくれるまでに進化を遂げ、そのクオリティーも飛躍的に上がっています。そして2022年8月には、その技術をオープンソースとして無料公開した「Stable Diffusion」(ステーブル・ディフュージョン)がリリースされ、世界的な話題に。国内でも、その画像生成モデルを元に開発されたサービスが続々と誕生しています。その1つである、「AIピカソ」を開発したAIdeaLab代表取締役の冨平準喜氏に、話を聞きました。
――最近、画像生成AIに関するニュースが目立ちますね。
冨平準喜氏(以下、冨平) 2021年1月に、OpenAIが「CLIP」をリリース。今話題の「Stable Diffusion」の前身となった技術を兼ね備えており、テキストと画像を一緒に学習させることで、あるテキストが打ち込まれたら、こういう画像であると認識できるようになりました。
そして、22年8月に英国のスタートアップ企業「Stability AI」が「Stable Diffusion」をリリースしました。58.5億枚の画像とテキストのペアが存在するデータベースを備えているだけでなく、AIの構造も大きく変化。例えば、それまでは顔だけ、動物だけしか生成できなかったものが、顔、人物、動物、静物など、自由自在に生成できるようになりました。
また、オープンソースのため、世界中の研究者やエンジニアが日々アップデートを行っており、進化のスピードが一気に上がったことも大きいですね。近年このような「AIの民主化」が、テキスト、音声などの他ジャンルを含めて進んでいます。一昔前までは大企業が囲っていましたが、公開することで進化を推し進めることが、1つのトレンドになっています。
――「AIピカソ」を開発した経緯とは?
冨平 弊社はもともと画像生成AIに将来性を見出し、メイクアプリ、顔合成アプリなどをリリースしてきました。テキストからイラストや画像を生成する技術も持っていましたが、当時のクオリティーはそこまで高くありませんでした。それが今回、オープンソースの「Stable Diffusion」が出てきたことで、すぐさま開発に着手し、「AIピカソ」のアプリのリリースにこぎつけました。
独自にチューニングした部分は、テキストを入れて生成される画像が、全体的にアニメ寄りの仕上がりになっていることです。やはり日本では、アニメチックな画像を好む方が多いですからね。
繰り返し楽しむユーザーも
冨平 公開後の反響も大きく、10月上旬時点で20万ダウンロードを突破し、約100万枚の画像が生成されています。特にSNSでバズったのが、「西洋絵画風の見返り美人」や「浮世絵風のマイケルジャクソン」などですね。同じテキストを入れても毎回違う画像に仕上がるので、繰り返し楽しんでいる方も多いです。また、生成された画像から、「これはどんなテキストを打ち込んで出来上がったものでしょうか?」と、クイズ形式にして遊んでいるケースもあったりします。
――「画像生成AIによって、イラストレーターの仕事がなくなる」という声もありますが、それについてはどうお考えですか?
冨平 巷でそういうことが言われていたりもしますが、私はそうは思っておりません。むしろ、イラストレーターをサポートするテクノロジーになり得るもので、これからはAIとの共同作業も増えていくのではないかと考えています。これまで手作業で時間が掛かっていた部分などをAIに任せることによって、時間短縮にもつながります。実際、「AIピカソ」には、他のサービスにはないオリジナルの機能として、ラフ画(下絵)をアップすると、その続きをAIが描いてくれるというものもあります。
今後の「AIピカソ」の展開としては、マンガ家さんがマンガを描く際のサポートツールとしても使ってもらえるレベルにまで、高めていければと思っています。他にもファッション業界で、デザイン画を制作する際に活用してもらえるよう、ファッション領域に特化させたチューニングを行うといったことなども考えています。
(構成/中桐基善)