※日経エンタテインメント! 2022年12月号の記事を再構成

MTVジャパンやユニバーサルミュージックなどで新規事業開発を担ってきた鈴木貴歩氏が、エンターテックの最新キーワードとキーパーソンを探る連載。今月は、「AIによる画像生成」に迫ります。

 近年、様々なジャンルでAIの活用が進んでいます。そのなかで注目を集めているのが「画像生成AI」です。今や、テキストを打ち込むだけで、AIが自動的にイラストや画像を作成してくれるまでに進化を遂げ、そのクオリティーも飛躍的に上がっています。そして2022年8月には、その技術をオープンソースとして無料公開した「Stable Diffusion」(ステーブル・ディフュージョン)がリリースされ、世界的な話題に。国内でも、その画像生成モデルを元に開発されたサービスが続々と誕生しています。その1つである、「AIピカソ」を開発したAIdeaLab代表取締役の冨平準喜氏に、話を聞きました。

画像生成AI
欲しい画像のイメージをテキストで入力し、AIによって画像が生成される技術。なお、出来上がった画像の著作権はテキストを入力した人のものとなる。海外では「Midjourney」「DALL・E2」などに加え、オープンソースの「Stable Diffusion」などが人気を博している。また国内でも「AIピカソ」「Japanese Stable Diffusion」などが誕生。「AIピカソ」は、スマホアプリとしてリリースされ、無料プランでは3枚生成するごとに広告が流れる仕組み。有料プラン(1週間600円)では広告がカットされ枚数制限なく楽しむことができる。
AIピカソ/8月31日にiOS版、9月22日にAndroid版をリリース。画像は「浮世絵風のマイケル・ジャクソン」と入力して生成されたもの
AIピカソ
8月31日にiOS版、9月22日にAndroid版をリリース。画像は「浮世絵風のマイケル・ジャクソン」と入力して生成されたもの

――最近、画像生成AIに関するニュースが目立ちますね。

冨平準喜氏(以下、冨平) 2021年1月に、OpenAIが「CLIP」をリリース。今話題の「Stable Diffusion」の前身となった技術を兼ね備えており、テキストと画像を一緒に学習させることで、あるテキストが打ち込まれたら、こういう画像であると認識できるようになりました。

 そして、22年8月に英国のスタートアップ企業「Stability AI」が「Stable Diffusion」をリリースしました。58.5億枚の画像とテキストのペアが存在するデータベースを備えているだけでなく、AIの構造も大きく変化。例えば、それまでは顔だけ、動物だけしか生成できなかったものが、顔、人物、動物、静物など、自由自在に生成できるようになりました。

 また、オープンソースのため、世界中の研究者やエンジニアが日々アップデートを行っており、進化のスピードが一気に上がったことも大きいですね。近年このような「AIの民主化」が、テキスト、音声などの他ジャンルを含めて進んでいます。一昔前までは大企業が囲っていましたが、公開することで進化を推し進めることが、1つのトレンドになっています。

――「AIピカソ」を開発した経緯とは?

冨平 弊社はもともと画像生成AIに将来性を見出し、メイクアプリ、顔合成アプリなどをリリースしてきました。テキストからイラストや画像を生成する技術も持っていましたが、当時のクオリティーはそこまで高くありませんでした。それが今回、オープンソースの「Stable Diffusion」が出てきたことで、すぐさま開発に着手し、「AIピカソ」のアプリのリリースにこぎつけました。

 独自にチューニングした部分は、テキストを入れて生成される画像が、全体的にアニメ寄りの仕上がりになっていることです。やはり日本では、アニメチックな画像を好む方が多いですからね。

冨平準喜(とみひら・としき)氏 1997年生まれ。筑波大学発のベンチャーとして2021年にAIdeaLabを起業。これまでに「AI議事録取れる君」などをリリース
冨平準喜(とみひら・としき)氏 1997年生まれ。筑波大学発のベンチャーとして2021年にAIdeaLabを起業。これまでに「AI議事録取れる君」などをリリース

繰り返し楽しむユーザーも

冨平 公開後の反響も大きく、10月上旬時点で20万ダウンロードを突破し、約100万枚の画像が生成されています。特にSNSでバズったのが、「西洋絵画風の見返り美人」や「浮世絵風のマイケルジャクソン」などですね。同じテキストを入れても毎回違う画像に仕上がるので、繰り返し楽しんでいる方も多いです。また、生成された画像から、「これはどんなテキストを打ち込んで出来上がったものでしょうか?」と、クイズ形式にして遊んでいるケースもあったりします。

――「画像生成AIによって、イラストレーターの仕事がなくなる」という声もありますが、それについてはどうお考えですか?

冨平 巷でそういうことが言われていたりもしますが、私はそうは思っておりません。むしろ、イラストレーターをサポートするテクノロジーになり得るもので、これからはAIとの共同作業も増えていくのではないかと考えています。これまで手作業で時間が掛かっていた部分などをAIに任せることによって、時間短縮にもつながります。実際、「AIピカソ」には、他のサービスにはないオリジナルの機能として、ラフ画(下絵)をアップすると、その続きをAIが描いてくれるというものもあります。

 今後の「AIピカソ」の展開としては、マンガ家さんがマンガを描く際のサポートツールとしても使ってもらえるレベルにまで、高めていければと思っています。他にもファッション業界で、デザイン画を制作する際に活用してもらえるよう、ファッション領域に特化させたチューニングを行うといったことなども考えています。

【スズキの視点】AIがクリエーターのパートナーに
画像生成AIのオープンソース化、「AIピカソ」のようなサービスから様々なクオリティーの高い画像が生み出されるという流れがとてもエキサイティングです。音楽でもAI作曲のプロダクトが出てきていますが、ここまでのオープンさはまだありません。とはいえ、この数年の間に同様のブレイクスルーが音楽、映像などでも起こる可能性にワクワクしています。私も、AIはクリエーターのサポート/パートナーとしての役割がメーンになっていくと思います。想定外の要素をAIから得ることで、創作の可能性を広げるクリエーターが出てくるでしょう。

(構成/中桐基善)

2
この記事をいいね!する