今回は、画像生成AIを用いたAIイラスト作成の中でも、「画風」に関するプロンプトについて取り上げます。イラストの画風や絵柄が変わるだけでも、イラスト全体の持つ雰囲気は大きく変わってくるため、非常に重要です。この記事では、特に同じキャラクターをベースにしたスタイルや画風の変え方について紹介するとともに、代表的なスタイルからちょっと個性的なスタイルまで、幅広く解説します!
使用している画像生成のモデルについて
まず今回使用しているのは、ChatGPT内に組み込まれているDALL-E3という画像生成AIになります。DALL-E3は日本語で指示することで、かなり簡易的なプロンプト(説明、指示文)であっても、こちらの意図を汲み取った高品質な画像を生成してくれる点がメリットです。
有料のChatGPT plusに加入する必要はありますが、画像生成としては初心者向けなのでおすすめです。使い方などの概要については下記記事にてまとめています。

一方でデメリットも何点かあるのですが、その中でも「キャラクターの同一性の保持」が厄介です。この「キャラクターの同一性の保持」に対して幾つかやり方を検討しているので、今後別の記事で紹介する予定ですが、今回は「キャラクターの同一性が保持」された場合、各種スタイル(画風)を適用することで、どれだけキャラクターに多様性の幅が出るのかを確認してみました。
(追記)同一キャラクターの生成方法については下記で説明していますので、良かったらご覧下さい!

用いるキャラクター紹介
画風を変更していくにあたって、基本キャラクターとして用いたのは、下記の「セーターを着た銀髪のアニメ風のキャラクター」。

生成に用いたプロンプトは下記です。読めばわかる通り、そこまで詳細には指示を出していません。それにも関わずこのクォリティの画像を生成するのは、DALL-E3の解釈力の高さがうかがえます。
Prompt: “A Japanese anime-style high school girl with silver hair. She has long, flowing silver hair and bright blue eyes. She wears a casual home outfit, a cozy sweater and skirt. The girl’s expression is focused and thoughtful, typical of someone deeply engaged in creative work.”
検証用には、比較的シンプルでそこまで個性的ではないほうが、画風や絵柄の違いによる影響が分かりやすいのではないかと考えて、こういったキャラクターとしています。
様々な画風・スタイル・絵柄でのAIイラストの生成
以下、各種異なる画風やスタイルを適用した画像を紹介していきます!生成時に使用したプロンプトも合わせて示していますので、参考になれば幸いです。
三面図
プロンプト:three-view diagram of a character

オーソドックスな三面図。
場合によってはサイド画像が出ないこともあるが、この画像はまずまず。
イラスト系
元画像がアニメ風なので、イラストでスタイル変更するのはかなり得意そうでした。元画像の特徴を残しつつ、要求に沿ったものが生成できています。
プロンプト:soft, faint lines and a light color palette to create a dreamlike and fragile appearance

儚く線細めで作成。
要求通りの描写が反映されつつ、高品質な画像となっている。
プロンプト:emphasizes vibrant, saturated colors to create a lively and visually striking image

色彩豊かにしたもの。
これも要求に叶ったアレンジがなされている。
プロンプト:”artistic interpretation”, “abstract and expressive style, blending vibrant colors and fluid forms”

アーティスティックなスタイル。
芸術的で迫力のある仕上がりになっている。
プロンプト:a flat, casual design

フラットでカジュアルなスタイル。
これまでとは異なり簡素化する方向性でも、意図した通りの出来栄えとなっている。

クールなスタイルにしたもの。
クールの解釈に引っ張られて目つきが変わっているが、それ以外はイメージ通り。
プロンプト:incorporating elements of lightning for a dynamic effect

雷のイメージを加えたもの。
これもイメージ通りだが、セーターの模様も雷に引っ張られている。

モノクロ+和風テイスト。
和風の指示が強く出たのか、服装が和服に代わってしまっているが、それを除けば元画像の特徴をうまく残している。
プロンプト:natural and simple hand-drawn sketch

線画。
特に指示は出していないが、なぜか大きさ違いが生成。
線画のプロンプトに関しては下記記事にてまとめていますので、こちらもどうぞご覧ください。

またアニメ風のイラストに関しては下記記事にてまとめています。

漫画系
漫画系の画風についても、イラスト系と同様に全体的に満足できる出来だと思います。唯一4コマ漫画にするのは難しく、ここはプロンプトなりで工夫の余地がありそうです。
プロンプト:A manga style illustration aimed at elementary school children

子供向け漫画風。
少しファンシーな感じ。最初に想定したのとは違うが、これはこれでありそうな印象。
プロンプト:in an American comic book style

アメコミ風。
彫りが深く、線も太い。これもアメコミ感が伝わる。

1990年代の少年漫画風。
少し髪型の同一性が弱く、ヤンキー感出ているが、当時のマガジンとかに出てきそうではある。
プロンプト:1980s retro illustration style

1980年代の少年漫画風。
これも髪型以外はイメージ通り。
プロンプト:four-panel comic

4コマ漫画風。
ショートカットになっており、キャラクターの同一性は低い。また4コマの内容も謎のシュールさが漂う。
ゲーム系
ゲーム系の画像生成も指示したプロンプトを反映した上で、十分に高い品質が得られます。以下は実際に生成した画像です。
プロンプト:pixel art representationとした事例

ドット画。
これは結構イメージ通りの出来栄え。
プロンプト:Minecraft-style game character based

マイクラ風。
ちょっと解像度が高すぎるのと、何故か分身している。髪の表現も雑な印象。

スマホゲーム風。
イラストのまま髪色や髪型が変わっている。
デフォルメ系
デフォルメは意外と得意で、どれも文句のない出来でした。
プロンプト:chibi style

ちびキャラ。
元画像の要素を十分残しつつ、かなり上手くデフォルメしている。

ゆるキャラ風としたもの。
よりデフォルメが進んでいるが、この状態でも原型のイメージを十分残している。

ラインスタンプ風。
プロンプト:Nendoroid-style image of

ねんどろいど風。
想像よりもリアルな質感だが、再現度高いし、市販されていそうな雰囲気すらある。
プロンプト:image of a figurine depicting

フィギュアバージョン。
ねんどろいどが思いのほかレベル高かったので追加。
ちびキャラ系のプロンプトについては、下記でより詳しくまとめていますので、よろしければこちらもどうぞ。

サブカル系
続いてサブカル系のテイストを入れた画像。これもイラストの派生なので、生成自体は上手くできているものの、元の情報は少し無視されている傾向にあるようです。

ボカロ風。
イメージは妥当。ただ、哀愁を感じる表情に変更されていたり、服装もセーターではない。

Vtuber風。
これもセーターは無視されている。何故かネコ耳に…。

未来風。
サイボーグ化
リアル系
リアル化はクオリティはさておき、キャラクターの同一性という観点では少し物足りない部分があります。とはいえ、そもそも正解となる画像が、人間にとってもイメージしにくい領域なので、そういう意味では及第点なのかもしれません。
プロンプト:realistic portraitとした画像

リアル風。
CG感がそこそこ出ている。

実写映画風。
これも質感がCGっぽいし、元画像の印象からも少し違う。
リアル系については、下記でクオリティ高める方法を紹介していますので、こちらもどうぞ。

アート系
アート系も満足度高い出来栄えでした。気になる点としては、総じて顔の部分や目の部分に対して、スタイルが適用されにくいようです。
プロンプト:style of Vincent van Gogh

ゴッホの絵画風。
ゴッホ感出ており良い出来栄えだが、顔の部分はアニメ風のイラストのまま。
プロンプト:Cubism-style depiction

キュビズム風。
これも顔の部分だけ適用されていない。
プロンプト:mosaic art crafted using colorful tiles

モザイクアート風
これも同じ。
プロンプト:using the scratchboard art technique

スクラッチ技法
プロンプ:rendered in a Pop Art style

ポップアート風

教会ステンドグラフ風。
これも顔や肌の部分はステンドグラス化されていない。
AIイラストの画風・スタイル・絵柄に関するまとめ
全体通して見ると、こちらの意図に近く、かつ高品質な画像が多く、DALL-E3の優秀さが再確認できました。同一のキャラクターを基にしていても、どういうスタイルで描写するかで印象はがらりと変わるため、表現の奥深さが分かります。TPOに応じて上手く選べるとよいのではないでしょうか。
今回は、スタイル(画風)に焦点を当てましたが、他にもキャラクターの表情や動作であったり、背景の描写であったり、構図であったり、同じキャラクターを基にしていても、まだまだ変更できる点は多くあります。これらを組み合わせていくと、プランニング次第で可能性は無限にあるのだろうと感じました。
追加で、画風や絵柄に類似した「タッチ」の変更についても下記記事で紹介していますので、よろしければこちらもご覧ください。

また、AIイラスト関係のプロンプト全般については、下記記事にてまとめていますので、こちらもどうぞご覧ください。

この記事で使用した技術や具体的な画像例に興味がある場合は、ぜひ実際に試してみてください。AIの力を借りて、独自のアートを創造する旅は思ったより奥深くて面白いものです。
コメント