最近、画像生成AIの利用は広まってきていますが、私自身も画像生成AIを用いたAIイラスト作成にハマったので、いくつか検証していることを共有したいと思います。この記事では、特に同じキャラクターをベースにしたスタイルや画風の変え方について紹介します。
使用しているモデルについて
まず私が使用しているのは、ChatGPT 4で用いられているDALL-E3というソフトになります。DALL-E3は日本語で指示することで、かなり簡易的なプロンプト(説明文)であっても、こちらの意図を汲み取った高品質な画像を生成してくれる点がメリットです。
有料のChatGPT plusに加入する必要はありますが、画像生成としては初心者向けなのでおすすめです。使い方などの概要については下記記事にてまとめています。
一方でデメリットも何点かあるのですが、その中でも「キャラクターの同一性の保持」が厄介です。この「キャラクターの同一性の保持」に対して幾つかやり方を検討しているので、今後別の記事で紹介する予定ですが、今回は「キャラクターの同一性が保持」された場合、各種スタイル(画風)を適用することで、どれだけキャラクターに多様性の幅が出るのかを確認してみました。
(追記)同一キャラクターの生成方法については下記で説明していますので、良かったらご覧下さい!
用いるキャラクター紹介
基本キャラクターとして用いたのは、下記の「セーターを着た銀髪のアニメ風のキャラクター」。
生成に用いたプロンプトは下記です。読めばわかる通り、そこまで詳細には指示を出していません。それにも関わずこのクォリティの画像を生成するのは、DALL-E3の解釈力の高さがうかがえます。
Prompt: “A Japanese anime-style high school girl with silver hair. She has long, flowing silver hair and bright blue eyes. She wears a casual home outfit, a cozy sweater and skirt. The girl’s expression is focused and thoughtful, typical of someone deeply engaged in creative work.”
検証用には、比較的シンプルでそこまで個性的ではないほうが、画風やスタイルによる影響が分かりやすいのではないかと考えて、こういったキャラクターとしています。
様々な画風・スタイルでのAIイラストの生成
以下、各種異なる画風やスタイルを適用した画像を紹介していきます!
三面図
プロンプト:three-view diagram of a character
オーソドックスな三面図。
場合によってはサイド画像が出ないこともあるが、この画像はまずまず。
イラスト系
元画像がアニメ風なので、イラストでスタイル変更するのはかなり得意そうでした。元画像の特徴を残しつつ、要求に沿ったものが生成できています。
プロンプト:soft, faint lines and a light color palette to create a dreamlike and fragile appearance
儚く線細めで作成。
要求通りの描写が反映されつつ、高品質な画像となっている。
プロンプト:emphasizes vibrant, saturated colors to create a lively and visually striking image
色彩豊かにしたもの。
これも要求に叶ったアレンジがなされている。
プロンプト:”artistic interpretation”, “abstract and expressive style, blending vibrant colors and fluid forms”
アーティスティックなスタイル。
芸術的で迫力のある仕上がりになっている。
プロンプト:a flat, casual design
フラットでカジュアルなスタイル。
これまでとは異なり簡素化する方向性でも、意図した通りの出来栄えとなっている。
クールなスタイルにしたもの。
クールの解釈に引っ張られて目つきが変わっているが、それ以外はイメージ通り。
プロンプト:incorporating elements of lightning for a dynamic effect
雷のイメージを加えたもの。
これもイメージ通りだが、セーターの模様も雷に引っ張られている。
モノクロ+和風テイスト。
和風の指示が強く出たのか、服装が和服に代わってしまっているが、それを除けば元画像の特徴をうまく残している。
プロンプト:natural and simple hand-drawn sketch
線画。
特に指示は出していないが、なぜか大きさ違いが生成。
漫画系
イラスト同様、全体的に満足できる出来だと思います。唯一4コマ漫画にするのは難しく、ここは改良の余地がありそうです。
プロンプト:A manga style illustration aimed at elementary school children
子供向け漫画風。
少しファンシーな感じ。最初に想定したのとは違うが、これはこれでありそうな印象。
プロンプト:in an American comic book style
アメコミ風。
彫りが深く、線も太い。これもアメコミ感が伝わる。
1990年代の少年漫画風。
少し髪型の同一性が弱く、ヤンキー感出ているが、当時のマガジンとかに出てきそうではある。
プロンプト:1980s retro illustration style
1980年代の少年漫画風。
これも髪型以外はイメージ通り。
プロンプト:four-panel comic
4コマ漫画風。
ショートカットになっており、キャラクターの同一性は低い。また4コマの内容も謎のシュールさが漂う。
ゲーム系
ゲーム系の画像も十分な品質。とはいえ、イラスト・漫画に比べると、どっちつかずの部分も。
プロンプト:pixel art representationとした事例
ドット画。
これは結構イメージ通りの出来栄え。
プロンプト:Minecraft-style game character based
マイクラ風。
ちょっと解像度が高すぎるのと、何故か分身している。髪の表現も雑な印象。
スマホゲーム風。
イラストのまま髪色や髪型が変わっている。
デフォルメ系
デフォルメは意外と得意で、どれも文句のない出来でした。
プロンプト:chibi style
ちびキャラ。
元画像の要素を十分残しつつ、かなり上手くデフォルメしている。
ゆるキャラ風としたもの。
よりデフォルメが進んでいるが、この状態でも原型のイメージを十分残している。
ラインスタンプ風。
プロンプト:Nendoroid-style image of
ねんどろいど風。
想像よりもリアルな質感だが、再現度高いし、市販されていそうな雰囲気すらある。
プロンプト:image of a figurine depicting
フィギュアバージョン。
ねんどろいどが思いのほかレベル高かったので追加。
サブカル系
これもイラストの派生なので、生成自体は上手くできているものの、元の情報は少し無視されている傾向にあるようです。
ボカロ風。
イメージは妥当。ただ、哀愁を感じる表情に変更されていたり、服装もセーターではない。
Vtuber風。
これもセーターは無視されている。何故かネコ耳に…。
未来風。
サイボーグ化
リアル系
リアル化はクオリティはさておき、キャラクターの同一性という観点では少し物足りない部分があります。とはいえ、そもそも正解となる画像が、人間にとってもイメージしにくい領域なので、そういう意味では及第点なのかもしれません。
プロンプト:realistic portraitとした画像
リアル風。
CG感がそこそこ出ている。
実写映画風。
これも質感がCGっぽいし、元画像の印象からも少し違う。
リアル系については、下記でクオリティ高める方法を紹介していますので、こちらもどうぞ。
アート系
アート系も満足度高い出来栄えでした。気になる点としては、総じて顔の部分や目の部分に対して、スタイルが適用されにくいようです。
プロンプト:style of Vincent van Gogh
ゴッホの絵画風。
ゴッホ感出ており良い出来栄えだが、顔の部分はアニメ風のイラストのまま。
プロンプト:Cubism-style depiction
キュビズム風。
これも顔の部分だけ適用されていない。
プロンプト:mosaic art crafted using colorful tiles
モザイクアート風
これも同じ。
プロンプト:using the scratchboard art technique
スクラッチ技法
プロンプ:rendered in a Pop Art style
ポップアート風
教会ステンドグラフ風。
これも顔や肌の部分はステンドグラス化されていない。
AIイラストの画風・スタイルに関するまとめ
全体通して見ると、こちらの意図に近く、かつ高品質な画像が多く、DALL-E3の優秀さが再確認できました。同一のキャラクターを基にしていても、どういうスタイルで描写するかで印象はがらりと変わるため、表現の奥深さが分かります。TPOに応じて上手く選べるとよいのではないでしょうか。
今回は、スタイル(画風)に焦点を当てましたが、他にもキャラクターの表情や動作であったり、背景の描写であったり、構図であったり、同じキャラクターを基にしていても、まだまだ変更できる点は多くあります。これらを組み合わせていくと、プランニング次第で可能性は無限にあるのだろうと感じました。
追加で、「タッチ」の変更についても下記記事で紹介していますので、よろしければこちらもご覧ください。
補足
この記事で使用した技術や具体的な画像例に興味がある場合は、ぜひ実際に試してみてください。AIの力を借りて、独自のアートを創造する旅は思ったより奥深くて面白いものです。
コメント