少し前にAIグラビア画像の出版が話題になりましたが、これの動画バージョンであるグラビア動画が作れるのかという試みはあまりなされていないようなので、今回はどこまで可能なのか試してみました。特に本記事では、実際にAIを活用したグラビア動画の生成方法、シチュエーション別のプロンプト例、実際の生成動画について解説していきます。
使用した動画生成AIモデルについて
この記事では、Luma AIのDream Machineを用いています。テキストからの動画生成、画像からの動画生成の両方に対応しており、また無料である程度の枚数は生成することが可能です。
使い方や導入方法については下記にて説明していますので、よろしければご覧ください。
また、Runway AIのGen-3 alphaでも試してみましたが、水着をプロンプト中に含んでいると、下記のような画面が出てきて生成できませんでした。おそらく水着動画がポリシー違反に該当しているのでしょうね。
生成AIによるグラビア動画生成の基本
AI動画生成の基礎知識
Luma Dream Machineのような生成AIを用いて動画生成する場合には、基本的には「テキストベースでの動画生成」と「画像からの動画生成」の2つの手法が主にあります。
前者においては、テキストとしての指示文であるプロンプトが最重要になってきます。また後者の「画像からの動画生成」を行う場合でも、テキストプロンプトは併用することが出来ますし、画像そのものを画像生成AIによって作る場合にも重要な部分です。
グラビア動画生成におけるプロンプトの概要
グラビア動画という観点で考えると、モデルの外見や衣装、ポーズ、背景、照明などを具体的かつ詳しくプロンプトに入れることで、生成される動画の質が向上することが期待できます。
ここでは特に重要な要素である、「モデルの詳細」、「シチュエーション」、「雰囲気とカメラワーク」という3つの観点から、プロンプト作成のポイントを紹介します。
- モデルの詳細
- 外見: モデルとなる人物の特徴。例えば、髪型、髪色、目の色、肌の色、身長、体型など。
- 衣装: 衣装のデザインや色、質感。特にグラビアに適しているのは、水着やランジェリー、ビキニなど。
- ポーズ: モデルが取るポーズ。例えば、「砂浜で横たわる」「プールサイドでリラックスする」「カメラに向かって微笑む」など。
- シチュエーション
- 背景: 主に場所の観点で、ビーチ、リゾート、プールなどのシチュエーション。背景の特徴(青空、夕日、ヤシの木など)も含めると良い。
- 照明: 自然光、スタジオの照明、柔らかい光やコントラストのある照明など。
- 雰囲気とカメラワーク
- 雰囲気: どういう雰囲気の映像かについて。優雅な感じなのか、リラックス雰囲気にするのかなど。
- カメラワーク: カメラの動きやアングルの指定。スローモーションやパン、ズームなどが具体例。
シチュエーション別プロンプト例
それでは、さきほどの要素を元にしてシチュエーション別のプロンプト例と、実際の生成動画について紹介してきます。
1. ビーチでのグラビア動画
下記プロンプトを用いて、テキストからの動画生成を行った例です。黒髪の日本人女性をモデルとして、夕日のビーチでのシチュエーションとしています。
プロンプト例:
A high-resolution video of a beautiful Japanese model with long black hair, fair skin, and slender figure, wearing a white bikini on a tropical beach at sunset. She poses elegantly, lying on the sandy shore with her body slightly arched, her gaze soft and inviting. The background features a serene ocean, gently swaying palm trees, and the warm glow of the setting sun. The natural lighting highlights the model's features, creating a soft and romantic atmosphere. The camera slowly pans across her figure, capturing her expressions and movements with close-up shots.
2. スタジオでのグラビア動画
下記プロンプトを用いて、テキストからの動画生成を行った例です。赤いドレス姿の黒髪の日本人女性をモデルとして、白いソファでのシチュエーションとしています。
プロンプト例:
A high-resolution video of an elegant Japanese model with long, wavy dark hair, and smooth olive skin, wearing a form-fitting red dress in a modern studio setting. She stands confidently by a sleek white sofa, her hand resting on her hip, her pose exuding sophistication and allure. The studio lighting casts dramatic shadows that accentuate her curves, while soft, diffused light highlights her face. The background is minimalist, with muted tones that focus attention on the model. The camera moves in a slow circular motion around her, capturing the depth and texture of the scene.
3. 花畑でのロマンチックなグラビア動画
下記プロンプトを用いて、テキストからの動画生成を行った例です。金髪の日本人女性をモデルとして、花畑を散策するようなシチュエーションとしています。
プロンプト例:
A high-resolution video of a lovely Japanese model with shoulder-length blonde hair, and porcelain skin, wearing a flowing pastel-colored dress in a vibrant flower field during the golden hour. She gracefully strolls through the flowers, occasionally bending down to touch the petals, her smile soft and serene. The background is a sea of blooming flowers with a warm, golden glow from the setting sun. The natural lighting creates a dreamy, ethereal atmosphere. The camera follows her movements, occasionally capturing close-ups of her face as she gazes thoughtfully at the horizon.
4. 画像からのグラビア動画生成
続いて、画像を元にして動画生成した事例に移ります。用いた画像自体もAIで生成していて、今回はChatGPT (DALL-E 3)で生成した画像を元にしています。
ChatGPTでの画像生成の概要や方法については下記記事でまとめていますので、よろしければご覧ください。
夕焼け時の砂浜
こちらは夕焼け時のビーチでの女性の画像を生成したのちに、それを最初の1シーンとして動画生成したものです。
画像生成時のプロンプトは下記を使用しています。
A Japanese girl with long, flowing black hair and a soft, natural smile, standing on a sandy beach at sunset. She is wearing a white bikini. The background features the calm ocean. The atmosphere is serene and inviting, with soft waves gently lapping at the shore. The overall mood is peaceful and radiant, capturing the essence of a classic gravure photo shoot.
そうすると本記事のアイキャッチ画像が生成されるので、それをベースにして画像から動画化しています。今回は、動画化の際にテキストプロンプトはなしとしています。
プールサイド
こちらはシチュエーションを変えて、プールサイドでの画像を元にしたものです。こちらも基本的には同様で、プールサイドの人物の画像を作ってから、Dream machine上でアップロードして生成したものです。
AIでのグラビア動画生成まとめ
本記事では、生成AI (Dream machine)を用いた、グラビア動画生成の基本的な考え方とプロンプト事例を解説しました。特にシチュエーションごとの動画生成の実例を見てきましたが、短時間の動画時間であれば、ある程度自然なグラビア動画を生成することが可能なのではないでしょうか。
また、今回の事例から分かるように、Luma Dream machineで「テキストから動画生成」した場合には、動きを大きくしやすいものの、動画の解像度には少し難があるように感じられます。また、「画像から動画生成」した場合には、画質や人物像のクオリティは高いのですが、動きが小さめになりやすい(大きいと破綻しやすい)ので、一長一短な部分があります。この辺の両取りをするのが現状は難しいところだと思われます。
コメント