記事内に広告が表示されます

構図とポーズに関するプロンプト【Stable Diffusion web UI】

sd-image スマホ・PC
スポンサーリンク

 ここでは「Stable Diffusion(ステーブル・ディフュージョン)」のキャラクターの描写に関わるプロンプト(呪文)をまとめています。さまざまなプロンプトを上手く組み合わせることで、希望に近いAI画像を生成することができます。

 ただし、キャラクターの構図やポーズの描写に関わるプロンプトは、モデル(チェックポイント)、解像度、その他のプロンプト等の設定によって反映されるかどうかがまったく異なります。

 最近、新しいモニターを購入したのですが、これは画面が見やすくてかなりおすすめです。モニターの買い替えを検討中の方はぜひ以下のページも併せてご覧ください。

24インチ WUXGA の代替は27インチ WQHD で決まり!
Dell「S2721DGF」を購入しました。WQHD(2560×1440)は WUXGA(1920×1200)からの置き換えに最適な解像度です。
「AnimateDiff」によるアニメーションの生成【Stable Diffusion web UI】
「AnimateDiff」という Stable Diffusion web UI 用の拡張機能を利用することでアニメーションGIFが生成できます。
Bing Image Creator によるAI画像生成が劇的な進化を遂げる!
Bing Image Creator が「DALL-E 3」の採用で劇的な進化を遂げました。今では日本語入力で驚くほど高精細な画像が生成できます。
スポンサーリンク

構図とポーズに関するプロンプト

基本的な設定について

sd-image

 プロンプトが公開されているAIイラストをたくさん確認しましたが、構図とポーズの指定にはかなり多くのプロンプトが用いられているようです。複数のプロンプトをうまく組み合わせることで、望んだポーズを再現できることもあります。

 ここでは「Stable Diffusion web UI(AUTOMATIC1111版)」の利用を前提としています。モデルは「anything-v4.0.ckpt」を使用しています。この環境において有効性の特に高いプロンプトを中心にまとめています。ですが、有効性が低くても表現として後々使えそうなものは一部残しています。

 さまざまな構図やポーズが再現されるかどうかを確認するため、シード値や解像度は固定していません。基本としているプロンプトを用意しつつも、それらを追加するプロンプトに応じてやや変更しながら柔軟に対応しています。そのため、異なる設定では再現できないものも含まれていると思われます。予めご了承ください。

 キャラクターのポーズと身体の動きは「ControlNet(コントロールネット)」を利用して操作したほうが思いどおりにできます。
 「ControlNet」の導入と使い方は以下のページをご覧ください。この機能はプロンプトとあわせて活用することで真価を発揮します。
「ControlNet」の導入とその使い方【Stable Diffusion web UI】
ControlNet の導入方法と使い方を初心者向けに紹介しています。ControlNet を導入することでAI画像の構図や人物のポーズを自由に設定できます。

 2023年4月中旬頃に「ControlNet 1.1」がリリースされています。既存のモデルの改良が行われているだけでなく、新しいモデルも追加されています。

「ControlNet 1.1」の新モデルを使用する【Stable Diffusion web UI】
「ControlNet」は今ではAI画像生成に必要不可欠の技術です。その新バージョンである「ControlNet 1.1」の新モデルを色々と試してみました。
ControlNet 1.1 「reference」による参照元画像と類似した画像の生成
「ControlNet 1.1」のプリプロセッサ 「reference only」「reference adain」「reference adain attn」を利用することで参照元と同じスタイルの画像の生成が可能になります。

解像度の指定について

 解像度の縦横指定はとても重要です。512×512(正方形)以外に、512×768(縦長)または768×512(横長)の両方で何度か試してみてください。たとえば、人物が立っている姿を再現したいのに768×512(横長)になっていると思いどおりに表現できないことがあります。反対に、人物が横になっているポーズを再現したいのに512×512や512×768(縦長)では思いどおりにならないことがあります。なお、サンプルの一部は画像を切り抜いています。

 以下のプロンプトをコピペしながら再現できるかどうかを確認してみてください。このページをお気に入りに入れておくと便利です。

 各プロンプトはクラスターごとに分類して記載しています。なお、英語の読み(日本語的な読み)は便宜的に付したものに過ぎません。誤字脱字は追々修正していきます。

 なお、以下の拡張機能を利用することで低VRAMのグラフィックボードをお使いの方でも大きな画像を生成することが可能です。
「MultiDiffusion」による画像の拡大【Stable Diffusion web UI】
「MultiDiffusion with Tiled VAE」という拡張機能を利用することで低VRAMのグラフィックボードでもパノラマ画像や高解像度の画像を生成することが可能です。
スポンサーリンク

キャラクターの構図に関するプロンプト

カメラのアングルについて

 アングルを変えるだけで雰囲気が大きく変わります。

from above
フロムアバァブ
上から 上から撮影したような
from below
フロムビロウ
下から 下から撮影したような
bellowと間違えないように
from side
フロムサイド
横から 横から撮影したような
from behind
フロムビハインド
後から 後ろから撮影したような
dynamic angle
ダイナミックアングル
動的なアングル  
dutch angle
ダッチアングル
ダッチアングル カメラを傾けたような
wide shot
ワイドショット
ワイドショット 広角・遠景
very wide shot
ベリーワイドショット
ベリーワイドショット 超広角・遠景

 広角はモデルによって効かないか、他のプロンプトを上手く組み合わせる必要があるかもしれません。

特殊効果に関するプロンプト【Stable Diffusion web UI】
このページでは背景を無地にしたり吹き出しを表現したりするなどの特別な背景や特殊な効果などに関するプロンプトをまとめて掲載しています。
人物の描写に関するプロンプト【Stable Diffusion web UI】
人物の描写に関するプロンプトをまとめて掲載しています。登場人物の性別や人数、それらの組み合わせ等はプロンプトを調整することで変更できます。

キャラクターの目線・視線について

 視線は基本的にこちらを向いています。

looking at viewer
ルッキングアットビューア
こちらを向く よく使われている
looking at another
ルッキングアナザー
他を見る 効きにくい
looking away
ルッキングアウェイ
よそ見をする 効きにくい
こちらは効くようです!
looking up
ルッキングアップ
こちらを見上げる  
looking down
ルッキングダウン
こちらを見下ろす  
head tilt
ヘッドチルト
頭を傾ける 変化が少ない

 ここで使用しているモデルでは、視線を他に向けさせる場合に「looking away」が有効です。これで自然な画像を生成することができそうです。ただし、3人中1人はこちらを見ているといったことはそれなりにあります。

AIで生成した画像の人物をしゃべらせる方法
生成されたAI画像(または写真)の人物・キャラクターは、別のサービスと組み合わせることで誰でも簡単に喋らせることができます。

特定の身体部位を強調する

 全身を描写してもらいたいという時は、解像度を縦長に設定して「full body」を入れてみてください。「~ focus(~に焦点を当てる)」という表現も便利です。

full body
フルボディ
全身 全身を無理に描写させると
手足が崩れることが多い
face
フェイス
 
face focus
フェイスフォーカス
顔に焦点  
close up
クローズアップ
顔を強調  
 close up ~ 指定部位を拡大強調 効くときもあれば
効かないときも
portrait
ポートレイト

(似顔絵・肖像画)
 
profile
プロフィール
横顔  
cowboy shot
カウボーイショット
頭部から膝あたり
までを撮影
よく使われている
帽子が描かれることも
upper body
アッパーボディ
上半身  
lower body
ロウアボディ
下半身  
foot focus
フットフォーカス
片脚~脚先  
feet focus
フィートフォーカス
両脚から脚先  

 ただし、全身や手足を無理に表現しようとするとおかしくなることが多々あります。一方、顔に関するプロンプトは頭しか描写されないことが多く、手足の表現がおかしくなることは少ないです。

背景に関するプロンプト【Stable Diffusion web UI】
このページでは風景・景色・場所などの背景に関するプロンプトを掲載しています。背景の描写は人物を引き立てて雰囲気や物語性を良くすることに繋がります。
スポンサーリンク

キャラクターのポーズに関するプロンプト

全身の動きをともなうポーズや動作

 キャラクターのポーズや全身の動作に関わるものをまとめています。場所と組み合わせると表現が豊かになります(swimmingで例示)。

standing
スタンディング
立っている 出てこなければ
full bodyと組み合わせる
back view
バックビュー
back viewing
バックビューイング
後ろ姿  
selfie
セルフィー
自撮り 自撮りさせたいときに
スマホが描かれることも
singing
シンギング
歌う マイクを持って
ステージで歌うw
leaning forward
リーニングフォワード
前屈みになる 前屈みや身を乗り
出した感じになる
arched back
アーチドバック
背を逸らす  
dynamic pose
ダイナミックポーズ
ダイナミックポーズ 躍動感のある動きに
背景・ライティングも変わる
stand against the wall
スタンドアゲインスト
ザウォール
standing against the wall
壁を背にして立つ  
running
ランニング
走る 躍動感のある表現に
全身が表示されやすい
walking
ウォーキング
歩く 道を歩いている
walking on water
ウォーキングオンウォター
水面を歩く 他と組み合わせて
幻想的なものも表現可
jumping
ジャンピング
ジャンプする 飛び跳ねる動作
swimming
スイミング
泳ぐ 服の指定がないと
水着になる
 swimming, pool
 swimming in the pool
泳ぐ+プール 背景がプールになる
 swimming, river
 swimming in the river
泳ぐ+川 背景が川になる
 swimming, sea
 swimming in the sea
泳ぐ+海 背景が海になる
 swimming, lake
 swimming in the lake
泳ぐ+湖 湖ぽくない
drink tea
ドリンクティ
紅茶を飲む  
drink coffee
ドリンクコーヒー
コーヒーを飲む  
eating ~
イーティング~
~を食べる 食べものの表現は難しい
箸が出ると指が……
 eating ice cream
イーティングアイスクリーム
アイスを食べる 私も食べたい

一例

sd-image sd-image
standing selfie
sd-image sd-image
singing running
「ControlNet」の導入とその使い方【Stable Diffusion web UI】
ControlNet の導入方法と使い方を初心者向けに紹介しています。ControlNet を導入することでAI画像の構図や人物のポーズを自由に設定できます。

座る(sit/sitting)ことに関する動作

 立ち姿から変化を付けたいときはソファに座らせてみてください。椅子は椅子の形状が崩れやすいです。

sit
シット
sitting
シッティング

座る

椅子、ソファ、ベッド
なども描写される
sit in a chair
シットインアチェア
chair
チェア
椅子に座る

椅子

椅子の表現に難あり

チェアでも座ることが
ある

sit in a sofa
シットインアソファ
sofa
ソファ
ソファに座る

ソファ

ソファの方が違和感なし

ソファでも座ることが
ある

sit against the wall
シットアゲインスト
ザウォール
sitting against the wall
壁を背にして座る  
in the car
インザカー
車の中 車のシートに座っている
in the train
インザトレイン
→ on the train
  オンザトレイン
電車内 電車の座席に座っている
電車に乗っている

 お出かけの演出は車や電車を指定してみてください。

一例

sd-image sd-image
sit in a chair in the train
sd-image sd-image
sofa in the car
オリジナルのモデルを作る【Stable Diffusion web UI】
「Stable Diffusion web UI」のチェックポイントのマージ機能を使うと、誰でも簡単にオリジナルのモデルを作成することができます。

寝る(sleep/sleepy/sleeping)に関する動作

 体を横にするという表現は色々あるようですが、解像度はいずれも768×512のような横長が最適です。

sleeping
スリーピング
睡眠・寝る ブログ主 ( ˘ω˘ )スヤァ…
 sleepy
 スリーピー
眠い・眠そうな  
 sleeping, closed eyes
 ~グローズドアイズ
寝る・目を閉じる 目を閉じないことも多い
 sleeping, hands up
 ~ハンズアップ
寝る、手を上げる 手を上げて横になる
手と組み合わせた例
 sleeping, arms up
 ~アームズアップ
寝る、腕を上げる 腕を上げて横になる
腕と組み合わせた例
lying
ライイング
横たわっている sleepingのほうが
横になる
lying, hands up 手を上げて横になる  
lying, arms up 腕を上げて横になる  
lie on one’s back
ライオンワンズバック
仰向けになる 仰向けにしたいとき
lie on one’s stomach
ライオンワンズストマック
うつ伏せになる うつ伏せにしたいとき

 他の要素と組み合わせて手の位置を調整するとよくなるかもしれません。

一例

sd-image sd-image
sleeping sleepy
「Latent Couple」による人物の描き分け【Stable Diffusion web UI】
「Latent Couple」という拡張機能を利用することで、画面を分割して各領域ごとにプロンプトを効かせて、各人物をうまく描き分けることができるようになります。

手(hand/hands)・指(finger/fingers)に関する動作

 手に関する表現は「指や手を動かすもの」と「何かを持つもの」とに分けられます。

peace sign
ピースサイン
ピース 両手でピースすることも
thumbs up
サムズアップ
親指を立てる  
waving
ウェイビング
手を振る  
salute
サルート
敬礼 ビシッと決めるのが困難
highfive
ハイファイブ
ハイタッチ  
put one’s finger on ~
プットワンズフィンガーオン
~に指をおく  
put her finger on one’s lips
 ~ ワンズリップ
唇に指を当てる 「しぃ~っ」のポーズや
疑問時?のポーズ
join hands
ジョインハンズ
手を合せる  
paw pose
パウポーズ
猫の手 片手の時も両手の時も
claw pose
クロウポーズ
「がお~」みたいな
爪を強調したポーズ
長い爪が生える↓
clawをネガに入れる
holding ~
ホールディング ~
 hold ~
 ホールド ~
~を手に持っている
~を手に持つ
何かを持たせたいときに
 holding cards
  ~カーズ
カードを手に持つ トランプのシーンに
 holding a phone
  ~フォン
電話を手に持つ スマホを持つ
稀にiPhoneを持つw
 holding an apple
  ~アンアップル
リンゴを手に持つ リンゴを手に持つ
 holding an umbrella
  ~アンアンブレラ
傘を持つ 日傘を持っている
天候を指定する↓
 holding an umbrella, rain,
  ~レイン
傘を持つ+雨 雨と組み合わせると
雨傘を持っているように
grabbing ~
グラビング~
~を手で掴む 手で何かを掴むときに
reaching out
リーチングアウト
手を伸ばす
手を差し伸べる
手を前に突き出す
outstretched arms
アウトストレッチドアームズ
大きく手を伸ばす 手が崩れる
hand in my pocket
ハンドインマイポケット
ポケットに手を入れる  

 手や指を強調するとどうしても手指の描画に問題が生じやすいです。ピースサインなどは比較的うまく描かれますが、それでも失敗することがあります。物を持たせて誤魔化す手も。

 他にも修正する手段はあります。詳しくは以下のページをご覧ください。

「Inpaint」を利用した手指の修正【Stable Diffusion web UI】
「Inpaint」は手指などの特定部位の修正や変更に重宝します。ここでは標準搭載版と「ControlNet 1.1」版の両方を試してみました。
「Lama Cleaner」を利用した手指の修正【Stable Diffusion web UI】
画像内の異物を除去できる「Lama Cleaner」は手指の修正にも応用できます。ここではインストール不要のWeb版を紹介しています。

一例

sd-image sd-image sd-image
peace sign thumbs up put finger to lips
sd-image sd-image sd-image
paw pose holding cards holding phone
「negative hand」の適用と手指の表現【Stable Diffusion web UI】
AI画像生成時における手指の表現の改善として「negative hand」などの「Embeddings」を試してみる手があります。
「bad hands 5」の適用と手指の表現【Stable Diffusion web UI】
AI画像生成時における手指の表現の改善策として、今度は「bad hands 5」という「Embeddings」を試してみました。

腕(arm/arms)に関する動作

 手の動作は種類が多いので、腕の動きが中心のものはこちらに集約。

hand up
ハンドアップ
hands up
ハンズアップ
手を上げる  
 hand up,
 elbows on table
 ~エルボオンテーブル
 hands up,
 elbows on table
頬杖をつく
肘をつく
tableやdeskと
組み合わせる
hands on chest
ハンズオンチェスト
手を胸に添える  
hands on hips
ハンズオンヒップス
手を腰に当てる 手を腰に当てる(追加)
arm up
アームアップ
arms up
アームズアップ
腕を上げる 腕を上げたり頭に
添えたり髪に添えたり
arms behind head
アームズビハインドヘッド
腕を頭の後ろで組む 手を隠すことができる
spread arms
スプレッドアームズ
両手を広げる  
crossed arms
クロスドアームズ
手を腰に当てる
腕を組む
記入ミス 手を腰に当てる定番のポーズ
腕を組む定番のポーズ
arms behind back
アームズビハインドバック
腕を後ろに回す  
hand between legs
ハンドビトウィンレッグス
hands between legs
手を脚の間におく 両手を太もものあたりに
hugging ~
ハギング~
~を抱きしめる 何かを抱きしめ
させたいときに
 hugging a stuffed toy
 ~アスタッフドゥトイ
ぬいぐるみを
抱きしめる
ぬいを持たせたいときに
 stuffed toy hug
 スタッフドゥトイハグ
同上  

 手の動作と明確に分けられていないところは後日修正するかもしれません。
(4月3日)crossed armsの説明がhands on hipsのものになっていたので修正しました。

一例

sd-image sd-image
hands up arms behind head
sd-image sd-image
arms up crossed arms
AI画像の生成はグラフィックボードの交換で超快適になる!
グラフィックボードを「GTX 1660 Super」から「RTX 3060」に換装しました。その結果、AI画像生成の処理において画像生成にかかる時間が大幅に短縮されました。

足(foot/feet)・脚(leg/legs)に関する動作

 こちらは足・脚に関する動作や、乗る・跨がるに関する動作です。

crossed legs
クロスドレッグス
脚を組む  
leg up
レッグアップ
片脚を上げる  
squatting
スクワッティング
しゃがむ  
kneeling
ニーリング
膝をつく  
hugging own legs
ハギングオウンレッグス
体育座り  
fetal position
フェイタルポジション
胎位 しゃがんで手を前につく
seiza
正座
正座 正座する
wariza
割座
割座 女の子座りになる
kneeling, looking down,
hands on floor
床に手をつく  
sit astride a horse
シットアストライド
アホース
馬にまたがる  
sit astride a bike
 ~アバイク
自転車にまたがる 自転車が上手く表現されない
sit astride a motorbike
 ~アモーターバイク
バイクにまたがる バイクが上手く表現されない
broomstick riding
ブルームスティック
ライディング
箒にまたがる 箒を持っているだけのことも
riding a bike 自転車に乗る 自転車が上手く表現されない
riding a motorbike バイクに乗る バイクが上手く表現されない

 自転車やバイクは特に表現が困難です。ブレーキレバー等が適当な上に持つところも適当になってしまいます。

一例

sd-image sd-image sd-image
sit astride a horse sit astride a bike squatting
ケースファンを増設してPCケース内のエアフローを改善する
PCケース内が熱でとんでもないことになっていたので、ケースファンを増設してみました。夏に向けて冷却を考えなければいけません。

二人の人物が関わる動作

 二人の人物が関わる表現は、「solo」「1 girl」「1 boy」などの単独の表現を削除した上で、「2 girls」「1 man and 1 boy」などを入力しておく必要があります。

heads together
ヘッズトゥギャザー
頭を近づける Put one’s heads together
は一緒に取り組むの意
face to face
フェイストゥフェイス
顔を寄せる
顔を近づける
 
cheek to cheek
チークトゥチーク
頬を寄せる
(顔を近づける)
 
hug
ハグ
身体を寄せる  
hug from behind
ハグフロムビハインド
後からハグする  
piggyback
ピギーバック
おんぶする  
cuddle 抱っこする  

 上手くいかないこともあります。「握手」等の表現など他にも色々あります。

一例

sd-image sd-image
cheek to cheek piggyback
M.2 SSD の取り付け方法とフォーマットの手順
NVMe接続のM.2 SSD を取り付ける方法とM.2 SSDをフォーマットするやり方について、初心者の方でも分かるように画像付きで詳しく解説しています。

その他のプロンプト一覧

 Webブラウザのタブを切り替えながら、各プロンプトをコピペしてご利用ください。

画像の品質を規定するプロンプト【Stable Diffusion web UI】
多くの画像に使われている品質向上系のプロンプトをまとめて掲載しています。画像の品質を規定するプロンプトは思いどおりの画像を生成するために欠かせません。
ネガティブプロンプトの重要性【Stable Diffusion web UI】
ネガティブプロンプトに関する表現をまとめて掲載しています。ネガティブプロンプトは意図しない表現を抑止するために必要不可欠な要素といえます。
人物の描写に関するプロンプト【Stable Diffusion web UI】
人物の描写に関するプロンプトをまとめて掲載しています。登場人物の性別や人数、それらの組み合わせ等はプロンプトを調整することで変更できます。
髪の描写に関するプロンプト【Stable Diffusion web UI】
髪型や髪色の描写に関するプロンプトをまとめて掲載しています。髪色と髪型を指定することで未指定とは違ったキャラクターを生成することができるようになります。
表情の描写に関するプロンプト【Stable Diffusion web UI】
表情と感情に関する描写についてのプロンプトをサンプル画像とともに多数掲載しています。顔の表現は人物の魅力と印象を大きく左右する重要な要因です。
背景に関するプロンプト【Stable Diffusion web UI】
このページでは風景・景色・場所などの背景に関するプロンプトを掲載しています。背景の描写は人物を引き立てて雰囲気や物語性を良くすることに繋がります。