

「full body」と書いたのに、全身が収まらないのは設計ミスです。
「full body」と入力したのに足元が切れた、または逆に顔がフレームアウトした。漫画キャラの全身図生成でこの失敗を繰り返している場合、原因はプロンプトの単語不足ではなく、「力関係の設計ミス」にあります。
画像生成AIは、プロンプトの前半に書かれた単語を優先的に処理します。つまり、顔の色・目の形・髪型などのディテール描写を大量に前半に並べると、AIは「この絵の主役は顔だ」と判断してバストアップ構図を選ぶのです。その結果、「full body」を後半に書いていても、構図優先度が負けてしまいます。
2つ目の原因は、AIが学習データの影響を強く受けていることです。AIはインターネット上の大量の画像を学習していますが、「portrait(ポートレート)」という単語に紐づく画像は、上半身〜バストアップのものが圧倒的多数でした。そのため「portrait of a character」と書くだけで、意図せず半身構図に誘導されてしまいます。意外ですね。
3つ目の原因は、足元の情報不足です。AIは「意味のない領域」を積極的に描こうとしません。足元に靴の情報・地面の情報・影の情報が一切なければ、「足を描かなくても絵として成立する」と判断してトリミングが発生しやすくなります。つまり、足元まで描かせるには「足元にも意味を持たせる」設計が条件です。
以下の3点を覚えておけばOKです。
- プロンプト前半 に構図指示(`full body`など)を書く
- 「portrait」は全身狙いのときは使わない(半身誘導が強い)
- 足元の情報(靴・地面・影など)を最低1つ加える
参考:全身構図の失敗パターンと解決法をまとめた解説記事
立ち絵×全身画像の正しいプロンプト設計|AIで見切れず描くコツ – ai-nante.com
全身を安定して描かせるためには、まず「全身を描いてほしい」という指示を、プロンプト文の早い段階に配置することが原則です。顔やコーデの指定は、その後に続けます。以下が、最も汎用的に使われる全身指示ワードの一覧です。
| 英語プロンプト | 意味・効果 |
|---|---|
| `full body` | 全身ショット。最も基本的かつ広く使われる |
| `full body visible` | 全身が見えている状態を明示 |
| `entire figure` | イラスト系モデルで特に有効 |
| `from head to toe` | 頭からつま先まで(強調効果が高い) |
| `uncropped` | トリミングされていない状態を指示 |
| `in frame` | フレーム内に収まっていることを指示 |
| `vertical composition` | 縦構図。全身を収めやすくなる |
| `long shot` | 引きのカメラ距離。全体が映りやすくなる |
これらをすべて入れる必要はありません。まず `full body, vertical composition` の組み合わせを試して、それでも失敗するなら `from head to toe` や `uncropped` を追加する、という順番で調整していくのが効率的です。これが基本です。
プロンプトに強度をつけたいときは、`(full body:1.3)` のように数値を使って重みを上げる方法も有効です。逆に、顔のディテール指定(`blue eyes`, `wavy hair` など)は `(blue eyes:0.8)` のように「1以下」で弱めると、構図の力関係が整います。大事なのはバランスということですね。
具体的なプロンプト構成例として、以下のような順番が安定しています。
```
full body visible, vertical composition, from head to toe, uncropped,
キャラクター概要, 髪型・服装, 靴の指定, 背景・シーン描写
```
顔のディテールは後半に回し、全身指示を文頭に固めることで、AIが構図の優先度を正しく認識するようになります。
参考:プロンプトの前後配置と優先度の仕組みについての詳細解説
画像生成AIはプロンプトが重要!イメージ通りに生成するコツ – マウスコンピューター
プロンプトで「全身を描いてほしい」という指示を入れるだけでなく、「足を切らないでほしい」という禁止指示をネガティブプロンプト側に入れることで、成功率が大幅に上がります。これは見落とされがちな重要テクニックです。
Stable Diffusion(SDXL)のように専用のネガティブプロンプト入力欄があるツールでは、以下をそのまま使えます。
| ネガティブプロンプト | 意味 |
|---|---|
| `cropped` | トリミングされた状態を禁止 |
| `cut off` | 切り取られた状態を禁止 |
| `out of frame` | フレームアウトを禁止 |
| `missing feet` | 足が欠けている状態を禁止 |
| `missing head` | 頭が欠けている状態を禁止 |
| `portrait` | バストアップ・上半身構図誘導を防ぐ |
Stable Diffusionのネガティブプロンプト欄ではない、ChatGPTやMidjourneyなどのツールを使っている場合は「`no cropped, no cut off, no missing feet`」のように `no` を頭に付けてプロンプト本文に組み込みます。
さらに見切れが直らない場合は、「足場」を加える方法が効果的です。`standing on a stone floor`(石畳の上に立っている)、`standing on grass`(草の上に立っている)といった情報を加えると、AIが「地面=描くべき場所」と認識して足元まで描写しやすくなります。痛いですね、逆に言えば足場情報ゼロだと失敗率が跳ね上がるということです。
ChatGPTを使っている場合は、日本語で「絶対に全身を入れてください」と同時に書き添えると、会話AIが画像生成AIへの指示に全身強調を伝えてくれるため、成功率が上がるケースもあります。
参考:ネガティブプロンプトの活用事例と具体的な記述方法の解説
Stable Diffusionのネガティブプロンプト利用法とその効果 – EdgeHUB
プロンプトの設計だけでなく、キャンバスのアスペクト比も全身図の成否に直結します。これは知らないと損する設定です。
全身を縦に収めるには、縦長のキャンバスが必須です。正方形(512×512)や横長(768×512)で生成すると、AIは限られたタテ幅に人物をフィットさせようとするため、自動的に足元をカットして上半身だけを描くという選択をしがちです。
推奨されるアスペクト比は以下のとおりです。
| 用途 | 推奨サイズ | アスペクト比 |
|---|---|---|
| 全身立ち絵(標準) | 512 × 768 | 2 : 3 |
| 全身立ち絵(高品質) | 768 × 1024 | 3 : 4 |
| 三面図(正面・横・背面) | 3 : 4(横やや広め) | 幅広縦長 |
| Live2D素材向け | 512 × 768〜768 × 1024 | 2 : 3 〜 3 : 4 |
立ち絵を生成するときは「Width : Height = 1 : 2」の比率に設定すると、頭からつま先まで安定して収まりやすくなります。これが条件です。
SDXLモデルを使う場合は、総ピクセル数を約100万ピクセル(例:768×1024 = 786,432px)前後に保つことが高品質生成の目安とされています。1024×1024を超えてくると構図の安定性が落ちるケースもあるため、まず512×768か768×1024で試すのがおすすめです。
また、キャンバス比率だけでなく、`with extra space above the head and below the feet`(頭の上と足の下に余白を持たせる)というプロンプトを追加することで、AIに「余白ありの全身構図」をさらに強く意識させることができます。これは使えそうです。
参考:SDXLの最適解像度と全身構図向けサイズ設定の詳細
Stable Diffusion|画像サイズの最適解と印刷方法【高画質化】 – Hakky Handbook
漫画のキャラクター設計に使う「三面図(ターンアラウンド)」、つまり正面・側面・背面を1枚にまとめた設定画も、プロンプトで生成できます。一般的なユーザーが見落としがちなのが、三面図には専用のアスペクト比設定が必要だという点です。
Stable Diffusionで三面図を生成する場合、比率を 3:4(幅広の縦長) に設定するのが安定しやすいとされています。通常の立ち絵と同じ 1:2 の縦長にすると、3方向のキャラが縦一列に並んでしまい、横にゆとりがなくなるためです。
三面図生成の基本プロンプト構成はこちらです。
```
full body, three view drawing, (front and side and (back:1.3):1.5), (infographics:1.2),
character design sheet, plain white background, キャラクター外見の詳細
```
このプロンプトでは、`back(背面)` に `1.3` の強調重みを与えています。背面は正面・側面に比べてAIが描くことを後回しにしやすいため、少し強調してバランスを取るのがポイントです。
さらに安定した結果を得たいなら、`character reference sheet`(キャラクター設定資料)や `model sheet`(設定画シート)というワードも追加すると、AIがデザイン資料としての体裁を意識して生成してくれます。キャラクターの服装・髪型・体型をプロンプトに詳細に記述しておくと、3方向でのブレも小さくなります。
なお、三面図は1度の生成で完璧に決まることは少ないのが正直なところです。実際に使われているMidjourneyでのプロンプト調整事例によると、プロンプトを明確に設計することで生成回数を平均3回から1.2回程度に削減できたケースも報告されています。プロンプト設計の精度が、時間の節約に直結するということですね。
参考:MidjourneyとStable Diffusionでの三面図生成プロンプトの実例紹介