「赤い服の女の子と青い服の女の子を描きたいのに、なぜか2人とも紫色の服になってしまう」といった経験はありませんか。
これはStable Diffusionがプロンプトの言葉を全て混ぜて処理してしまうために起こる現象です。
この記事を読めば、拡張機能や特定の書き方を使いこなし、複数のキャラクターを狙い通りに描き分けるテクニックが身につきます。
複数のキャラクターを描き分ける最も確実な方法は拡張機能を使うこと
標準のプロンプト入力欄だけで複数人を描き分けるのは、実はかなり難易度が高い作業です。
AIは言葉の境界線を理解するのが苦手なため、色や特徴が隣のキャラに移ってしまう「色移り」が頻繁に起こります。
最も確実な解決策は、画面を物理的に分割して「ここにはこのキャラを描く」とAIに直接指示を出す拡張機能を取り入れることです。
標準プロンプトだけで色が混ざってしまう仕組み
AIは入力された単語を一つの袋に入れてシャッフルするように処理します。
「赤い服」と「青い服」という言葉が同じプロンプトにあると、どちらが誰のものか判断できず、色が混ざって出力されます。
これを専門用語では「アテンションの混濁」と呼びますが、要はAIが混乱している状態です。
言葉だけで解決しようとせず、ツールの力を借りて物理的に領域を分けることが成功への近道になります。
画面を物理的に分けるRegional Prompterの威力
Regional Prompterは、1枚のキャンバスを縦や横に分割して、エリアごとに異なるプロンプトを適用できるツールです。
このツールを使えば、左側は「赤い髪の戦士」、右側は「青い服の魔法使い」といった具合に、指示を完全に分離できます。
操作も直感的で、境界線の位置を数値で細かく指定することも可能です。
色移りに悩まされているなら、この機能を導入するだけでストレスの9割は解消されます。
2人の位置を固定するLatent Coupleのメリット
Latent Coupleは、Regional Prompterと同じように領域を分けるツールですが、より座標指定に近い感覚で使えます。
「この四角い枠の中にはAさん、あっちの枠にはBさん」と、重なり具合まで含めて細かくレイアウトを組めるのが強みです。
背景と人物を切り離して描画することもできるため、複雑な構図には欠かせません。
キャラ同士の距離感を詰めたり、逆に大きく離したりといった調整も思いのままに行えます。
Stable Diffusionで色混ざりを防ぐプロンプトの記述ルール
拡張機能を使わなくても、プロンプトの書き方を工夫するだけで色の混ざりを抑えることは可能です。
AIが単語を処理する順番や、言葉同士の結びつきの強さをコントロールするテクニックを使いましょう。
プロンプトの記述ルールを少し変えるだけで、今まで混ざり合っていた色が嘘のように独立して表現されるようになります。
1人目と2人目を識別させる単語の並び順
プロンプトでは、人物の特徴を書く際に「1girl, red hair」と「1girl, blue hair」をカンマで区切るのが一般的です。
しかし、これだけではAIは「女の子が2人で、髪色は赤と青のどっちか」と解釈してしまいます。
そこで、「first girl has red hair, second girl has blue hair」のように順序や対象を明確にする言葉を添えてみてください。
AIがどの単語をどの被写体に紐づけるべきか、ヒントを与えることが大切です。
キャラクターの特徴を強調するカッコの使い方
どうしても色が混ざる単語には、カッコを使って強調の数値を入れましょう。
「(red dress:1.3)」のように記述することで、AIはその色の優先度を上げ、他の色に負けないように描画してくれます。
カッコは入れ子にすることもできますが、あまりやりすぎると画像全体が崩れる原因になります。
1.1から1.4あたりの数値で微調整しながら、色が独立するポイントを探ってみてください。
髪や服の色が隣へ移るのを防ぐプロンプトの工夫
色移りを防ぐには「solid color(単色)」や「isolated color(独立した色)」といった言葉を添えるのも一つの手です。
また、背景に無関係な色が混じらないよう「simple background」を指定しておくのも効果があります。
プロンプトの最後に、反対の色をネガティブプロンプトへ入れることも忘れないでください。
「赤」を出したいならネガティブに「blue, green」を入れることで、色が濁るのを防ぐガードになります。
画面を分割して個別に指示を出すRegional Prompterの設定
複数人の描き分けにおいて、2026年現在も最も信頼されているのが「Regional Prompter」です。
この拡張機能は、WebUIの「Extensions」タブからURLを入れてインストールするだけで使い始められます。
画面を「行列(マトリックス)」に見立てて分割し、それぞれのマス目にプロンプトを流し込む設定をマスターしましょう。
縦や横にエリアを分けるMatrixモードの使い方
Matrixモードは、画面を「1:1」や「1:2」といった比率で等分に分ける設定です。
例えば、横に2分割したいなら比率を「1,1」に設定するだけで、左半分と右半分に領域が分かれます。
これにより、左側には1人目のプロンプト、右側には2人目のプロンプトが適用されます。
最もシンプルで使い勝手が良いため、まずはこのモードから慣れていくのがおすすめです。
各領域にプロンプトを割り当てる記述のルール
Regional Prompterでは「BREAK」や「ADDCOL」といった特殊な単語を使ってプロンプトを区切ります。
最初に全員に共通する設定(背景など)を書き、その後に各エリアの個別の特徴を書いていく流れです。
プロンプトの構成を間違えると機能しないため、区切り文字の入れ方には注意が必要です。
以下の引用ブロックのような形式で書くと、AIは正しく領域を認識してくれます。
(masterpiece, best quality:1.2), 2girls, forest background, cinematic lighting
BREAK
(blonde hair, red dress:1.2), happy girl, smiling, standing on left
BREAK
(black hair, blue maid outfit:1.3), cool girl, looking at viewer, standing on right
境界線の馴染み具合を調整するマスク設定
領域を分けると、キャラの境界線が不自然にパキッと分かれてしまうことがあります。
これを防ぐために「Mask」の設定から、境界線の重なり具合を調整しましょう。
数値を少し上げることで、隣り合う領域同士が自然に混ざり合い、一枚の絵としてのまとまりが生まれます。
「分ける」だけでなく「馴染ませる」設定まで行うのが、クオリティを上げるプロの技です。
| 項目 | 設定内容 | メリット |
| Divide mode | Horizontal / Vertical | 縦横の分割を自由に選べる。 |
| Generation mode | Attention / Latent | 処理速度と精度のバランスを選べる。 |
| Mask threshold | 0.4 〜 0.6 (推奨) | キャラ同士の重なりを自然にする。 |
Regional Prompterは、他の手法に比べて「プロンプトの反映率」が非常に高いのが特徴です。
特に色の指定が多い場合、これを使わない手はありません。
複数のキャラクターを描き分ける時にポーズを固定する手順
キャラの外見が決まったら、次はそれぞれの「動き」を指定していきます。
複数人を出そうとすると、腕が混ざったり変な方向から生えてきたりするトラブルが起きがちです。
ControlNetの「OpenPose」を使い、2人分の骨格を指定することで、配置とポーズを完全にコントロールしましょう。
OpenPoseで2人の立ち位置と動きを指定する方法
OpenPoseを使えば、棒人間のような骨格データを使ってAIにポーズを指示できます。
2人分の骨格が描かれた画像を用意して読み込ませるだけで、AIはその通りに人物を配置してくれます。
これにより、1人は座り、もう1人は立っているといった複雑な構図も一発で決まります。
プロンプトだけで位置を指定するよりも、はるかに正確でストレスのない生成が可能です。
複数のControlNetを同時に動かすための設定
1人だけにポーズをつけたい場合や、2人に別々のポーズをさせたい時は、ControlNetを複数同時に起動します。
設定画面の「Multi ControlNet」の数値を2以上に増やすことで、複数の指示を重ねることが可能です。
例えば、1つ目のユニットで全身の構図を決め、2つ目で手の動きを細かく指定する、といった使い分けができます。
パワーが必要な作業ですが、その分思い通りのシーンを作り込めるようになります。
重なり合った人物を正しく認識させるコツ
2人が抱き合っていたり、前後に重なっていたりする場合、AIは体のパーツを混同しやすくなります。
そんな時は、OpenPoseだけでなく「Canny」や「Depth」を併用して、体の輪郭をはっきりさせてあげましょう。
奥行き(Depth)の情報を与えることで、AIは「どちらが前で、どちらが後ろか」を理解します。
重なりが激しいシーンほど、こうした複数のControlNetによる補強が効いてきます。
描き終わった後の顔や衣装を直すインペイントのコツ
一度の生成で完璧に描き分けるのは、プロでも至難の業です。
「1人目は完璧だけど、2人目の顔が変」という時は、無理にやり直さず、部分修正を使いましょう。
img2imgの中にある「インペイント」機能を使えば、全体の雰囲気を壊さずに特定の場所だけを書き換えられます。
1人ずつマスクを塗って修正する具体的な流れ
修正したい画像を選択し、インペイントの画面で変えたい部分だけを黒く塗りつぶします(マスク)。
例えば、右側の女の子の顔だけを塗り、プロンプトにその子の特徴だけを詳しく書きます。
生成ボタンを押すと、マスクした部分だけが新しく描き直されます。
この方法なら、他の順調な部分はそのままに、ダメな部分だけを納得いくまで修正し続けることが可能です。
顔の崩れを自動で直すADetailerの導入
「ADetailer」は、生成時に顔や手を自動で検知して、勝手にインペイントをかけてくれる便利な拡張機能です。
2人以上の画像だと顔が小さくなり、顔立ちが崩れやすいですが、これをオンにするだけで劇的に綺麗になります。
1人目と2人目の顔を個別に検出し、それぞれに最適な描き込みを足してくれます。
複数人生成には必須と言えるツールなので、真っ先に導入しておくのがおすすめです。
全体のバランスを崩さずに描き足すための強度設定
インペイントで修正する際、描き直しの強さ(Denoising strength)の設定が重要です。
数値を高くしすぎると元の絵と繋がらなくなり、低すぎると変化が起きません。
通常は0.4から0.5あたりに設定し、元の形を活かしつつ綺麗にするのがコツです。
少しずつ変化を見ながら、周りと馴染むように調整を重ねていきましょう。
BREAKを使ってプロンプトの干渉を抑える方法
拡張機能を使わず、プロンプトの単語だけで境界線を作る便利なコマンドが「BREAK」です。
これはStable Diffusionの「75トークンごとに処理を区切る」というルールを、好きな場所で強制的に発動させるものです。
プロンプトの中に大文字で「BREAK」と書き込むだけで、前後の単語が混ざり合うのを物理的に防ぐことができます。
75トークンの制限を逆手に取った区切り方
Stable Diffusionは、一度に処理できる情報のまとまりを75トークン(単語の断片のような単位)ごとに区切っています。
通常はこの区切りで意味が混ざることがあるのですが、BREAKを使うとその場所で強制的に次のまとまりへ移行させます。
「1人目の特徴、BREAK、2人目の特徴」と書くことで、AIはそれぞれの情報を別のグループとして扱います。
Regional Prompterほど強力ではありませんが、手軽に色移りを減らせる非常に便利な技です。
プロンプトをぶつ切りにしてAIに理解させる技
BREAKを使うときは、一つの区切りの中に情報を詰め込みすぎないのがポイントです。
単語が多すぎるとそのエリア内での優先順位が下がってしまい、肝心の特徴が消えてしまうからです。
1人あたりの指示を20〜30トークン程度に抑え、要点だけをズバッと書くように心がけましょう。
情報の解像度を上げるためには、言葉を尽くすよりも「隔離する」ことの方が重要になります。
Comma(カンマ)とBREAKを使い分けるタイミング
カンマは「単語を並べる」もの、BREAKは「意味の壁を作る」ものだと考えてください。
同じキャラの服の色と髪の色を繋ぐならカンマで十分ですが、別のキャラに移る時は必ずBREAKを挟みます。
この使い分けができるようになると、プロンプトの制御能力が格段に上がります。
「混ぜたくない情報の境目にはBREAKを入れる」というルールを徹底しましょう。
特定の人物にだけLoRAを適用させる指定のやり方
特定のキャラを出すために「LoRA」を使っている方も多いはずです。
しかし、複数人生成でLoRAを普通に使うと、2人ともそのキャラの顔になってしまう「顔移り」が発生します。
これを防ぐには、Regional Prompterの領域指定とLoRAのタグを連動させる必要があります。
領域ごとにLoRAのタグを書き込む手順
Regional Prompterで分割した各プロンプトの中に、個別のLoRAタグを書き込みます。
左側のプロンプトにはLoRA Aを、右側のプロンプトにはLoRA Bを入れる形です。
これにより、AIは「左側の範囲を計算する時だけLoRA Aを使う」という器用な動きをしてくれます。
夢のような多人数キャラクター共演も、この方法なら現実的なものになります。
特定のキャラクターの外見を固定するトリガーワード
LoRAを効果的に効かせるには、そのキャラ特有の「トリガーワード」もプロンプトに忘れず入れましょう。
タグだけでは形が不安定になることがありますが、言葉による補強を足すことで外見がバチッと固定されます。
トリガーワードも、もちろんBREAKやADDCOLで区切ったそれぞれの領域内に配置します。
キャラのアイデンティティを守るために、言葉とデータの両面から指示を出しましょう。
複数のLoRAを混ぜた時に破綻させない重みの調整
LoRAを2つ以上使うと、画像生成に必要な計算量が激増し、絵がドロドロに溶けてしまうことがあります。
そんな時は、それぞれのLoRAの適用強度(Weight)を少し下げてみてください。
通常1.0で使っているなら、0.6〜0.8程度に落とすと画像が安定しやすくなります。
「強すぎず、弱すぎず」のバランスを見極めることが、複数人LoRA生成を成功させる秘訣です。
複数のキャラクターを描き分ける際のトラブルを減らすために
複数人を一度に生成しようとすると、パソコンにかかる負荷もエラーの頻度も一気に跳ね上がります。
特にビデオメモリ(VRAM)の消費が激しくなるため、対策を知っておかないと生成すらままなりません。
エラーや崩れに直面した時のチェックリストを頭に入れて、快適な生成環境を守りましょう。
メモリ不足(OOM)エラーが出た時の回避策
複数人生成で「Out of Memory(OOM)」が出たら、まずは解像度を下げて生成してください。
いきなり高解像度で2人を描こうとするのは、VRAMを大量に食う無謀な挑戦です。
最初は小さなサイズ(512×512など)で生成し、良い絵ができたら「Hires. fix」で拡大するのが基本です。
パソコンへの負担を分散させる賢いワークフローを心がけましょう。
手足の数がおかしくなった時に見直すべき項目
人物が増えると、AIは「誰の腕がどこに繋がっているか」を見失いやすくなります。
これを防ぐには、ネガティブプロンプトに「(extra limbs:1.2), (fused bodies:1.2)」などの除外ワードを強めに入れてください。
また、人物の密度が高すぎるのも原因の一つです。
キャンバスの横幅を広げたり、キャラ同士の間に少し隙間を作るようなプロンプトに変えたりして、AIに余裕を与えてみましょう。
モデル(Checkpoint)ごとの複数人描写の得意もし不得意
実写系モデルは解剖学的に正しく描こうとする力が強いですが、アニメ系モデルは重なりをうまく誤魔化してくれる傾向があります。
使っているモデルが複数人生成に向いているかどうかは、配布ページのサンプル画像を見て判断しましょう。
もし多人数が苦手なモデルなら、描き分けが得意な別のモデルで生成し、後からお気に入りのモデルでインペイントをかけるという手法も有効です。
道具の特性を理解して、弱点を補い合う使い方が上達への近道です。
まとめ:複数人の描き分けで自分だけのシーンを作ろう
Stable Diffusionで複数のキャラクターを完璧に描き分けるのは、一見難しそうですが、ツールの助けを借りれば誰でも実現可能です。
色移りや形の崩れを克服して、あなたの想像する賑やかな世界を形にしていきましょう。
- 標準プロンプトだけでは色が混ざるため、Regional Prompterなどの拡張機能を使うのが一番確実。
- 物理的に画面を分けることで、1人目と2人目の指示を完全に分離できる。
- プロンプトを区切る時は大文字の「BREAK」を活用して、情報の干渉を最小限に抑える。
- キャラクターの配置やポーズはControlNetのOpenPoseで固定すると、失敗が激減する。
- 生成後の細かい顔の崩れは、ADetailerやインペイント機能を使って個別に直す。
- LoRAを使う際は適用範囲を限定し、重みの数値を少し下げて安定させる。
- エラーが出る時は解像度を下げて生成し、後から拡大する手順を踏む。
(masterpiece, best quality, cinematic lighting:1.2), 2girls, fantasy RPG world, adventuring
ADDCOL
(fiery red long hair, ornate silver armor:1.3), heroic knight girl, holding a sword, determined look
ADDCOL
(deep purple twin tails, indigo velvet cloak:1.3), mysterious mage girl, casting a spell, glowing eyes
キャラクター同士の視線や距離感にこだわって、物語の一場面を切り取ったような素晴らしい画像をぜひ作り出してみてください。
