Stable Diffusionで「一人だけ」を描きたいのに、なぜか隣に知らない誰かが現れる。そんな経験はありませんか。せっかくいい感じのキャラクターができたのに、画面の端に二人目がひょっこり顔を出しているとガッカリしますよね。
AIが勝手に人数を増やしてしまうのには、画面の広さや学習データのクセといった、ハッキリとした理由があります。この記事では、AIの「余計なおせっかい」を封じ込め、一人だけを確実に画面に収めるための具体的なテクニックをお話しします。プロンプトの書き方から設定のコツまで、すぐに試せる方法をまとめました。
一人だけを確実に生成するための最強プロンプト
AIに「今日は一人だけ描いてね」と伝えるには、単なる単語以上の工夫が必要です。呪文の力加減を調整することで、AIの迷いを断ち切ることができます。まずは基本となるプロンプトの構成を見直してみましょう。
強調構文を使った1girlやsoloの正しい書き方
AIに対して言葉を強調するには、丸括弧と数字を組み合わせるのが最も確実な方法です。単に solo と書くよりも、(solo:1.5) のように重みを付けてみてください。1.5という数値は、AIにその言葉を最優先で守るように促す強力な指示になります。
この数値設定によって、AIは画面内に他の人物を描く余裕をなくします。特にSD1.5系のモデルでは、単語一つでは無視されることが多いため、強めの重みをかけるのがコツです。
(solo:1.5):一人の状態を最優先(1girl:1.3):女の子一人の構成を強調(single person:1.4):単独であることを念押し
構図を絞り込むportraitやclose-upの併用
画面の中に余白が多いと、AIは「何かで埋めなきゃ」と考えて勝手に人を増やします。そこで portrait(肖像画)や upper body(上半身)といった、画角を制限する言葉を使いましょう。
アップの構図を指定すれば、二人目を描くスペースそのものが物理的に削られます。全身を描こうとすると足元や横に別人が現れやすいため、まずは寄りの構図で一人の状態を安定させることが大切です。
視線を誘導するfocus on one personの効果
AIの注意力を一箇所に集めるために focus on one person というフレーズを足してみてください。これは「一人の人物に焦点を合わせる」という明確な命令になります。
背景に紛れて誰かが生成されるのを防ぐ効果があります。カメラのピントが一人のキャラクターだけに合っている状態をAIにイメージさせることで、構図のボケや余計な要素を排除できます。
なぜ複数人出てしまう?画面が広すぎる問題と解決策
AIが人を増やしてしまう最大の原因は、実は「画面のサイズ」にあります。Stable Diffusionがどうやって絵を学習したかを知ると、なぜ分裂が起きるのかがスッキリ理解できるはずです。
512×512や1024×1024の正方形で生成してみる
Stable Diffusionの初期モデルは、主に512×512ピクセルの正方形で学習されています。そのため、このサイズで生成するとAIは「一人の人間」をちょうどよく収めることができます。
まずは正方形で試して、狙った通りに一人で出力されるか確認してください。サイズを大きくして失敗している場合、この基本の形に戻るだけで解決することがほとんどです。
横長画像でAIが空いたスペースを埋める理由
横長の画像を作ろうとすると、左右に大きな空き地ができてしまいます。AIはこの空白を「寂しい」と感じ、学習データのパターンから「ここにはもう一人いてもおかしくない」と判断してしまいます。
これが横長画像で二人組になりやすい理由です。解像度を16:9などのワイドにする場合は、後述するControlNetなどを併用して、強制的に一人に固定する工夫が欠かせません。
縦長画像で上下に分裂して二人になる現象
縦長の画像では、上下に人物が積み重なるような分裂が起きることがあります。これはAIが「上に頭、下に足」というセットを二回繰り返して描いてしまうためです。
特にスマホ壁紙のような極端な縦長サイズで発生しやすい現象です。この場合も、ベースとなる解像度を一度モデルの推奨値(SDXLなら1024×1024)に合わせてから、後で切り抜く方が綺麗に仕上がります。
ネガティブプロンプトで二人目を確実に消し去る
「描いてほしいこと」と同じくらい大切なのが「描かないでほしいこと」の指定です。ネガティブプロンプトを充実させることで、AIの選択肢から「複数人」という項目を消去できます。
複数を意味するmultiple girlsやgroupを徹底排除
ネガティブプロンプトの先頭に、複数を表す言葉を詰め込みましょう。multiple girls や group は、AIが勝手に群衆を描くのを止めるための必須ワードです。
これを入れるだけで、AIは「一画面に一柱」というルールを強く意識します。シンプルですが、これがあるかないかで生成の成功率は劇的に変わります。
multiple people:複数を禁止group:集団を禁止2girls, 3girls:特定の人数を禁止
画面分割を防ぐsplit viewやtwo shotの追記
AIが画面を勝手に二分割して、左右に別々の人を描くことがあります。これを防ぐために split view(画面分割)や two shot(二人写り)をネガティブに入れましょう。
特にマンガのコマ割りのような構図が出やすいモデルでは、これらのワードが効果を発揮します。一枚の絵として一人の空間を守るために、構図に関する否定語もセットで覚えておいてください。
人体の一部が増えるextra limbsとのセット指定
人数が増えるとき、完全な二人目ではなく「腕だけが三本ある」といった不気味な増え方をすることもあります。これはAIが二人の情報を混ぜて描こうとした結果です。
extra limbs(余分な手足)や bad anatomy(不自然な体)をネガティブに入れることで、こうした中途半端な分裂を防げます。一人の人間として正しく描写させるための、いわばガードレールの役割を果たします。
Hires. fixの設定で構図を壊さずに一人を維持する
高画質な絵を作りたい時に便利なHires. fix(ハイレゾ修正)ですが、設定を間違えると「高画質な二人組」になってしまいます。構図を崩さずに解像度だけを上げる設定を見ていきましょう。
アップスケーラーの選択でディテールを守る方法
Hires. fixを使う際は、アップスケーラーの種類に注目してください。アニメ調なら R-ESRGAN 4x+ Anime6B、実写系なら R-ESRGAN 4x+ が定番で使いやすいです。
適切なアップスケーラーを選ぶことで、元の構図(一人の配置)を維持したまま細部を書き込めます。ここで変なモデルを選んでしまうと、描き込みの途中でAIが混乱して、勝手に二人目を生み出す隙を与えてしまいます。
Denoising strengthを0.4から0.6に設定する重要性
最も重要な数値が Denoising strength(ノイズ除去強度)です。この数値が高すぎると、AIは「元の絵を無視して新しく描いていいんだ」と勘違いして、空いたスペースに人を増やします。
目安としては0.45から0.55の間で調整するのがおすすめです。0.6を超えると分裂のリスクが激増し、逆に0.3以下だと画質があまり上がりません。一人だけの構図を維持しつつ綺麗にするなら、0.5付近がベストバランスです。
生成の序盤で一人に絞り込むステップ数の調整
AIは生成の最初の段階で「誰がどこにいるか」という大まかな構図を決めます。Hires. fixをかける前の、最初の生成ステップ数(Sampling steps)は20〜30程度で十分です。
ここで時間をかけすぎず、まずは小さなサイズで「確実に一人の構図」ができていることを確認してください。土台が一人であれば、その後の高画質化で急に人が増えるリスクを最小限に抑えられます。
ControlNetを使って一人の場所を予約する
プロンプトやサイズ調整でもダメな時の最終兵器がControlNetです。これは絵の「骨組み」を指定することで、物理的に一人しか描けない状況を作り出します。
OpenPoseで棒人間を一柱だけ配置するコツ
ControlNetの OpenPose を使い、一人分のボーン(棒人間)画像を入力します。これによって、AIは「この位置にこの姿勢で人を描く」という絶対的なルールに従うことになります。
画面中央に一人分のボーンを置けば、左右にスペースがあってもAIはそこに人を描くことができません。構図を完全に支配できるため、横長の画像で一人だけを描きたい時には最強の解決策になります。
Depthマップで一人分の奥行きを指定する手順
Depth(深度)を使うと、画面内の奥行き情報を指定できます。一人分のシルエットの深さをAIに伝えることで、背景と人物の境界をはっきりさせます。
背景の壁や岩が、なんとなく人の形に見えて二人目になってしまう「パレイドリア現象」を防ぐのに有効です。人物が手前に一人だけいるという立体的な情報を与えれば、AIは迷わずに済みます。
Cannyで人物の輪郭をガチガチに固定する方法
Canny は画像から線画を抽出して固定する機能です。すでに一人だけ写っている良い画像があるなら、それをCannyで読み込ませてから生成してみてください。
輪郭線がガイドになるため、AIが勝手に腕を増やしたり、横に人を足したりする余地がなくなります。ポーズも服装も、そして人数も、元のイメージを完璧に守りたい時に重宝します。
Regional Prompterで特定のエリアに一人だけ描かせる
「画面の右半分には誰も描かないで」という細かい指定ができるのが Regional Prompter という拡張機能です。画面をエリア分けして、人物の出現場所を制限します。
マスク機能で人物の出現範囲を中央に絞る
画面を縦に三分割し、中央のエリアだけに 1girl のプロンプトを割り当てます。両端のエリアには background(背景)という言葉だけを割り当てれば、物理的に端には人が出なくなります。
この「エリアごとの呪文の使い分け」は、特に複雑な背景を描き込みたい時に役立ちます。AIに対して「ここは背景の担当、ここは人間の担当」とはっきり役割分担をさせることができます。
背景と人物のプロンプトを分離して干渉を防ぐ
人物のプロンプトと背景のプロンプトが混ざると、背景の模様が人物の一部に見えてしまうことがあります。Regional Prompterを使えば、これらを完全に切り離して計算できます。
結果として、背景は背景として、人物は人物として独立して描画されます。この分離によって、背景から二人目が「生えてくる」ようなミスを根本から断つことが可能です。
Divideモードを使った領域指定の具体的な数値設定
設定画面で Divide(分割)を選び、比率を 1,1,1 のように指定すると画面が三等分されます。例えば 1girl;background;background のように入力して、人物の範囲を絞ります。
特定の座標を数字で指定するのは少しコツがいりますが、一度慣れてしまえばこれほど心強い機能はありません。どんなに横長いキャンバスでも、狙った場所に一人だけを立たせることができます。
それでも二人出る時のための書き直しテクニック
いろいろ試しても、運悪く二人目が出てしまうことはあります。そんな時は、最初からやり直すのではなく、できた絵を修正するアプローチに切り替えましょう。
Inpaintで余計な一人を塗りつぶす解決策
Stable Diffusionの img2img タブにある Inpaint 機能を使います。余計に出てしまった二人目をブラシで黒く塗りつぶし、プロンプトに background, simple background と入力して再生成します。
AIは塗りつぶされた部分を「背景」として描き直してくれます。ゼロからガチャを回し直すよりも、気に入った部分を残したまま一人に修正できるため、時間の節約になります。
人物のいない背景のみの指示を混ぜて中和する
全体的に人が多すぎる場合は、プロンプトの後半に empty background, no humans といった言葉を少し混ぜてみてください。人物の密度を薄めるイメージです。
これを (empty background:0.6) のように弱めの重みで入れると、メインの一人は残しつつ、周囲の余計な人影だけが消えることがあります。プロンプトのバランス調整で、画面の「人口密度」をコントロールするテクニックです。
シード値を1ずつ変えて当たりを引くまでの回数
AI生成は最終的には確率の問題です。プロンプトが正しくても、たまたまその Seed(シード値)が「二人組になりやすい乱数」だったという不運もあります。
設定が完璧だと思えるなら、シード値を固定せずに数枚〜数十枚まとめて生成してみてください。その中の何枚かは、必ず一人だけの綺麗な構図で出力されるはずです。根気よく「当たり」を待つのも、AI使いの大切な技術です。
モデルごとの一人指定の効きやすさと特徴
使っているモデル(学習データ)によって、プロンプトの効き具合は大きく変わります。自分の愛用しているモデルが、どんなクセを持っているかを知っておきましょう。
アニメ系と実写系で使い分ける呪文の強さ
アニメ系のモデルは solo や 1girl のタグに敏感に反応してくれることが多いです。逆に実写系のモデルは、より自然な文章に近いプロンプトを好む傾向があります。
実写系で二人出る場合は a photo of a single woman のように、文章として「一人の女性の写真である」と強調する方が効果的な場合があります。モデルの作風に合わせて、単語で攻めるか文章で攻めるかを選びましょう。
SDXL以降の最新モデルで推奨される文章表現
SDXLなどの高性能なモデルでは、短いタグよりも「誰がどこで何をしているか」という具体的な説明を好みます。only one girl standing alone in the room のように状況を詳しく描写してください。
「alone(一人ぼっち)」という状況設定をプロンプトに組み込むことで、AIは世界観として他人がいないことを理解します。言葉の響きから受ける印象をAIに伝える手法は、新しいモデルほど有効です。
LoRAが複数人化を引き起こすケースと対策
特定のキャラクターやポーズを学習させた LoRA を使うと、情報が過多になり人物が分裂しやすくなります。LoRAの強度(Weight)が標準の 1.0 だと強すぎる場合があります。
数値を 0.6 や 0.7 に下げてみてください。LoRAの主張を少し抑えることで、本体のモデルが持っている「一人で描く」という基本ルールが守られやすくなります。
| モデルタイプ | 一人にするためのコツ | 推奨重み |
| アニメ系 | solo タグを強調する | (solo:1.4) |
| 実写系 | single person と文章で書く | (1person:1.2) |
| SDXL | 状況描写(一人でいる等)を増やす | 自然な英文 |
まとめ:一人だけの理想的な構図をマスターしよう
Stable Diffusionで勝手に人が増えてしまう問題は、AIの性質を逆手に取れば必ず解決できます。まずは基本のプロンプトと画面サイズを見直すことから始めてみてください。
- プロンプトに
(solo:1.5)を入れ、ネガティブにmultiple peopleを詰める。 - 生成サイズは極力、モデルが推奨する正方形に近い形にする。
- 横長や縦長にしたい時は、Hires. fixのDenoising strengthを0.5前後に抑える。
- どうしても分裂するなら、ControlNetやRegional Prompterで物理的に場所を縛る。
- 失敗作が出てもInpaintで部分的に消せばOKと楽に考える。
これらを組み合わせれば、どんなモデルでも一人だけを確実に描き出すことができます。思い通りの構図で、あなただけの魅力的なキャラクターを誕生させてください。
