グラボ2枚挿しでStable Diffusionは速くなる？VRAM共有の設定と効果を解説！

2026年2月1日

「グラボをもう1枚足せば、AI画像生成が2倍速くなるはず！」そう思って、空いているスロットに新しいカードを挿そうとしていませんか。実は、Stable DiffusionにおけるマルチGPU（2枚挿し）の世界は、単純な足し算ではありません。

この記事では、グラボを2枚挿したときに「何が速くなり、何が変わらないのか」というホントのところをお話しします。2枚のVRAMをどう使い分けるのか、設定のコツやハード面の落とし穴まで具体的にまとめました。あなたのPC環境を最強にするための、失敗しない道しるべとして役立ててください。

グラボ2枚挿しでStable Diffusionの速度は上がる？まずはホントのところを公開

グラボを2枚に増やしたからといって、1枚の絵を描き終えるまでの時間が半分になるわけではありません。ここは多くの人が勘違いしやすいポイントです。Stable Diffusionというソフトが、標準では「1つの計算に対して1枚のグラボ」しか使わない仕組みだからです。

1枚の生成速度は変わらないのが基本

Stable Diffusion（A1111やForgeなど）で生成ボタンを押したとき、計算を担うのはメインで指定されたグラボ1枚だけです。2枚挿していても、1枚の絵を仕上げる「瞬発力」は変わりません。これは、料理を作る時にコンロを2つ持っているけれど、1つの鍋は1つの火でしか温められない状態に似ています。

1枚の画像を生成するスピードを極限まで上げたいなら、2枚挿すよりもRTX 4090のような単体性能が高いカードを選ぶのが正解です。 2枚挿しは、どちらかというと「1枚ではできない作業」をこなすための工夫だと考えてください。

複数の画像を別々のグラボで同時に作る並列生成

2枚挿しが真価を発揮するのは、1度に大量の画像を作る「並列生成」を行うときです。例えば、グラボAで50枚、グラボBで50枚といった具合に、別々の仕事を同時に割り振ることができます。

この方法なら、1枚で100枚作るよりもずっと短い時間で作業が終わります。

複数のブラウザタブでWebUIを開き、それぞれ別のグラボを指定する
バッチ処理を使って、グラボごとに仕事を振り分ける
学習（LoRA作成）をしながら、別のグラボで生成を楽しむこのように、「時間あたりの合計枚数」を増やしたい場合には、2枚挿しは非常に強力な武器になります。

1枚の高性能なグラボに買い替える方が速いパターン

予算が限られているなら、中性能なグラボを2枚買うよりも、上位モデルを1枚買う方が幸せになれるケースが多いです。例えば、RTX 4060 Tiを2枚用意しても、RTX 4090 1枚の生成スピードには遠く及びません。

上位モデルは計算コア数（CUDAコア）が多いだけでなく、データの通り道であるメモリ帯域も広いため、あらゆる動作が軽快になります。

1枚あたりの生成が圧倒的に速い
消費電力が2枚挿しよりも抑えやすい
PCケース内の熱問題に悩まされにくい特別な理由がない限り、まずは1枚で最高の性能を目指すほうが、トラブルも少なく快適なAIライフを送れます。

VRAM共有の設定で巨大なモデルを動かすコツ

「2枚のVRAMを合体させて、1つの大きなメモリとして使いたい」という願いは、Windows環境では少し工夫が必要です。昔のゲーム機のように勝手につながるわけではなく、特定のソフトを使って「モデルを分割して乗せる」という手法を取ります。

ComfyUIを使ってモデルを2枚のメモリに分割して乗せる

2026年現在、マルチGPUを最も賢く使えるのは「ComfyUI」というツールです。これを使えば、例えば12GBのグラボ2枚に対して、巨大なモデル（Flux.1など）を分割してロードさせることができます。

モデルの一部をグラボ1に、残りをグラボ2に配置することで、1枚ではメモリ不足で動かなかったAIを動かせるようになります。VRAMの合計値を活かして、1枚の限界を超える巨大な画像を生成できるのがこの設定の最大のメリットです。

PyTorchの環境変数で使うグラボを指定する手順

システム全体でどのグラボを優先的に使うかは、Windowsの環境変数やコマンドプロンプトで制御できます。これを設定しておかないと、AIが間違って性能の低い方のグラボを使ってしまうことがあります。

設定は非常にシンプルで、起動用のバッチファイル（webui-user.batなど）に「set CUDA_VISIBLE_DEVICES=0,1」といった記述を書き加えるだけです。

起動用ファイルを右クリックして編集を選ぶ
実行コマンドの前にデバイス指定のコードを入れる
保存して起動するこれだけで、Stable Diffusionが2枚のグラボを認識し、計算に使える準備が整います。

VRAM不足で動かないFlux.1を動かすための設定値

最新の超高画質モデルである「Flux.1」などは、VRAMを24GB以上要求することがあります。これを12GBや16GBのグラボ2枚で動かすには、分割ロードの設定が欠かせません。

ComfyUIなどのノードベースの環境では、デバイスの割り振りを細かく指定するノードが配布されています。1枚のVRAM容量を超えたモデルでも、2枚の力を合わせれば「動作不可」の壁を突破して、最高画質の絵を生成できるようになります。

2枚挿しの効果を最大化できる場面

グラボを2枚挿すと、単なる速度向上以上の「自由」が手に入ります。特に、一度に大量の試行錯誤が必要な場面や、負荷の高い特殊な作業において、その恩恵は計り知れません。

大量に画像を生成して「ガチャ」を回し続ける時

AIイラストで理想の1枚を引き当てるには、何百枚という「ガチャ」を回す必要があります。2枚挿しなら、2枚のグラボにそれぞれ別々のプロンプトやシード値を任せて、同時に回し続けられます。

「こっちのグラボではアニメ風、あっちでは実写風」といった並行作業も余裕です。作業効率が物理的に2倍になるため、短時間で最高の1作を見つけたいプロのユーザーにとっては、2枚挿しは手放せない環境になります。

動画生成（AnimateDiff）などメモリを極端に食う作業

動画生成AIである「AnimateDiff」や動画アップスケールは、静止画とは比較にならないほど大量のVRAMを消費します。2枚挿し環境なら、動画の計算を1枚に任せつつ、もう1枚で別の作業を続けることが可能です。

また、将来的に動画生成の計算を複数GPUで分散処理する手法も進化しています。動画という重いデータを扱うなら、VRAMの「数」を持っていることが、将来的な拡張性においても大きな強みになります。

学習と生成を別々のグラボで同時に行う

自分だけのキャラクターをAIに覚えさせる「LoRA学習」は、完了までに数時間かかることも珍しくありません。グラボが1枚しかないと、学習中は画像生成ができず、PCがただの計算機になってしまいます。

グラボが2枚あれば、片方で黙々と学習を回しながら、もう片方で今まで通り画像生成を楽しめます。待ち時間をゼロにして、クリエイティブな活動を止めない環境を作れることこそ、2枚挿しの隠れた一番のメリットかもしれません。

Windowsで2枚のグラボを使い分ける具体的な方法

Windowsで2枚のグラボを制御するには、起動時の「呪文」を少し書き換える必要があります。難しいプログラミングは不要で、決まった文字を追加するだけでAIに指示が伝わります。

コマンドライン引数にデバイスIDを書き込む書き方

Stable Diffusion WebUI（A1111）などを起動する際、--device-id というオプションを付け足すことで、使用するグラボを指定できます。通常、1枚目は「0」、2枚目は「1」という番号が振られています。

例えば、2枚目のグラボでWebUIを立ち上げたいなら、起動オプションに --device-id 1 と書き込みます。これだけでAIは「2枚目を使うんだな」と理解し、1枚目のグラボを他の作業（ゲームや動画編集など）のために空けておくことができます。

特定のグラボだけをAI専用にするOS側の優先度設定

Windowsの「グラフィックの設定」からも、アプリごとにどのGPUを使うか選べます。基本的にはAIソフト側での指定が優先されますが、OS側で「高パフォーマンス」に設定しておくことで動作が安定します。

特に、モニター出力（画面表示）をCPU内蔵グラフィックスや、性能の低い方のグラボに任せる設定は有効です。AI専用のグラボに画面表示の負荷を一切かけないようにすることで、VRAMを1MBでも多く計算に回すことができます。

WebUIを2つ立ち上げて別々のグラボを割り当てる

最も実践的なのが、Stable Diffusionのフォルダを2つ用意し、それぞれに別々のデバイスIDを割り当てて同時に立ち上げる方法です。これで、画面上に2つの生成ウィンドウが並びます。

1つ目のウィンドウ（ID:0）でメインの生成
2つ目のウィンドウ（ID:1）でサブの生成やアップスケールこの「ダブル生成環境」を作れば、作業の待ち時間が物理的に消滅し、アイデアを次々と形にしていけるようになります。

グラボを2枚挿す時にハード面で注意すべきポイント

「グラボを買って挿すだけ」と考えていると、思わぬトラブルでPCが起動しなかったり、最悪の場合は故障したりします。2枚挿しは、PCにとって非常に過酷な環境であることを忘れないでください。

850W以上の電源ユニットが必要になる電力の壁

グラボはPCの中で最も電気を食うパーツです。2枚挿すということは、その消費電力も単純に増えます。RTX 4070クラスを2枚挿すなら、最低でも850W、できれば1000W以上の電源ユニットを用意しましょう。

電力が足りないと、生成中に突然PCが落ちたり、パーツにダメージを与えたりします。

自分のグラボの最大消費電力を調べる
他のパーツ（CPUなど）の電力も計算に入れる
余裕を持って、計算値の1.5倍程度の容量の電源を選ぶのが鉄則です。

熱がこもって故障するのを防ぐ隙間の開け方

2枚のグラボをピッタリくっつけて挿すと、上のグラボのファンが下のグラボの背面に塞がれてしまい、空気が吸えなくなります。そのままAIを動かすと、温度が数分で100度を超え、性能がガクンと落ちる「サーマルスロットリング」が発生します。

対策としては、隙間が空くマザーボードを選ぶか、「ライザーケーブル」を使ってグラボを離して配置する必要があります。「冷えないグラボはただの重り」と言われるほど、2枚挿しにおいて冷却対策は電力と同じくらい重要です。

PCI Expressのスロット数とレーン数の落とし穴

マザーボードにスロットが2つあっても、2枚目が「x4」などの低速なモードでしか動かない場合があります。これではグラボの性能を100%引き出せません。

また、グラボの厚みのせいで2枚目が物理的に挿せないという失敗もよくあります。

3スロット厚のグラボを2枚挿すには、広い間隔が必要
マザーボードの「レーン分割」の仕様を確認する
ケースの大きさが足りているか測る買う前にマザーボードの説明書を読み込み、物理的・電気的に2枚挿しに対応しているか必ずチェックしてください。

2枚挿しよりも上位機種1枚の方がいい理由

ここまでの話を読んで「2枚挿しは意外と大変そうだな」と感じたなら、その直感は正しいです。多くの場合、2枚挿しに挑戦するよりも、最強のグラボを1枚買うほうがコスパも満足度も高くなります。

RTX 4090 1枚と4060 Ti 2枚ではどちらが快適？

具体的に、価格帯が近くなる構成で比較してみましょう。

項目	RTX 4090 (1枚)	RTX 4060 Ti 16GB (2枚)
VRAM総量	24GB	32GB (16GB x2)
単体生成速度	圧倒的に速い	標準的
巨大モデルの運用	1枚でスムーズ	2枚に分割が必要
導入の難易度	簡単（挿すだけ）	難しい（設定・電源・排熱）
将来性	非常に高い	接続が複雑

VRAMの合計値では2枚挿しが勝つこともありますが、実際の使い勝手や生成スピードでは、RTX 4090 1枚の方が圧倒的に快適です。

グラボ間の通信で発生する速度低下のストレス

2枚のグラボでデータをやり取りする場合、マザーボード上の通り道（PCIe）を経由するため、どうしても待ち時間（ラグ）が発生します。1枚のグラボ内で完結する処理に比べると、この通信がボトルネックになりやすいのです。

特に、2枚を連携させて1つのモデルを動かす場合、この通信ラグのせいで生成が遅くなることがあります。「2つあれば2倍」とはいかないのが、デジタル回路の難しいところです。

電気代と騒音のコストパフォーマンスを比較する

グラボが2枚回れば、その分ファンもたくさん回り、騒音も大きくなります。また、常に高い電力を消費するため、毎月の電気代もバカになりません。

長期間、毎日AI生成を楽しむのであれば、最新の省エネな上位グラボ1枚の方が、トータルの維持費は安く済みます。「初期費用」だけでなく、長く使っていく上での「維持コスト」や「快適さ」も天秤にかけて判断しましょう。

ComfyUIやForgeで複数枚のグラボを回すテクニック

どうしても2枚挿しで頑張りたいあなたのために、最新のソフト側でのテクニックを紹介します。これらを使いこなせば、2枚のグラボをフル回転させて、AI生成のプロのような環境を作れます。

自動で空いているグラボを探してくれる拡張機能

Stable Diffusion WebUI Forgeなどには、複数のグラボを賢く管理するためのプラグインが存在します。これを使えば、ユーザーがいちいちデバイス番号を指定しなくても、手の空いているグラボに自動で仕事を投げてくれます。

これを導入するだけで、並列生成のハードルが一気に下がります。ソフト側でリソースを最適化してくれるので、あなたはプロンプトを打ち込むことに集中するだけでOKです。

モデルごとにロードするデバイスを分けるカスタマイズ

ComfyUIなどの高度な環境では、「チェックポイントはこのグラボ、LoRAやコントロールネットはこっちのグラボ」といった、マニアックな割り振りが可能です。

VRAMの消費が激しいコントロールネットなどを別のグラボに逃がすことで、1枚あたりの負荷を下げ、エラーを防ぐことができます。自分のマシンのVRAM残量をパズルのように組み合わせる作業は、マルチGPUユーザーだけの特権的な楽しみです。

バッチ処理で複数のグラボに仕事を割り振る仕組み

1000枚単位で画像を生成するようなプロジェクトでは、コマンドラインから各グラボに一括で命令を送る「スクリプト」が活躍します。

一度実行してしまえば、あとはPCを放っておくだけで、2枚のグラボが競い合うように画像を吐き出し続けます。朝起きたら数千枚の成果物がフォルダに並んでいる。そんな「AI工場」のような体験ができるのも、複数挿しの醍醐味です。

VRAM不足を解消する他の賢い選択肢

2枚目のグラボを買う前に、今の環境でできる「延命策」も知っておいて損はありません。設定一つで、今のグラボのVRAMを2倍近く有効に使えるようになるかもしれません。

メモリ消費を半分にする「xformers」や「SDPA」

Stable Diffusionの設定には、VRAMの消費を劇的に抑える「最適化」の項目があります。特に xformers や、最近のトレンドである SDPA という技術は、導入するだけで消費メモリが激減します。

これを設定するだけで、今までメモリ不足（Out of Memory）で落ちていた画像も、スルスルと生成できるようになる場合があります。「新しいハードを買う前に、まずはソフトの設定を出し切る」ことが、賢い自作PCユーザーの姿です。

メインメモリをVRAMの代わりに使う共有GPUメモリの罠

Windowsには、VRAMが足りなくなった時にPCのメインメモリ（RAM）を拝借する「共有GPUメモリ」という機能があります。一見便利ですが、これは非常に動作が遅いため、生成速度が10倍以上遅くなることがあります。

「生成は止まらないけど、異常に時間がかかるようになった」という時は、この機能が発動している証拠です。これはあくまで緊急避難的な機能であり、常用できるものではないことを覚えておきましょう。

クラウドGPU（Paperspace等）を借りて巨大な計算を任せる

「どうしてもRTX 4090級のパワーがたまに必要」というなら、自宅のPCを強化するのではなく、ネット上の強力なマシンを借りるという手もあります。

PaperspaceやGoogle Colabなどのサービスを使えば、月額数百円から数千円で、2枚挿しPCよりも遥かに強力な環境が手に入ります。ハードの管理や電気代、熱の問題をすべて業者に丸投げして、美味しいところだけを享受するのも、2026年らしい賢い選択です。

以下に、2枚挿し環境を想定した「並列生成用のバッチファイル」のテンプレートを紹介します。

複数GPUを個別に叩くための起動プロンプト（.batファイル例）

GPU 0番用（1枚目）:

set CUDA_VISIBLE_DEVICES=0

python launch.py --port 7860 --device-id 0 --xformers

GPU 1番用（2枚目）:

set CUDA_VISIBLE_DEVICES=1

python launch.py --port 7861 --device-id 1 --xformers

※ポート番号を分けることで、1台のPCで2つのStable Diffusionを同時にブラウザ表示できます。