Stable Diffusion XL ベンチマーク|GPU 別 1024×1024 生成速度 2026年版
Stable Diffusion XL(SDXL)の GPU 別生成時間とVRAM 使用量を集約。AUTOMATIC1111 / ComfyUI / Forge の各環境での秒数を主要 GPU で比較。
※ 本記事はアフィリエイト広告(Amazon アソシエイト等)を含みます
Stable Diffusion XL(SDXL)の GPU 別生成性能を集約。1024×1024・25 ステップ・DPM++ 2M Karras の典型設定で、各 GPU の 生成秒数 / VRAM 使用量 を比較します。
SDXL 1024×1024 生成時間(中央値)
| 評価項目 | GPU | 生成秒数 | VRAM 使用 | Hires.fix 2x |
|---|---|---|---|---|
| RTX 4090 | 3.5 秒 | 10 GB | 余裕 | |
| RTX 4080 SUPER | 5.2 秒 | 10 GB | 余裕 | |
| RTX 4070 Ti SUPER | 6.0 秒 | 10 GB | 余裕 | |
| RTX 4070 SUPER | 7.2 秒 | 10 GB | VRAM 12GB ギリ | |
| RTX 4060 Ti 16GB | 8.5 秒 | 10 GB | **余裕** | |
| RTX 4060 8GB | 8.0 秒 | 8 GB | **OOM エラー** | |
| RX 7900 XTX 24GB | 10 秒(ROCm) | 10 GB | 余裕 |
ツール別の VRAM 効率
| ツール | VRAM 効率 | 推奨 |
|---|---|---|
| AUTOMATIC1111 | 標準 | 万能 |
| ComfyUI | ◎(Meda Tiling 対応) | VRAM 不足環境 |
| Forge | ◎(A1111 派生・低 VRAM) | VRAM 8GB 環境 |
| Invoke AI | ○ | 商用利用 |
NVIDIA vs AMD
NVIDIA は CUDA で標準対応、AMD は ROCm(Linux 推奨)か DirectML(Windows・遅い)。生成 AI 用途は NVIDIA 一択。
まとめ
SDXL は VRAM 16GB が境界線。RTX 4060 Ti 16GB が「VRAM 重視のコスパ最強」。詳しくは 生成 AI 用自作 PC・RTX 4060 Ti 16GB 完全解説 も参照。