ベンチマーク・ 2026-09-07 （更新：2026-05-07）

Stable Diffusion XL ベンチマーク｜GPU 別 1024×1024 生成速度 2026年版

Stable Diffusion XL（SDXL）の GPU 別生成時間とVRAM 使用量を集約。AUTOMATIC1111 / ComfyUI / Forge の各環境での秒数を主要 GPU で比較。

※ 本記事はアフィリエイト広告（Amazon アソシエイト等）を含みます

Stable Diffusion XL（SDXL）の GPU 別生成性能を集約。1024×1024・25 ステップ・DPM++ 2M Karras の典型設定で、各 GPU の 生成秒数 / VRAM 使用量 を比較します。

SDXL 1024×1024 生成時間（中央値）

SDXL Base 1024×1024 25 ステップ

評価項目	GPU	生成秒数	VRAM 使用
RTX 4090	3.5 秒	10 GB	余裕
RTX 4080 SUPER	5.2 秒	10 GB	余裕
RTX 4070 Ti SUPER	6.0 秒	10 GB	余裕
RTX 4070 SUPER	7.2 秒	10 GB	VRAM 12GB ギリ
RTX 4060 Ti 16GB	8.5 秒	10 GB	余裕
RTX 4060 8GB	8.0 秒	8 GB	OOM エラー
RX 7900 XTX 24GB	10 秒（ROCm）	10 GB	余裕

VRAM 16GB が SDXL Hires.fix の境界線。8GB GPU では Hires.fix できない。

NVIDIA は CUDA で標準対応、AMD は ROCm（Linux 推奨）か DirectML（Windows・遅い）。生成 AI 用途は NVIDIA 一択。

SDXL は VRAM 16GB が境界線。RTX 4060 Ti 16GB が「VRAM 重視のコスパ最強」。詳しくは生成 AI 用自作 PC・RTX 4060 Ti 16GB 完全解説も参照。