Stable Diffusion

SD 3.5 / Flux / Pony / Illustrious など、ローカル実行 OSS 画像生成エコシステムの総本山

画像生成AI
公式サイトへ →

Stable Diffusionが向いている人

まず無料で試したい人

Stable Diffusionは無料プランから試せるため、導入前に相性を確かめたい人に向いています。

予算感を先に把握したい人

Stable Diffusionは開始価格が無料 (OSS)で、導入前にコスト感を比較しやすいツールです。

アニメ・イラスト制作 (Pony V6 XL / Illustrious XL + Animagine LoRA)人

Stable Diffusionは「アニメ・イラスト制作 (Pony V6 XL / Illustrious XL + Animagine LoRA)」の用途で候補に入りやすいツールです。

日本ユーザー評判 · SENTIMENT DIGEST

日本のユーザーはStable Diffusionをどう評価しているか

Grok X search + 日本語 Web レビュー (ITreview / note / ブログ) の合成

日本のユーザーはStable Diffusionのカスタマイズ性と高品質画像生成を高く評価しているが、初心者向けの使いやすさやハードウェア要件に不満を持つ声もある。2025年以降もnoteやブログでローカル環境活用の積極的な報告が続いている。

好評の声 5
  1. ControlNetでポーズ指定ができ思い通りのキャラクター生成が可能
  2. SDXLで高解像度画像生成が安定し背景の作り込みが優れている
  3. 最新モデルでプロンプト理解力が向上し高品質なイラスト生成が可能
  4. オープンソースでカスタマイズ性が高く無料で商用利用しやすい
  5. インストールガイドやプロンプト集が充実しコミュニティが活発
気になる声 4
  1. 初心者にはプロンプト作成が難しく低品質な画像が出やすい
  2. 最新モデルはVRAM消費が大きくハードウェア要件が高い
  3. 過去のライセンス制限でコミュニティの信頼が揺らいだ
  4. 日本語プロンプト対応や簡単操作で他AIツールに劣る場合がある

Stable Diffusionとは?

Stable Diffusion は Stability AI が 2022 年に公開して以来、オープンソース画像生成の代名詞になっているモデルファミリーです。2026 年時点の最新世代は SD 3.5 Medium (約 25 億パラメータ) と SD 3.5 Large (約 81 億パラメータ) で、Stability AI Community License のもと年間売上 100 万ドル未満なら無料で商用利用できます。競合は Black Forest Labs の Flux (フォトリアル・テキスト描画に強い 120 億パラメータ) で、2026 年の OSS 画像生成は Stable Diffusion と Flux の二強構造です。

SD 3.5 Medium は家庭用 GPU で扱える現実的な選択肢です。BF16 ベースで約 9.9GB VRAM、最適化すれば 8GB 級 (RTX 3060 12GB・4070 など) でも 1024×1024 を 20-28 ステップで生成できます。SD 3.5 Large は BF16 で約 18GB、量子化なしだと 24GB カード前提ですが、NVIDIA の TensorRT FP8 量子化 (2025 年 6 月) で約 11GB、2.3 倍高速化、さらに GGUF Q8_0 量子化を使えば 16GB や 12GB カードでも動きます。

日本のイラスト・アニメ用途では SDXL 系派生モデルが依然として支配的です。Pony Diffusion V6 XL (score_9, score_8_up といったスコア型プロンプト) が万能型の王者で、アニメ・セミリアル・獣人・スタイライズド全般をカバー。Illustrious XL とその派生 (NoobAI、HomoSimile XL など) は線・解剖・色の一貫性で Pony を上回り、高品質イラスト派の主流になりつつあります。Animagine 風 LoRA を組み合わせてクラシックなアニメ調に寄せるのも人気です。日本では有料サービスの NovelAI V4 / V4.5 Diffusion が完成度の高い UX と日本語タグ補完で支持を集める一方、ローカル派は Pony / Illustrious 系の CivitAI モデルで完全無料・無制限生成を楽しんでいます。

エコシステムの中心は CivitAI (モデル・LoRA・ワークフロー共有) と ComfyUI (ノードベース UI)。CivitAI のモデルページには「Workflows」タブがあり、2 段サンプラー・ディテイラー+アップスケーラー・マルチ LoRA スタックなどの .json をドラッグ&ドロップで ComfyUI に取り込めます。Automatic1111・Forge・SwarmUI なども引き続き現役で、A1111/Forge メタデータ経由の共有も健在です。商用利用のライセンスはモデルごとに異なり、SD 3.5 は Community License (100 万ドル未満無料)、Flux.1 [schnell] は Apache 2.0、Flux.1 [dev] は非商用ライセンス (別途商用契約必要)、Pony や Illustrious 派生はベースの SDXL + 作者独自条項なので CivitAI のモデルページを必ず確認する必要があります。

Stable Diffusionの画面イメージ

Stable Diffusionの公式サイト画面

出典: Stable Diffusion公式サイト

Stable Diffusionの主な機能

SD 3.5 Medium (2.5B)

約 9.9GB VRAM で動く汎用モデル。RTX 3060 12GB 以上の一般的ゲーミング PC でも 1024×1024 生成が可能

SD 3.5 Large (8.1B)

約 18GB VRAM (BF16)。TensorRT FP8 で 11GB まで圧縮でき 2.3 倍高速化、GGUF 量子化なら 12-16GB でも動く

Flux との使い分け

Flux はフォトリアル・テキスト描写・商用ホスティングで優位、SD 3.5 は OSS 自己ホスト・LoRA 充実・アート寄りで優位

Pony Diffusion V6 XL

SDXL 派生のアニメ/セミリアル万能モデル。score_9, score_8_up 型プロンプトで CivitAI 最大級の支持

Illustrious XL

線・解剖・色一貫性で Pony を上回る高品質イラスト向け派生。NoobAI などの二次派生も活発

Animagine 風 LoRA

Pony や Illustrious をクラシックなアニメ調に寄せる LoRA 群。CivitAI で多数配布

NovelAI V4/V4.5

日本で絶大な支持を得る有料クラウド。日本語タグ補完・物語ツール・無検閲アニメ出力で独自の地位

ComfyUI + CivitAI

ノードベース UI と巨大なワークフロー共有。JSON をドラッグ&ドロップで即動かせる

ControlNet / IP-Adapter

ポーズ・深度・エッジ指定や参照画像からのスタイル転写。Flux より SD 3.5 の方が対応拡張が豊富

マルチ LoRA スタック

複数 LoRA の合成で画風・キャラ・衣装などを自在に組み合わせ。Pony/Illustrious では必須ワザ

Stable Diffusionのメリット・デメリット

メリット

  • ✓ ローカルで完全無料・無制限・無検閲に生成できる
  • ✓ CivitAI + ComfyUI のエコシステムが圧倒的に広い
  • ✓ SD 3.5 Medium が 8-12GB VRAM で動き、コンシューマー GPU と相性が良い
  • ✓ Pony・Illustrious など日本向けアニメ派生モデルが充実
  • ✓ LoRA・ControlNet・IP-Adapter で細かい制御が効く
  • ✓ Stability Community License で年間売上 100 万ドル未満なら商用無料

デメリット

  • ✗ SD 3.5 Large や Flux Dev は VRAM 要件が厳しく、量子化前提になりがち
  • ✗ 初期構築 (Python 環境・ドライバ・モデル DL) のハードルが高い
  • ✗ 素のモデルは Midjourney V7 ほど美しくなく、LoRA と設定調整が前提
  • ✗ ライセンスがモデルごとに異なり、派生モデルは個別確認が必須
  • ✗ Flux のフォトリアルやテキスト描写には届かない

Stable Diffusionの主な用途

アニメ・イラスト制作 (Pony V6 XL / Illustrious XL + Animagine LoRA)
ゲーム・Web コンテンツのアセット量産
コンセプトアート・キービジュアル制作
LoRA で自作キャラ・画風の一貫再現
NSFW / 独自検閲方針が必要な個人制作
学習データ管理を重視する商用制作会社の内製
ComfyUI ワークフロー自動化 (バッチ・ディテイラー・アップスケール)

Stable Diffusionの料金

開始価格: 無料 (OSS)

無料プランあり

料金モデル: Open Source / Freemium

プラン価格主な機能
ローカル利用 $0 (電気代+GPU) モデル重みを DL して自前 GPU で無制限生成。SD 3.5 Medium は 8-12GB VRAM、Large は TensorRT/GGUF で 11-16GB
DreamStudio $10 (1,000 クレジット)〜 Stability AI 公式 Web 版。クレジット制で SD 3.5 / SDXL 生成
Stability API $10 クレジット〜 開発者向け API。SD 3.5、アップスケール、編集、動画 (Stable Video) を REST で叩ける
NovelAI (外部) $10/月〜 日本ユーザーに人気のアニメ特化クラウド。V4/V4.5 Diffusion・Anlas クレジット・日本語タグ補完が強み
Flux (外部競合) $0 (Schnell) / 商用契約 Schnell は Apache 2.0 で完全無料、Dev は非商用、Pro は BFL ホスト API 課金

チーム規模別コスト試算

※ ユーザー単価ベースの概算です。実際の料金は利用状況やボリュームディスカウントにより異なります。

プラン 5人20人50人100人
DreamStudio
$10/人/月
$50/月
$600/年
$200/月
$2,400/年
$500/月
$6,000/年
$1,000/月
$12,000/年
Stability API
$10/人/月
$50/月
$600/年
$200/月
$2,400/年
$500/月
$6,000/年
$1,000/月
$12,000/年
NovelAI (外部)
$10/人/月
$50/月
$600/年
$200/月
$2,400/年
$500/月
$6,000/年
$1,000/月
$12,000/年

Stable Diffusionのよくある質問

SD 3.5 を動かすにはどの GPU が要りますか?

SD 3.5 Medium は BF16 で約 9.9GB VRAM、最適化すれば 8GB でも動くので RTX 3060 12GB・4060 Ti・4070 などで快適に使えます。SD 3.5 Large は BF16 で約 18GB 必要ですが、NVIDIA の TensorRT FP8 量子化で約 11GB (+ 2.3 倍高速化)、GGUF Q8_0 量子化で 16GB や 12GB カードでも運用可能です。

Flux と Stable Diffusion のどちらを使うべきですか?

写実・商用プロダクション・テキスト描画・プロンプト忠実度なら Flux。OSS 自己ホスト・コスト抑制・LoRA で細かく画風調整・アニメ/イラスト中心なら SD 3.5 + Pony/Illustrious 系が有利です。多くのプロは両方を使い分け、Flux をベース写実に、SD 3.5 派生をアートディレクション用にルーティングしています。

日本でアニメ画像を作るには何を使えばいい?

2026 年の選択肢は 2 つ。(1) 有料で手軽に高品質を求めるなら NovelAI Diffusion V4/V4.5 — 日本語タグ補完・ストーリー機能・無検閲アニメ出力が強み。(2) 無料・無制限・自由度重視ならローカル ComfyUI + Pony Diffusion V6 XL または Illustrious XL。Animagine 風 LoRA を重ねればクラシックなアニメ調にも寄せられます。

商用利用できますか?

モデルごとに異なります。SD 3.5 (Medium/Large) は Stability AI Community License で年間売上 100 万ドル未満なら商用無料、超えたら Enterprise ライセンス契約が必要。Flux.1 [schnell] は Apache 2.0 で完全自由、Flux.1 [dev] は非商用、Flux Pro は BFL ホスト API 経由のみ。Pony/Illustrious 派生はベースの SDXL ライセンス + 各モデル作者の条項なので CivitAI ページで必ず確認してください。

ComfyUI のワークフローはどこで手に入りますか?

CivitAI (civitai.com) がハブです。各モデルページの「Workflows」タブで数千の ComfyUI .json が配布されており、2 段サンプラー・Detailer+Upscaler・マルチ LoRA スタック・SD 3.5 専用フロー・Flux 専用フローなどが揃います。ダウンロードした JSON を ComfyUI 画面にドラッグ&ドロップするだけで読み込めます。Reddit r/comfyui や YouTube チュートリアルも実用的な情報源です。

NSFW や実在人物の描写はできますか?

ベースの SD 3.5 や Flux には安全フィルタが組み込まれていますが、ローカル実行では完全無検閲の派生モデル・LoRA を使用可能です。Pony V6 XL や Illustrious の NSFW 派生は CivitAI で広く配布されています。ただし実在人物の肖像権・パブリシティ権侵害、違法コンテンツ、プラットフォーム規約違反は依然として各国法律と利用規約の問題になるため、制作物の公開には十分な注意が必要です。

Stable Diffusionを比較検討するときの次の一手

Stable Diffusionと近い候補の違い、代替候補、導入ガイドをまとめて確認できます。

Stable Diffusionの代替ツール

すべての代替ツールを見る →

最終更新日: 執筆: SaaS比較ナビ編集部
この記事は独自調査とAI技術を活用して作成しています。