画像・動画生成AIを使っていると必ず出てくる Guidance Scale(CFG Scale)と、最近よく見かける True CFG。「なんとなく数値を変えて試している」という方も多いと思いますが、この記事ではその仕組みと、実用的な設定値を口語でわかりやすく解説します。


そもそも拡散モデルは何をしているのか

WAN や Qwen ベースの生成モデルは、「ノイズだらけの画像から、少しずつノイズを取り除いて絵を作る」 という仕組み(拡散モデル)で動いています。

イメージとしては、砂嵐のかかったテレビ画面から、少しずつ砂を取り除いていくような処理です。そのとき「どの方向にノイズを取り除くか」をプロンプトで誘導しているのが CFG(Classifier-Free Guidance)の役割です。


Guidance Scale とは何か

Guidance Scale(CFG Scale)は、ひとことで言うと 「プロンプトにどれだけ縛られるか」のアクセル です。

内部的には次のような計算をしています:

最終的な進む方向 = 条件なし予測 + scale × (条件あり予測 − 条件なし予測)

「プロンプトありの予測」と「プロンプトなしの予測(空文)」の差分を取り、それを scale 倍して上乗せしているわけです。

数値ごとの挙動

Guidance Scale 挙動 向いている用途
1.5 〜 3.5 モデルが自由に生成。多様だがプロンプトから外れやすい 創造性重視、実験的な生成
3.5 〜 6.0 自然な動き・品質。破綻しにくいバランス帯 動画・リアル系の安定生成
5.0 〜 8.0 プロンプトの特徴が強調される イラスト・アニメ系
7.0 〜 9.0 細かい指示に忠実。過飽和・破綻のリスクが上がる プロンプト厳守が必要な場合

WAN 動画ではデフォルト 5.0 がよく使われるスタート地点です。


True CFG とは何か

標準 CFG の「ずれ」問題

標準的な CFG 実装には、実は理論上の近似誤差があります。

拡散モデルの「進むべき方向」は、正確には スコア関数(確率の傾き=「こっちに行けば本物の画像に近づく」という方向ベクトル)で定義されています。

ところが標準 CFG は、スコア関数を直接使わず、モデルが予測する ノイズ(ε)をそのまま引き算して混ぜ合わせて います。

ノイズ予測とスコア関数はシンプルな変換で繋がっているものの、その変換が非線形 なため、「ε 空間で混ぜた結果」と「スコア空間で混ぜた結果」は微妙にずれてしまいます。

しかも、この誤差は Guidance Scale を上げるほど大きくなります。スケールを高くしたとき、過剰なコントラストや質感の崩れが出やすいのはこのためです。

True CFG はそのずれを修正する

True CFG は「ε 空間でやっていた計算を、正しいスコア空間でやり直す」実装です。

進む方向の精度が上がるため:

  • 細部の描写がプロンプトに対してより忠実になる
  • 高スケールでも過剰な彩度やコントラスト崩れが出にくい
  • ネガティブプロンプトの効き方がより素直になる

プロンプトへの影響力の「精度」が上がる、というイメージが近いです。


Guidance Scale と True CFG の関係

ここが実用上、最も重要なポイントです。

True CFG をオンにすると、「同じ Guidance Scale でも実質的な強度が上がった感覚」 になります。これまで誤差に消えていたエネルギーが正しい方向へ向く分、プロンプトの忠実性がそのままダイレクトに届くようになるためです。

True CFG をオンにしたら、Guidance Scale を 1〜2 下げて調整するのが定番。

例えばいつも 7 で使っていたなら、True CFG オンで 5〜6 に下げたほうが、同等かむしろクリーンな結果になることが多いです。


実用的な推奨設定まとめ

Guidance Scale の目安(True CFG なし)

用途 推奨値
動画・リアル系の安定生成 3.5 〜 6.0
イラスト・アニメ系 5.0 〜 8.0
プロンプト厳守が必要な場合 7.0 〜 9.0
創造性・多様性を重視 1.5 〜 3.5

True CFG Scale の目安

True CFG Scale 効果
1.0 無効(Standard CFG のみ)
1.5 〜 2.5 穏やかな補正。多くの用途でおすすめ
3.0 〜 3.5 強めの補正。やや実験的な領域
4.0 以上 過剰になりやすい。基本的には避けたほうが無難

True CFG オン時の Guidance Scale 調整例

True CFG なし(従来) True CFG あり(推奨調整後)
Guidance Scale 7 Guidance Scale 5〜6 + True CFG 1.5〜2.5
Guidance Scale 5 Guidance Scale 3.5〜4.5 + True CFG 1.5〜2.0

まとめ

  • Guidance Scale = プロンプトにどれだけ縛られるかのアクセル。上げすぎると崩れる。
  • True CFG = そのガイダンスを理論的に正確な「スコア空間」で計算するオプション。同じスケールでも精度が上がる。
  • True CFG をオンにするときは Guidance Scale を少し下げるのがコツ
  • まずは Guidance Scale 5 + True CFG 1.5〜2.0 あたりから試してみるのがおすすめ。