画像生成AIはクラウドサービスだけでなく、自分のPC上でローカル推論できるモデルも多数存在します。本記事では、ローカルで動作する主要モデルを6つ取り上げ、アーキテクチャの違い・必要なVRAM・各ツールとの互換性を徹底解説します。 アーキテクチャ別モデル解説 ① Stable Diffusion 1.5(SD 1.5) アーキテクチャ:UNet + CLIP パラメータ数:約860M ネイティブ解像度:512 × 512 VAE:KL-f
タグ: U-Net
近年のAIモデルを見ていると、「Diffusion」と「Transformer」という2つの技術の境界がどんどん曖昧になってきています。 特に画像生成やマルチモーダルAIの分野では、この2つが組み合わさるのが当たり前になりつつあります。 本記事では、その理由を整理しながら、なぜこのような変化が起きているのかを分かりやすく解説します。 DiffusionとTransformerの本質的な違い まず重要なのは、この2つはそもそも役割が異なる
Stable Diffusion ONNX U-Net に別モデルを統合する方法 Stable Diffusion の ONNX 版 U-Net を改造して、別の ONNX モデルを内部に結合することで、 IP-Adapter カスタム Attention Control 信号 などを直接モデル内部に組み込むことができます。 この記事では 既存の model.onnx に別の model.onnx を統合する方法を紹介します。 例として

