タグ: U-Net

ローカルで動かせる画像生成AIモデル6選【技術比較・VRAM目安・互換性まとめ】

画像生成AIはクラウドサービスだけでなく、自分のPC上でローカル推論できるモデルも多数存在します。本記事では、ローカルで動作する主要モデルを6つ取り上げ、アーキテクチャの違い・必要なVRAM・各ツールとの互換性を徹底解説します。 アーキテクチャ別モデル解説 ① Stable Diffusion 1.5(SD 1.5) アーキテクチャ:UNet + CLIP パラメータ数:約860M ネイティブ解像度:512 × 512 VAE:KL-f

続きを読む

DiffusionとTransformerの境界が曖昧になっている理由

近年のAIモデルを見ていると、「Diffusion」と「Transformer」という2つの技術の境界がどんどん曖昧になってきています。 特に画像生成やマルチモーダルAIの分野では、この2つが組み合わさるのが当たり前になりつつあります。 本記事では、その理由を整理しながら、なぜこのような変化が起きているのかを分かりやすく解説します。 DiffusionとTransformerの本質的な違い まず重要なのは、この2つはそもそも役割が異なる

続きを読む

Stable Diffusion U-Net の ONNX に別の ONNX モデルを結合する方法

Stable Diffusion ONNX U-Net に別モデルを統合する方法 Stable Diffusion の ONNX 版 U-Net を改造して、別の ONNX モデルを内部に結合することで、 IP-Adapter カスタム Attention Control 信号 などを直接モデル内部に組み込むことができます。 この記事では 既存の model.onnx に別の model.onnx を統合する方法を紹介します。 例として

続きを読む