タグ:ControlNet – AIディベロッパーblog

タグ: ControlNet

ローカルで動かせる画像生成AIモデル6選【技術比較・VRAM目安・互換性まとめ】

投稿:05/19/2026

画像生成AIはクラウドサービスだけでなく、自分のPC上でローカル推論できるモデルも多数存在します。本記事では、ローカルで動作する主要モデルを6つ取り上げ、アーキテクチャの違い・必要なVRAM・各ツールとの互換性を徹底解説します。アーキテクチャ別モデル解説 ① Stable Diffusion 1.5（SD 1.5）アーキテクチャ：UNet + CLIP パラメータ数：約860M ネイティブ解像度：512 × 512 VAE：KL-f

OpenPoseとは？Qwen Image EditでOpen poseを使えるか？

投稿:04/20/2026

投稿先画像処理・作成

OpenPoseとは？Qwen Image EditでAnyPoseモデルを使ったポーズ転写の完全ガイド画像生成AIの世界では「ポーズを自由に制御したい」というニーズは非常に高いです。本記事では、OpenPoseの基本概念から、最新のQwen Image EditとAnyPoseモデルを組み合わせたポーズ転写の実装方法まで、サンプルコードとともに詳しく解説します。 📌 目次 OpenPoseとは何か使用するモデル一覧 OpenPos

WAN 2.1の速度向上Self-Forcing とは何か？

投稿:04/06/2026

投稿先動画

WAN 2.1（Wan-AI製）は、中国アリババグループ傘下の研究チームが開発・公開したオープンソースの動画生成AIモデルです。テキストから動画を生成するT2V（Text-to-Video）、画像から動画を生成するI2V（Image-to-Video）、動画編集など複数のタスクに対応しており、2025年初頭に公開されて以来、ComfyUI ユーザーを中心に急速に普及しました。モデルの規模は 1.3B（13億パラメータ）と 14B（1

IP-Adapter-FaceIDとControlNet（OpenPose）の仕組みをわかりやすく解説

投稿:03/30/2026

投稿先画像処理・作成

Stable Diffusion系の画像生成でよく使われる IP-Adapter-FaceID と ControlNet（OpenPose）。どちらも「条件を与えて画像をコントロールする」技術ですが、内部の仕組みはかなり異なります。この記事では、以下を順番に解説します：顔特徴ベクトルとは何か Cross-Attention Layer の役割 IP-Adapter-FaceID の仕組み ControlNet（OpenPose）

Stable Diffusion U-Net の ONNX に別の ONNX モデルを結合する方法

投稿:03/17/2026

投稿先その他

Stable Diffusion ONNX U-Net に別モデルを統合する方法 Stable Diffusion の ONNX 版 U-Net を改造して、別の ONNX モデルを内部に結合することで、 IP-Adapter カスタム Attention Control 信号などを直接モデル内部に組み込むことができます。この記事では既存の model.onnx に別の model.onnx を統合する方法を紹介します。例として