カテゴリー: 画像処理・作成

IP-Adapter-FaceIDとControlNet(OpenPose)の仕組みをわかりやすく解説

Stable Diffusion系の画像生成でよく使われる IP-Adapter-FaceID と ControlNet(OpenPose)。 どちらも「条件を与えて画像をコントロールする」技術ですが、 内部の仕組みはかなり異なります。 この記事では、以下を順番に解説します: 顔特徴ベクトルとは何か Cross-Attention Layer の役割 IP-Adapter-FaceID の仕組み ControlNet(OpenPose)

続きを読む

ONNX Runtimeエラー「MatMulの型不一致」の原因と解決方法(FP16変換手順つき)

エラー内容 ONNXモデルを読み込む際に、以下のようなエラーが出ることがあります。 Microsoft.ML.OnnxRuntime.OnnxRuntimeException: [ErrorCode:Fail] Load model failed: Type Error: Type parameter (T) of Optype (MatMul) bound to different types (tensor(float) and t

続きを読む

Stable DiffusionとLCMとは?生成AIの仕組みと高速化技術をわかりやすく解説

近年、画像生成AIの分野で注目されている「Stable Diffusion」。そして、その高速化技術として話題になっている「LCM(Latent Consistency Model)」。 この記事では、これらの技術の基本から違いまで、初心者にもわかりやすく解説します。 Stable Diffusionとは?生成モデルの一種 Stable Diffusionは、テキストから画像を生成できるAIモデルで、**生成モデル(Generative

続きを読む

QwenImageEditPlusPipeline で 512px 画像が「ズームイン」される原因と修正方法

HuggingFace の diffusers ライブラリに含まれる QwenImageEditPlusPipeline を使って 512×512 の画像を編集しようとすると、出力画像が不自然にズームインされたり画角がズレる現象が起きます。この記事ではその原因とコード修正方法を解説します。 🔍 現象 以下のようなコードで 512×512 の入力画像を処理すると、生成結果が元画像よりも「寄り」になってしまいます。 inputs = { "

続きを読む