タグ:LoRA – AIディベロッパーblog

タグ: LoRA

ローカルで動かせる画像生成AIモデル6選【技術比較・VRAM目安・互換性まとめ】

投稿:05/19/2026

画像生成AIはクラウドサービスだけでなく、自分のPC上でローカル推論できるモデルも多数存在します。本記事では、ローカルで動作する主要モデルを6つ取り上げ、アーキテクチャの違い・必要なVRAM・各ツールとの互換性を徹底解説します。アーキテクチャ別モデル解説 ① Stable Diffusion 1.5（SD 1.5）アーキテクチャ：UNet + CLIP パラメータ数：約860M ネイティブ解像度：512 × 512 VAE：KL-f

OpenPoseとは？Qwen Image EditでOpen poseを使えるか？

投稿:04/20/2026

投稿先画像処理・作成

OpenPoseとは？Qwen Image EditでAnyPoseモデルを使ったポーズ転写の完全ガイド画像生成AIの世界では「ポーズを自由に制御したい」というニーズは非常に高いです。本記事では、OpenPoseの基本概念から、最新のQwen Image EditとAnyPoseモデルを組み合わせたポーズ転写の実装方法まで、サンプルコードとともに詳しく解説します。 📌 目次 OpenPoseとは何か使用するモデル一覧 OpenPos

Stable Diffusionで思い通りの画像を生成するために学習データから理解する

投稿:04/09/2026

投稿先その他

Stable Diffusionで思い通りの画像を生成するには、モデルがどのように学習されているかを理解することが近道です。この記事では、主要な学習データセットの構造を解説しながら、そこから導き出せるプロンプトのコツをまとめます。学習データセットとは何か Stable Diffusionのような画像生成AIは、大量の「画像とテキストのペア」を使って学習します。モデルは「このテキストが入力されたとき、この画像に近いものを生成せよ」という

WAN 2.1の速度向上Self-Forcing とは何か？

投稿:04/06/2026

投稿先動画

WAN 2.1（Wan-AI製）は、中国アリババグループ傘下の研究チームが開発・公開したオープンソースの動画生成AIモデルです。テキストから動画を生成するT2V（Text-to-Video）、画像から動画を生成するI2V（Image-to-Video）、動画編集など複数のタスクに対応しており、2025年初頭に公開されて以来、ComfyUI ユーザーを中心に急速に普及しました。モデルの規模は 1.3B（13億パラメータ）と 14B（1

WanによるAI動画生成で「プロンプトを書いたのに人物が全然動かない」場合のパラメーターの見直し

投稿:04/02/2026

投稿先動画

WanによるAI動画生成で「プロンプトを書いたのに人物が全然動かない」という経験はありませんか？この記事では、Wanで人物の動きを強く引き出すプロンプトのコツと、シンプルな実行コードをまとめて解説します。なぜ人物が動かないのか？プロンプトの書き方以前に、パラメータ設定が原因でほぼ動かなくなるケースが多いです。まず以下を確認してください。パラメータ NG値推奨値 guidance_scale 1～２（低すぎる） 5.0〜7.0 n

Qwen Image Edit + LoRAで2回目から高速になる理由【キャッシュの仕組みを解説】

投稿:03/31/2026

投稿先アプリケーション開発

Qwen Image EditでLoRAを使っていると、初回は1時間かかるのに、2回目からは10分で終わるという現象に気づいた方も多いのではないでしょうか。しかも、プログラムを再起動しても2回目以降は速いまま。この記事では、その理由をキャッシュの仕組みから丁寧に解説します。結論：2種類のキャッシュが組み合わさっている速度差の正体は、主に以下の2つのキャッシュ機構です。 OSのページキャッシュ（RAMへのファイルキャッシュ） CUDA

safetensorsの「配線」はどこにある？Netronで線が見えない理由をわかりやすく解説

投稿:03/25/2026

投稿先アプリケーション開発

機械学習モデル（特にTransformer系）を触っていると、.safetensors ファイルをNetronで開いたときに、「ノードが並んでいるだけで、配線（接続）が見えない」という疑問にぶつかることがあります。この記事ではこの現象の理由と、実際にブロックの接続（配線）がどこに記録されているのかを整理して解説します。なぜNetronで配線が見えないのか？結論から言うと： safetensorsには「配線情報」が入っていないた

Stable DiffusionとLCMとは？生成AIの仕組みと高速化技術をわかりやすく解説

投稿:03/19/2026

投稿先画像処理・作成

近年、画像生成AIの分野で注目されている「Stable Diffusion」。そして、その高速化技術として話題になっている「LCM（Latent Consistency Model）」。この記事では、これらの技術の基本から違いまで、初心者にもわかりやすく解説します。 Stable Diffusionとは？生成モデルの一種 Stable Diffusionは、テキストから画像を生成できるAIモデルで、**生成モデル（Generative

Stable Diffusion U-Net の ONNX に別の ONNX モデルを結合する方法

投稿:03/17/2026

投稿先その他

Stable Diffusion ONNX U-Net に別モデルを統合する方法 Stable Diffusion の ONNX 版 U-Net を改造して、別の ONNX モデルを内部に結合することで、 IP-Adapter カスタム Attention Control 信号などを直接モデル内部に組み込むことができます。この記事では既存の model.onnx に別の model.onnx を統合する方法を紹介します。例として