タグ: Stable Diffusion

ローカルで動かせる画像生成AIモデル6選【技術比較・VRAM目安・互換性まとめ】

画像生成AIはクラウドサービスだけでなく、自分のPC上でローカル推論できるモデルも多数存在します。本記事では、ローカルで動作する主要モデルを6つ取り上げ、アーキテクチャの違い・必要なVRAM・各ツールとの互換性を徹底解説します。 アーキテクチャ別モデル解説 ① Stable Diffusion 1.5(SD 1.5) アーキテクチャ:UNet + CLIP パラメータ数:約860M ネイティブ解像度:512 × 512 VAE:KL-f

続きを読む

UNetとは何か?safetensors・Diffusersとの違いまでわかりやすく解説

AI画像生成を学んでいると、「UNet」「safetensors」「Diffusers」といった用語が頻繁に出てきます。それぞれ関連はありますが、役割はまったく異なります。 この記事では、 UNetとは何か safetensorsとの違い Diffusersの意味(略語も含む) を、初心者でも理解できるように整理して解説します。 UNetとは? UNet(ユー・ネット)は、**画像処理に使われるニューラルネットワークの構造(アーキテクチ

続きを読む

VAEとは?Stable Diffusionでの役割とONNXへの変換方法(encoder / decoder分離)

VAE(Variational Autoencoder)とは VAE(Variational Autoencoder)は、画像を「圧縮」と「復元」するためのニューラルネットワークです。 Stable Diffusion では、画像生成の効率を高めるために重要な役割を担っています。 VAEは主に次の2つの構成要素から成り立っています: Encoder(エンコーダー) 画像(RGB)を潜在表現(latent)に圧縮する Decoder(デコ

続きを読む

Stable Diffusionのメモリ最適化まとめ(CPU offload / slicing / bitsandbytes / accelerate)

Stable Diffusionなどの画像生成モデルを動かすとき、特に問題になるのが「VRAM不足」です。この記事では、Diffusersでよく使われるメモリ最適化機能と、その仕組み・注意点をまとめます。 メモリ最適化機能の概要 enable_model_cpu_offload() モデル全体をGPUに常駐させず、必要なときだけCPUからGPUへ転送する仕組みです。 使う直前にGPUへロード 使い終わったらCPUへ戻す 特徴 VRAM使

続きを読む

Stable Diffusionで思い通りの画像を生成するために学習データから理解する

Stable Diffusionで思い通りの画像を生成するには、モデルがどのように学習されているかを理解することが近道です。この記事では、主要な学習データセットの構造を解説しながら、そこから導き出せるプロンプトのコツをまとめます。 学習データセットとは何か Stable Diffusionのような画像生成AIは、大量の「画像とテキストのペア」を使って学習します。モデルは「このテキストが入力されたとき、この画像に近いものを生成せよ」という

続きを読む

PyInstallerでStable DiffusionやQwenなどAIアプリをスタンドアロン化する方法と注意

Python製のAIアプリ(Stable Diffusion、Qwen、Wanなど)を「Python未導入のPCでもそのまま動くスタンドアロン実行ファイル」にしたい場合、よく使われるのが PyInstaller です。 pip install pyinstaller pyinstaller –onefile main.py しかし、AI系ライブラリを含むアプリでは単純にビルドしただけでは失敗することが多く、以下のような追加オ

続きを読む

IP-Adapter-FaceIDとControlNet(OpenPose)の仕組みをわかりやすく解説

Stable Diffusion系の画像生成でよく使われる IP-Adapter-FaceID と ControlNet(OpenPose)。 どちらも「条件を与えて画像をコントロールする」技術ですが、 内部の仕組みはかなり異なります。 この記事では、以下を順番に解説します: 顔特徴ベクトルとは何か Cross-Attention Layer の役割 IP-Adapter-FaceID の仕組み ControlNet(OpenPose)

続きを読む

Hugging Faceモデルの保存場所・容量・削除方法まとめ(QwenやStable Diffusionにも対応)

AIモデル(例:Qwen・Stable Diffusionなど)を使っていると、 「どこにダウンロードされてるの?」「気づいたら容量がヤバい…」と感じたことはありませんか? この記事では、Hugging Face系モデルの保存場所・容量の仕組み・削除方法・保存先変更まで、まとめて解説します。 ■ モデルはどこにダウンロードされるのか? from_pretrained() を使うと、モデルは自動的に Hugging Faceのキャッシュ領

続きを読む

OpenRAILとは?初心者でもわかる「責任あるAIライセンス」の仕組み。できることできない事

近年、画像生成AIやテキスト生成AIの普及に伴い、「AIモデルの利用ルール」が重要視されています。 その中でも注目されているのが OpenRAIL(Open Responsible AI License) です。 この記事では、OpenRAILの概要から「できること・できないこと」まで、わかりやすく解説します。 ■ OpenRAILとは? OpenRAILとは、 AIモデルの自由な利用を認めつつ「責任ある使い方」を義務付けるライセンスで

続きを読む

Stable DiffusionとLCMとは?生成AIの仕組みと高速化技術をわかりやすく解説

近年、画像生成AIの分野で注目されている「Stable Diffusion」。そして、その高速化技術として話題になっている「LCM(Latent Consistency Model)」。 この記事では、これらの技術の基本から違いまで、初心者にもわかりやすく解説します。 Stable Diffusionとは?生成モデルの一種 Stable Diffusionは、テキストから画像を生成できるAIモデルで、**生成モデル(Generative

続きを読む

Stable Diffusion U-Net の ONNX に別の ONNX モデルを結合する方法

Stable Diffusion ONNX U-Net に別モデルを統合する方法 Stable Diffusion の ONNX 版 U-Net を改造して、別の ONNX モデルを内部に結合することで、 IP-Adapter カスタム Attention Control 信号 などを直接モデル内部に組み込むことができます。 この記事では 既存の model.onnx に別の model.onnx を統合する方法を紹介します。 例として

続きを読む