タグ:wan – AIディベロッパーblog

タグ: wan

Seedance 2.0とWan 2.2を徹底比較！ローカルで動かせるAI動画生成モデルはどっち？

投稿:07/02/2026

投稿先動画

AI動画生成の分野で注目を集める「Seedance 2.0」と「Wan 2.2」。この2つは似たような文脈で語られることが多いですが、実は根本的に異なる性質を持つモデルです。本記事では、両者の違いを整理したうえで、ローカル環境でWan 2.2を動かすための要件と手順を解説します。 Seedance 2.0とは Seedance 2.0は、TikTokやDouyinを運営するByteDanceが開発したAI動画生成モデルです。テキスト・画

VAEとは？Stable Diffusionでの役割とONNXへの変換方法（encoder / decoder分離）

投稿:04/17/2026

投稿先アプリケーション開発

VAE（Variational Autoencoder）とは VAE（Variational Autoencoder）は、画像を「圧縮」と「復元」するためのニューラルネットワークです。 Stable Diffusion では、画像生成の効率を高めるために重要な役割を担っています。 VAEは主に次の2つの構成要素から成り立っています： Encoder（エンコーダー）画像（RGB）を潜在表現（latent）に圧縮する Decoder（デコ

PyInstallerでStable DiffusionやQwenなどAIアプリをスタンドアロン化する方法と注意

投稿:04/08/2026

投稿先アプリケーション開発

Python製のAIアプリ（Stable Diffusion、Qwen、Wanなど）を「Python未導入のPCでもそのまま動くスタンドアロン実行ファイル」にしたい場合、よく使われるのが PyInstaller です。 pip install pyinstaller pyinstaller –onefile main.py しかし、AI系ライブラリを含むアプリでは単純にビルドしただけでは失敗することが多く、以下のような追加オ

WAN 2.1の速度向上Self-Forcing とは何か？

投稿:04/06/2026

投稿先動画

WAN 2.1（Wan-AI製）は、中国アリババグループ傘下の研究チームが開発・公開したオープンソースの動画生成AIモデルです。テキストから動画を生成するT2V（Text-to-Video）、画像から動画を生成するI2V（Image-to-Video）、動画編集など複数のタスクに対応しており、2025年初頭に公開されて以来、ComfyUI ユーザーを中心に急速に普及しました。モデルの規模は 1.3B（13億パラメータ）と 14B（1

WanによるAI動画生成で「プロンプトを書いたのに人物が全然動かない」場合のパラメーターの見直し

投稿:04/02/2026

投稿先動画

WanによるAI動画生成で「プロンプトを書いたのに人物が全然動かない」という経験はありませんか？この記事では、Wanで人物の動きを強く引き出すプロンプトのコツと、シンプルな実行コードをまとめて解説します。なぜ人物が動かないのか？プロンプトの書き方以前に、パラメータ設定が原因でほぼ動かなくなるケースが多いです。まず以下を確認してください。パラメータ NG値推奨値 guidance_scale 1～２（低すぎる） 5.0〜7.0 n

WAN動画生成で緑のブロックノイズが出る原因と解決法【テキストエンコーダーの選び方】

投稿:03/28/2026

投稿先動画

WAN 2.1で動画生成を試みたとき、出力が緑がかったブロックノイズのような壊れた画像になった経験はないでしょうか。この問題の原因は、テキストエンコーダーの種類の間違いとFP8量子化の非互換性の組み合わせにあります。原因①：テキストエンコーダーのアーキテクチャが違うよく混同されるのが、以下の2つのエンコーダーです。モデル使うT5エンコーダー FLUX T5-XXL（標準） WAN 2.1 umt5-XXL（UniMax T5、別

WAN・Qwenで使う Guidance Scale と True CFG とは？理論をわかりやすく解説

投稿:03/22/2026

投稿先動画

画像・動画生成AIを使っていると必ず出てくる Guidance Scale（CFG Scale）と、最近よく見かける True CFG。「なんとなく数値を変えて試している」という方も多いと思いますが、この記事ではその仕組みと、実用的な設定値を口語でわかりやすく解説します。そもそも拡散モデルは何をしているのか WAN や Qwen ベースの生成モデルは、「ノイズだらけの画像から、少しずつノイズを取り除いて絵を作る」という仕組み（拡散モ

Wan動画生成AIに使われている「UMT5-XXL」とは何か？

投稿:03/21/2026

投稿先動画

Wan2.1やWan2.2などの動画生成AIを動かそうとすると、必ずセットで必要になるのが UMT5-XXL というモデルです。「テキストエンコーダー」と呼ばれるこのモデル、一体何をしているのでしょうか。 UMT5-XXL の正式名称と意味正式名称は Unified Multilingual T5 Extra Extra Large（統合多言語T5・超特大モデル）、HuggingFace上の識別子は google/umt5-xxl で

国会論争から禅問答まで。あらゆる対話をAIとリアルにシュミレーション。(準備中)

DOllsは商用利用可能な人物画像や動画作成をローカルPCで無制限にできるWindowsソフトウェアです。(現在英語バージョンのみ)

その他の当社のサービス

ワードプレスドクターでは、Wordpress カスタマイズや修正、復旧、移行（引っ越し）、エラー修正等のご依頼を承ります。お見積もりは無料です。

＊当サイトへのリンクはご自由にしていただいて構いません。また、引用元をリンクしていただく事、記事のテキストを一部しか使用されない場合は、このブログの情報は自由に転載されても問題ございません。
情報がお役に立ちましたらあなたのメディアから当サイトの記事をご紹介いただけると幸いです。

タグ: wan

その他の当社のサービス

AI Dev.