タグ:Hugging Face – AIディベロッパーblog

タグ: Hugging Face

Seedance 2.0とWan 2.2を徹底比較！ローカルで動かせるAI動画生成モデルはどっち？

投稿:07/02/2026

投稿先動画

AI動画生成の分野で注目を集める「Seedance 2.0」と「Wan 2.2」。この2つは似たような文脈で語られることが多いですが、実は根本的に異なる性質を持つモデルです。本記事では、両者の違いを整理したうえで、ローカル環境でWan 2.2を動かすための要件と手順を解説します。 Seedance 2.0とは Seedance 2.0は、TikTokやDouyinを運営するByteDanceが開発したAI動画生成モデルです。テキスト・画

Qwenモデルファミリーについてまとめてみました

投稿:05/22/2026

投稿先その他

「Qwenってよく聞くけど、モデルが多すぎて何が何だかわからない」——そんな声をよく耳にします。本記事では、Qwenの概要・ライセンス・モデルファミリーの全体像をわかりやすく整理します。 Qwenとは Qwen（クウェン）は、中国テック大手 Alibaba Cloud（アリババクラウド）が開発・公開する大規模AIモデルのファミリー総称です。正式名称は通義千問（Tōngyì Qiānwèn）。「千（Qian）＝千」と「問（Wen）＝問

Phi-3 Mini + OnnxRuntimeGenAI で作る C# 翻訳エージェント

投稿:04/14/2026

投稿先アプリケーション開発

1. Phi-3 Mini とは？ — 小型SLMの実力 Phi-3 Mini は Microsoft が 2024 年に公開した Small Language Model (SLM) です。パラメータ数は 3.8 億（3.8B）と GPT-4 系の 1/100 以下でありながら、多くのベンチマークで同規模または大規模モデルに匹敵する精度を達成しています。なぜ翻訳エージェントに向いているのか？日英翻訳の精度が高い — 高品質な英語

Stable Diffusionで思い通りの画像を生成するために学習データから理解する

投稿:04/09/2026

投稿先その他

Stable Diffusionで思い通りの画像を生成するには、モデルがどのように学習されているかを理解することが近道です。この記事では、主要な学習データセットの構造を解説しながら、そこから導き出せるプロンプトのコツをまとめます。学習データセットとは何か Stable Diffusionのような画像生成AIは、大量の「画像とテキストのペア」を使って学習します。モデルは「このテキストが入力されたとき、この画像に近いものを生成せよ」という

WAN動画生成で緑のブロックノイズが出る原因と解決法【テキストエンコーダーの選び方】

投稿:03/28/2026

投稿先動画

WAN 2.1で動画生成を試みたとき、出力が緑がかったブロックノイズのような壊れた画像になった経験はないでしょうか。この問題の原因は、テキストエンコーダーの種類の間違いとFP8量子化の非互換性の組み合わせにあります。原因①：テキストエンコーダーのアーキテクチャが違うよく混同されるのが、以下の2つのエンコーダーです。モデル使うT5エンコーダー FLUX T5-XXL（標準） WAN 2.1 umt5-XXL（UniMax T5、別

Hugging Faceモデルの保存場所・容量・削除方法まとめ（QwenやStable Diffusionにも対応）

投稿:03/27/2026

投稿先アプリケーション開発

AIモデル（例：Qwen・Stable Diffusionなど）を使っていると、「どこにダウンロードされてるの？」「気づいたら容量がヤバい…」と感じたことはありませんか？この記事では、Hugging Face系モデルの保存場所・容量の仕組み・削除方法・保存先変更まで、まとめて解説します。 ■ モデルはどこにダウンロードされるのか？ from_pretrained() を使うと、モデルは自動的に Hugging Faceのキャッシュ領