タグ: onnx

ONNX Runtimeの「ORT_SEQUENTIAL」と「ORT_PARALLEL」の違いを解説

ONNX Runtime(ORT)を使っていると、ORT_SEQUENTIAL や ORT_PARALLEL という設定を見かけることがあります。 これらは Execution Mode(実行モード) を指定する重要な設定で、推論速度やCPU使用率に影響します。 この記事では、 ORT_SEQUENTIAL ORT_PARALLEL の違いを、PythonとC#のコード例付きでわかりやすく解説します。 ORT_SEQUENTIALとは

続きを読む

ONNX変換時のエラー「MultiHeadAttention の次元不一致」を徹底解説|dynamic_axesとは何か?

ONNXモデルを読み込む際に、以下のようなエラーに遭遇したことはありませんか? Node (MultiHeadAttention_28) Op (MultiHeadAttention) [ShapeInferenceError] Inputs 0 (query) shall be 3 or 5 dimensions この記事では、このエラーの意味と原因、さらに解決に重要な「dynamic_axes」の考え方と書き方について、実践的に解説

続きを読む

VAEとは?Stable Diffusionでの役割とONNXへの変換方法(encoder / decoder分離)

VAE(Variational Autoencoder)とは VAE(Variational Autoencoder)は、画像を「圧縮」と「復元」するためのニューラルネットワークです。 Stable Diffusion では、画像生成の効率を高めるために重要な役割を担っています。 VAEは主に次の2つの構成要素から成り立っています: Encoder(エンコーダー) 画像(RGB)を潜在表現(latent)に圧縮する Decoder(デコ

続きを読む

Phi-3 Mini + OnnxRuntimeGenAI で作る C# 翻訳エージェント

1. Phi-3 Mini とは? — 小型SLMの実力 Phi-3 Mini は Microsoft が 2024 年に公開した Small Language Model (SLM) です。パラメータ数は 3.8 億(3.8B) と GPT-4 系の 1/100 以下でありながら、多くのベンチマークで同規模または大規模モデルに匹敵する精度を達成しています。 なぜ翻訳エージェントに向いているのか? 日英翻訳の精度が高い — 高品質な英語

続きを読む

PyInstallerでStable DiffusionやQwenなどAIアプリをスタンドアロン化する方法と注意

Python製のAIアプリ(Stable Diffusion、Qwen、Wanなど)を「Python未導入のPCでもそのまま動くスタンドアロン実行ファイル」にしたい場合、よく使われるのが PyInstaller です。 pip install pyinstaller pyinstaller –onefile main.py しかし、AI系ライブラリを含むアプリでは単純にビルドしただけでは失敗することが多く、以下のような追加オ

続きを読む

ONNX Runtimeの「ORT_SEQUENTIAL」と「ORT_PARALLEL」の違いを解説

ONNX Runtime(ORT)を使っていると、ORT_SEQUENTIAL や ORT_PARALLEL という設定を見かけることがあります。これらは Execution Mode(実行モード) に関する重要な設定です。 この記事では、それぞれの違いと使い分けについてわかりやすく解説します。 ORT_SEQUENTIALとは ORT_SEQUENTIAL は 逐次実行モード です。 特徴 モデル内の処理(ノード)を 順番に1つずつ実

続きを読む

safetensorsの「配線」はどこにある?Netronで線が見えない理由をわかりやすく解説

機械学習モデル(特にTransformer系)を触っていると、.safetensors ファイルをNetronで開いたときに、 「ノードが並んでいるだけで、配線(接続)が見えない」 という疑問にぶつかることがあります。 この記事ではこの現象の理由と、実際にブロックの接続(配線)がどこに記録されているのかを整理して解説します。 なぜNetronで配線が見えないのか? 結論から言うと: safetensorsには「配線情報」が入っていないた

続きを読む

Stable Diffusion U-Net の ONNX に別の ONNX モデルを結合する方法

Stable Diffusion ONNX U-Net に別モデルを統合する方法 Stable Diffusion の ONNX 版 U-Net を改造して、別の ONNX モデルを内部に結合することで、 IP-Adapter カスタム Attention Control 信号 などを直接モデル内部に組み込むことができます。 この記事では 既存の model.onnx に別の model.onnx を統合する方法を紹介します。 例として

続きを読む