DeepSeek V3では問題なく動作していたJSON出力が、V4 Flashに移行した途端に壊れる・空になるというケースが多数報告されています。この記事では原因の調査過程と、現時点で取れる対策をまとめます。 症状:content が空白トークンで埋まって返ってくる 典型的な症状は以下のようなレスポンスです。completion_tokens が 150〜220 あるにもかかわらず、content がスペースだらけで実質空になっています
タグ: エラー
VOICEVOXとは? VOICEVOXは、無料で使えるローカル動作の音声合成ソフトです。ずんだもん・四国めたん・春日部つむぎなど、個性豊かなキャラクターボイスを使って日本語テキストを音声に変換できます。 完全ローカル動作(インターネット不要) 商用・個人利用ともに無料(各キャラクターの利用規約要確認) REST API経由でPythonから簡単に呼び出し可能 Windows / Mac / Linux 対応 VOICEVOX Engi
「ChatGPTみたいなAIを、自分のPCだけで無料&無制限に使いたい」 そんな人におすすめなのが、ローカルAI実行ツール Ollama と、高性能モデル DeepSeek-R1 の組み合わせです。 この方法なら、 月額料金なし API料金なし 回数制限なし 入力データが外部送信されない オフラインでも使える PHPなどのプログラミングも可能 という、かなり強力な環境を作れます。 しかも、VRAM 8GBクラスのGPUでも動作可能です。
ONNXモデルを読み込む際に、以下のようなエラーに遭遇したことはありませんか? Node (MultiHeadAttention_28) Op (MultiHeadAttention) [ShapeInferenceError] Inputs 0 (query) shall be 3 or 5 dimensions この記事では、このエラーの意味と原因、さらに解決に重要な「dynamic_axes」の考え方と書き方について、実践的に解説
Stable Diffusionなどの画像生成モデルを動かすとき、特に問題になるのが「VRAM不足」です。この記事では、Diffusersでよく使われるメモリ最適化機能と、その仕組み・注意点をまとめます。 メモリ最適化機能の概要 enable_model_cpu_offload() モデル全体をGPUに常駐させず、必要なときだけCPUからGPUへ転送する仕組みです。 使う直前にGPUへロード 使い終わったらCPUへ戻す 特徴 VRAM使
1. Phi-3 Mini とは? — 小型SLMの実力 Phi-3 Mini は Microsoft が 2024 年に公開した Small Language Model (SLM) です。パラメータ数は 3.8 億(3.8B) と GPT-4 系の 1/100 以下でありながら、多くのベンチマークで同規模または大規模モデルに匹敵する精度を達成しています。 なぜ翻訳エージェントに向いているのか? 日英翻訳の精度が高い — 高品質な英語
APIを使ったシステムを本番運用していると、ある日突然リクエストが弾かれる――そんな経験はありませんか?原因のほとんどはレートリミット(呼び出し回数・トークン数の上限)への到達です。 しかし実は、APIはレスポンスを返すたびに「残り使用枠」を教えてくれています。その情報は HTTPレスポンスヘッダー に含まれており、PHP の cURL でも簡単に取得できます。この記事では、まずヘッダーを生で確認する方法から始めて、最終的に「使用率90
Python製のAIアプリ(Stable Diffusion、Qwen、Wanなど)を「Python未導入のPCでもそのまま動くスタンドアロン実行ファイル」にしたい場合、よく使われるのが PyInstaller です。 pip install pyinstaller pyinstaller –onefile main.py しかし、AI系ライブラリを含むアプリでは単純にビルドしただけでは失敗することが多く、以下のような追加オ
はじめに 最近のGPU環境では「CUDAは自動で入っているのか?」「PyTorchはどこまで自動でやってくれるのか?」といった疑問を持つ人が多いと思います。 この記事では、Pythonのembed版(ポータブル環境)でCUDA対応PyTorchを使ったGPU推論を行う方法を、最小構成でわかりやすく解説します。 結論(重要ポイントまとめ) RTX 20xx以降でも CUDAは自動では入らない ただし PyTorch(CUDA版)に必要なラ
Wan2.1やWan2.2などの動画生成AIを動かそうとすると、必ずセットで必要になるのが UMT5-XXL というモデルです。「テキストエンコーダー」と呼ばれるこのモデル、一体何をしているのでしょうか。 UMT5-XXL の正式名称と意味 正式名称は Unified Multilingual T5 Extra Extra Large(統合多言語T5・超特大モデル)、HuggingFace上の識別子は google/umt5-xxl で
Stable Diffusion ONNX U-Net に別モデルを統合する方法 Stable Diffusion の ONNX 版 U-Net を改造して、別の ONNX モデルを内部に結合することで、 IP-Adapter カスタム Attention Control 信号 などを直接モデル内部に組み込むことができます。 この記事では 既存の model.onnx に別の model.onnx を統合する方法を紹介します。 例として

