タグ:エラー – AIディベロッパーblog

タグ: エラーページ 1/2

PyTorchでONNXを「model.onnx」と「model_weights.bin」に分けて出力する方法【古いバージョンにも対応】

投稿:07/08/2026

PyTorchでONNXモデルを書き出す際、大きなモデルではONNX External Data形式を利用して、モデル本体と重みファイルを別々に保存したいことがあります。この記事では、 model.onnx model_weights.bin の2ファイルに分けて出力する方法と、古いPyTorchを使用している場合の対処法を紹介します。通常のONNX出力一般的なONNX出力は次のようになります。 torch.onnx.export

「話しかけると自動で認識して自然な声で返答してくれるシステム」をWindows環境に構築

投稿:07/07/2026

投稿先アプリケーション開発

ローカルPC上で完全に動作する音声会話AIを作る方法を解説します。DeepSeek-R1（Ollama）・Silero VAD・Whisper・VOICEVOXを組み合わせて、「話しかけると自動で認識して自然な声で返答してくれるシステム」をWindows環境に構築します。システム構成マイク音声 ↓ Silero VAD（発話検出） ← 声が来たら自動で反応 ↓ Whisper（音声→テキスト） ↓ DeepSeek-R1 / Oll

Seedance 2.0とWan 2.2を徹底比較！ローカルで動かせるAI動画生成モデルはどっち？

投稿:07/02/2026

投稿先動画

AI動画生成の分野で注目を集める「Seedance 2.0」と「Wan 2.2」。この2つは似たような文脈で語られることが多いですが、実は根本的に異なる性質を持つモデルです。本記事では、両者の違いを整理したうえで、ローカル環境でWan 2.2を動かすための要件と手順を解説します。 Seedance 2.0とは Seedance 2.0は、TikTokやDouyinを運営するByteDanceが開発したAI動画生成モデルです。テキスト・画

AIが作ったコードをAIにデバッグさせる実践的方法論

投稿:06/24/2026

投稿先アプリケーション開発

AIが作ったコードをAIにデバッグさせる実践的方法論 AIが生成した小規模ソフトウェアは「大まかには動く」状態でも、そのまま公開するのは危険である可能性があります。エラーが出ていない段階でも潜むリスクと、それをAI自身に検証させる方法をまとめます。 AIが作るコードのバグに関する主要な研究とその結果 1. 最も包括的な査読論文（2026年3月・arXiv）「Debt Behind the AI Boom」― シンガポール経営大学ほか

AIエージェント型コーディングで頻発する「Infinite Loop / Spinning」とは？またその回避方法は？

投稿:06/16/2026

投稿先アプリケーション開発

エージェント型AIにコードの修正や実装を任せていると、いつまで経っても作業が終わらず、トークンだけが膨大に消費されてしまう現象に遭遇することがあります。これは「Infinite Loop（無限ループ）」または「Spinning（スピニング）」と呼ばれる、エージェント型コーディングシステムの既知の問題です。本記事では、この現象がなぜ起きるのか、どう防ぐのか、そして万が一ループに入ってしまったときの対処法と、AIコストが人間コストを上回る

エージェント型AIとLLMの違い、そして「できること」の本当の範囲

投稿:06/12/2026

投稿先その他

LLMとエージェントの違い LLM(大規模言語モデル)は、テキストを入力として受け取り、テキストを出力する基盤モデルそのものです。質問応答や文章生成など、単発の対話に強みがあります。エージェント型のAI(例:Claude Code)は、LLMを中核として、ファイル操作・コード実行・テスト・検索などのツールを自律的に組み合わせ、複数ステップのタスクを自分で計画・実行・検証するシステムです。LLMが「頭脳」、エージェントは「頭脳+手足+判

なぜAIコーディングは途中から詰まるのか

投稿:06/09/2026

投稿先アプリケーション開発

「AIにコードを書かせれば、プログラミングを知らなくてもアプリが作れる」——そんな期待を持ってAIコーディングを始めた方は多いはずです。しかし実際には、ある程度まで進んだところで突然動かなくなる・進まなくなるという壁にぶつかるケースが後を絶ちません。この記事では、AIコーディングが途中で詰まる本当の原因と、その対策を解説します。そして最後に、残念ながら現状プログラミングスキルとコードを読む力は不要にならないという現実についてもお伝えし

AIによるソフトウェア開発でコードが増えれば増えるほどAIのコーディングパフォーマンスが低下する問題

投稿:06/01/2026

投稿先アプリケーション開発

当社ではエージェント型AI(自分でプロジェクト全体のコードを大まかに調査把握できる)も含めて使ってみてAIでどれだけソフトウェア全体を構築できるのかを制作しながら実験していますが、その際にコードが増えれば増えるほどAIのコーディングパフォーマンスが低下する問題が発生することが体感としてわかってきました。 AIを使ったソフトウェア開発は急速に普及していますが、実際に使ってみると「Aiの作業がどんどん遅くなった」「コードが大きくなればなるほ

AIで中規模ソフトウェアを丸ごと作るのは可能か？その方法論と限界

投稿:05/25/2026

投稿先アプリケーション開発

AIは単一ファイルの生成は得意ですが、複数ファイルにまたがる設計の一貫性・依存関係の維持が苦手です。「とりあえずAIに投げる」だけでは、後から修正も拡張もできない壊れやすいコードが生まれます。この記事では、それを防ぐための具体的な方法論を解説します。 ⚠️ まず知っておくべき：AIへの矛盾した指令は危険 AIは「矛盾をエラーで止める」コンパイラではありません。矛盾した指令を与えると、次のような問題が起きます。パターン AIの実際の挙動

LLMはなぜコードが書けるのか？現状・限界・リスク

投稿:05/21/2026

投稿先その他

ChatGPTやClaude、GitHub CopilotなどのLLM（大規模言語モデル）が、プログラムコードをすらすら書く姿を見て「なぜ？」と思ったことはないでしょうか。また、実際に使ってみると「意外と使えない場面もある」と感じた方も多いはず。この記事では、LLMがコードを書ける仕組みから、現在の実用レベル、エラーを防ぐ方法、そして将来の限界までを解説いたします。なぜLLMはプログラムが書けるのかコードも「テキスト」だからです。

DeepSeek V4 FlashのAPIでJSON出力が空になる問題と対処法

投稿:05/15/2026

投稿先その他

DeepSeek V3では問題なく動作していたJSON出力が、V4 Flashに移行した途端に壊れる・空になるというケースが多数報告されています。この記事では原因の調査過程と、現時点で取れる対策をまとめます。症状：content が空白トークンで埋まって返ってくる典型的な症状は以下のようなレスポンスです。completion_tokens が 150〜220 あるにもかかわらず、content がスペースだらけで実質空になっています

WindowsでVOICEVOXを使いPythonから日本語を話させる方法

投稿:05/08/2026

投稿先その他

VOICEVOXとは？ VOICEVOXは、無料で使えるローカル動作の音声合成ソフトです。ずんだもん・四国めたん・春日部つむぎなど、個性豊かなキャラクターボイスを使って日本語テキストを音声に変換できます。完全ローカル動作（インターネット不要）商用・個人利用ともに無料（各キャラクターの利用規約要確認） REST API経由でPythonから簡単に呼び出し可能 Windows / Mac / Linux 対応 VOICEVOX Engi

【完全無料】Ollamaで“ChatGPTみたいなAI”をローカルPCで動かす方法｜VRAM 8GBでもOK・セキュリティ安心

投稿:05/07/2026

投稿先その他

「ChatGPTみたいなAIを、自分のPCだけで無料＆無制限に使いたい」そんな人におすすめなのが、ローカルAI実行ツール Ollama と、高性能モデル DeepSeek-R1 の組み合わせです。この方法なら、月額料金なし API料金なし回数制限なし入力データが外部送信されないオフラインでも使える PHPなどのプログラミングも可能という、かなり強力な環境を作れます。しかも、VRAM 8GBクラスのGPUでも動作可能です。

ONNX変換時のエラー「MultiHeadAttention の次元不一致」を徹底解説｜dynamic_axesとは何か？

投稿:04/23/2026

投稿先その他

ONNXモデルを読み込む際に、以下のようなエラーに遭遇したことはありませんか？ Node (MultiHeadAttention_28) Op (MultiHeadAttention) [ShapeInferenceError] Inputs 0 (query) shall be 3 or 5 dimensions この記事では、このエラーの意味と原因、さらに解決に重要な「dynamic_axes」の考え方と書き方について、実践的に解説

Stable Diffusionのメモリ最適化まとめ（CPU offload / slicing / bitsandbytes / accelerate）

投稿:04/16/2026

投稿先画像処理・作成

Stable Diffusionなどの画像生成モデルを動かすとき、特に問題になるのが「VRAM不足」です。この記事では、Diffusersでよく使われるメモリ最適化機能と、その仕組み・注意点をまとめます。メモリ最適化機能の概要 enable_model_cpu_offload() モデル全体をGPUに常駐させず、必要なときだけCPUからGPUへ転送する仕組みです。使う直前にGPUへロード使い終わったらCPUへ戻す特徴 VRAM使

Phi-3 Mini + OnnxRuntimeGenAI で作る C# 翻訳エージェント

投稿:04/14/2026

投稿先アプリケーション開発

1. Phi-3 Mini とは？ — 小型SLMの実力 Phi-3 Mini は Microsoft が 2024 年に公開した Small Language Model (SLM) です。パラメータ数は 3.8 億（3.8B）と GPT-4 系の 1/100 以下でありながら、多くのベンチマークで同規模または大規模モデルに匹敵する精度を達成しています。なぜ翻訳エージェントに向いているのか？日英翻訳の精度が高い — 高品質な英語

Claude（Anthropic）・DeepSeek APIの使用率を監視する方法【PHPサンプルつき】

投稿:04/13/2026

投稿先ウェブサイト開発

APIを使ったシステムを本番運用していると、ある日突然リクエストが弾かれる――そんな経験はありませんか？原因のほとんどはレートリミット（呼び出し回数・トークン数の上限）への到達です。しかし実は、APIはレスポンスを返すたびに「残り使用枠」を教えてくれています。その情報は HTTPレスポンスヘッダーに含まれており、PHP の cURL でも簡単に取得できます。この記事では、まずヘッダーを生で確認する方法から始めて、最終的に「使用率90

PyInstallerでStable DiffusionやQwenなどAIアプリをスタンドアロン化する方法と注意

投稿:04/08/2026

投稿先アプリケーション開発

Python製のAIアプリ（Stable Diffusion、Qwen、Wanなど）を「Python未導入のPCでもそのまま動くスタンドアロン実行ファイル」にしたい場合、よく使われるのが PyInstaller です。 pip install pyinstaller pyinstaller –onefile main.py しかし、AI系ライブラリを含むアプリでは単純にビルドしただけでは失敗することが多く、以下のような追加オ