カテゴリー:アプリケーション開発

カテゴリー: アプリケーション開発ページ 1/2

「話しかけると自動で認識して自然な声で返答してくれるシステム」をWindows環境に構築

投稿:07/07/2026

ローカルPC上で完全に動作する音声会話AIを作る方法を解説します。DeepSeek-R1（Ollama）・Silero VAD・Whisper・VOICEVOXを組み合わせて、「話しかけると自動で認識して自然な声で返答してくれるシステム」をWindows環境に構築します。システム構成マイク音声 ↓ Silero VAD（発話検出） ← 声が来たら自動で反応 ↓ Whisper（音声→テキスト） ↓ DeepSeek-R1 / Oll

AIが作ったコードをAIにデバッグさせる実践的方法論

投稿:06/24/2026

投稿先アプリケーション開発

AIが作ったコードをAIにデバッグさせる実践的方法論 AIが生成した小規模ソフトウェアは「大まかには動く」状態でも、そのまま公開するのは危険である可能性があります。エラーが出ていない段階でも潜むリスクと、それをAI自身に検証させる方法をまとめます。 AIが作るコードのバグに関する主要な研究とその結果 1. 最も包括的な査読論文（2026年3月・arXiv）「Debt Behind the AI Boom」― シンガポール経営大学ほか

無制限に無料でAIコーディング　VRAM 8GB のノートPCでQwen3 Coderを動かしてみる

投稿:06/18/2026

投稿先アプリケーション開発

無制限に無料でAIコーディングできるオープンソースのモデルQwen3 Coder　をVRAM 8GB のノートPCで動かしてみてその実力を見てみたいと思います。まずこちらの記事に従いOllamaを入れます。このソフトはローカルでChatGPTのような感じでLLMを動かすためのソフトです。次にモデル選択画面プルダウンで、qwen3-coderと入れて、qwen3-coderを選択状態にし何でもいいのでチャットを行います。するとモデル

AIエージェント型コーディングで頻発する「Infinite Loop / Spinning」とは？またその回避方法は？

投稿:06/16/2026

投稿先アプリケーション開発

エージェント型AIにコードの修正や実装を任せていると、いつまで経っても作業が終わらず、トークンだけが膨大に消費されてしまう現象に遭遇することがあります。これは「Infinite Loop（無限ループ）」または「Spinning（スピニング）」と呼ばれる、エージェント型コーディングシステムの既知の問題です。本記事では、この現象がなぜ起きるのか、どう防ぐのか、そして万が一ループに入ってしまったときの対処法と、AIコストが人間コストを上回る

なぜAIコーディングは途中から詰まるのか

投稿:06/09/2026

投稿先アプリケーション開発

「AIにコードを書かせれば、プログラミングを知らなくてもアプリが作れる」——そんな期待を持ってAIコーディングを始めた方は多いはずです。しかし実際には、ある程度まで進んだところで突然動かなくなる・進まなくなるという壁にぶつかるケースが後を絶ちません。この記事では、AIコーディングが途中で詰まる本当の原因と、その対策を解説します。そして最後に、残念ながら現状プログラミングスキルとコードを読む力は不要にならないという現実についてもお伝えし

AIによるソフトウェア開発でコードが増えれば増えるほどAIのコーディングパフォーマンスが低下する問題

投稿:06/01/2026

投稿先アプリケーション開発

当社ではエージェント型AI(自分でプロジェクト全体のコードを大まかに調査把握できる)も含めて使ってみてAIでどれだけソフトウェア全体を構築できるのかを制作しながら実験していますが、その際にコードが増えれば増えるほどAIのコーディングパフォーマンスが低下する問題が発生することが体感としてわかってきました。 AIを使ったソフトウェア開発は急速に普及していますが、実際に使ってみると「Aiの作業がどんどん遅くなった」「コードが大きくなればなるほ

AIで中規模ソフトウェアを丸ごと作るのは可能か？その方法論と限界

投稿:05/25/2026

投稿先アプリケーション開発

AIは単一ファイルの生成は得意ですが、複数ファイルにまたがる設計の一貫性・依存関係の維持が苦手です。「とりあえずAIに投げる」だけでは、後から修正も拡張もできない壊れやすいコードが生まれます。この記事では、それを防ぐための具体的な方法論を解説します。 ⚠️ まず知っておくべき：AIへの矛盾した指令は危険 AIは「矛盾をエラーで止める」コンパイラではありません。矛盾した指令を与えると、次のような問題が起きます。パターン AIの実際の挙動

ONNX Runtimeの「ORT_SEQUENTIAL」と「ORT_PARALLEL」の違いを解説

投稿:05/12/2026

投稿先アプリケーション開発

ONNX Runtime（ORT）を使っていると、ORT_SEQUENTIAL や ORT_PARALLEL という設定を見かけることがあります。これらは Execution Mode（実行モード）を指定する重要な設定で、推論速度やCPU使用率に影響します。この記事では、 ORT_SEQUENTIAL ORT_PARALLEL の違いを、PythonとC#のコード例付きでわかりやすく解説します。 ORT_SEQUENTIALとは

CUDA Version表示の正しい意味と、動作するGPU・安全なバージョン選び

投稿:04/27/2026

投稿先アプリケーション開発

はじめに nvidia-smi を実行すると、次のような表示を見ることがあります。 CUDA Version: 13.0 この表示を見て、「CUDA 13が使える」「どのNVIDIA GPUでも動く」と思ってしまうケースが非常に多いですが、これは正確ではありません。この記事では、 CUDAとは何か（簡単に） CUDA Version 表示の本当の意味 CUDAが動くGPUの条件推論用途でCUDAを自分で入れる必要があるのか失

VAEとは？Stable Diffusionでの役割とONNXへの変換方法（encoder / decoder分離）

投稿:04/17/2026

投稿先アプリケーション開発

VAE（Variational Autoencoder）とは VAE（Variational Autoencoder）は、画像を「圧縮」と「復元」するためのニューラルネットワークです。 Stable Diffusion では、画像生成の効率を高めるために重要な役割を担っています。 VAEは主に次の2つの構成要素から成り立っています： Encoder（エンコーダー）画像（RGB）を潜在表現（latent）に圧縮する Decoder（デコ

Phi-3 Mini + OnnxRuntimeGenAI で作る C# 翻訳エージェント

投稿:04/14/2026

投稿先アプリケーション開発

1. Phi-3 Mini とは？ — 小型SLMの実力 Phi-3 Mini は Microsoft が 2024 年に公開した Small Language Model (SLM) です。パラメータ数は 3.8 億（3.8B）と GPT-4 系の 1/100 以下でありながら、多くのベンチマークで同規模または大規模モデルに匹敵する精度を達成しています。なぜ翻訳エージェントに向いているのか？日英翻訳の精度が高い — 高品質な英語

PyInstallerでStable DiffusionやQwenなどAIアプリをスタンドアロン化する方法と注意

投稿:04/08/2026

投稿先アプリケーション開発

Python製のAIアプリ（Stable Diffusion、Qwen、Wanなど）を「Python未導入のPCでもそのまま動くスタンドアロン実行ファイル」にしたい場合、よく使われるのが PyInstaller です。 pip install pyinstaller pyinstaller –onefile main.py しかし、AI系ライブラリを含むアプリでは単純にビルドしただけでは失敗することが多く、以下のような追加オ

ONNX Runtimeの「ORT_SEQUENTIAL」と「ORT_PARALLEL」の違いを解説

投稿:04/07/2026

投稿先アプリケーション開発

ONNX Runtime（ORT）を使っていると、ORT_SEQUENTIAL や ORT_PARALLEL という設定を見かけることがあります。これらは Execution Mode（実行モード）に関する重要な設定です。この記事では、それぞれの違いと使い分けについてわかりやすく解説します。 ORT_SEQUENTIALとは ORT_SEQUENTIAL は逐次実行モードです。特徴モデル内の処理（ノード）を順番に1つずつ実

GGUFファイルの「Q・K・V」って何？AttentionとQuantizationをわかりやすく解説

投稿:04/01/2026

投稿先アプリケーション開発

GGUFファイルのファイル名に付いている Q・K・V という文字、気になったことはありませんか？これはLLM（大規模言語モデル）の中核技術である Attention（注意機構）と量子化（Quantization）に深く関係しています。この記事ではそれぞれをわかりやすく解説します。 Attention（注意機構）とは？一言で言うと「文章の中でどの単語がどの単語に関係しているか」を計算する仕組みです。具体例次の文を見てみましょ

Qwen Image Edit + LoRAで2回目から高速になる理由【キャッシュの仕組みを解説】

投稿:03/31/2026

投稿先アプリケーション開発

Qwen Image EditでLoRAを使っていると、初回は1時間かかるのに、2回目からは10分で終わるという現象に気づいた方も多いのではないでしょうか。しかも、プログラムを再起動しても2回目以降は速いまま。この記事では、その理由をキャッシュの仕組みから丁寧に解説します。結論：2種類のキャッシュが組み合わさっている速度差の正体は、主に以下の2つのキャッシュ機構です。 OSのページキャッシュ（RAMへのファイルキャッシュ） CUDA

Hugging Faceモデルの保存場所・容量・削除方法まとめ（QwenやStable Diffusionにも対応）

投稿:03/27/2026

投稿先アプリケーション開発

AIモデル（例：Qwen・Stable Diffusionなど）を使っていると、「どこにダウンロードされてるの？」「気づいたら容量がヤバい…」と感じたことはありませんか？この記事では、Hugging Face系モデルの保存場所・容量の仕組み・削除方法・保存先変更まで、まとめて解説します。 ■ モデルはどこにダウンロードされるのか？ from_pretrained() を使うと、モデルは自動的に Hugging Faceのキャッシュ領

safetensorsの「配線」はどこにある？Netronで線が見えない理由をわかりやすく解説

投稿:03/25/2026

投稿先アプリケーション開発

機械学習モデル（特にTransformer系）を触っていると、.safetensors ファイルをNetronで開いたときに、「ノードが並んでいるだけで、配線（接続）が見えない」という疑問にぶつかることがあります。この記事ではこの現象の理由と、実際にブロックの接続（配線）がどこに記録されているのかを整理して解説します。なぜNetronで配線が見えないのか？結論から言うと： safetensorsには「配線情報」が入っていないた

Python（embed版）でCUDA対応PyTorchを使ったGPU推論環境の作り方

投稿:03/23/2026

投稿先アプリケーション開発

はじめに最近のGPU環境では「CUDAは自動で入っているのか？」「PyTorchはどこまで自動でやってくれるのか？」といった疑問を持つ人が多いと思います。この記事では、Pythonのembed版（ポータブル環境）でCUDA対応PyTorchを使ったGPU推論を行う方法を、最小構成でわかりやすく解説します。結論（重要ポイントまとめ） RTX 20xx以降でも CUDAは自動では入らないただし PyTorch（CUDA版）に必要なラ

国会論争から禅問答まで。あらゆる対話をAIとリアルにシュミレーション。(準備中)

DOllsは商用利用可能な人物画像や動画作成をローカルPCで無制限にできるWindowsソフトウェアです。(現在英語バージョンのみ)

その他の当社のサービス

ワードプレスドクターでは、Wordpress カスタマイズや修正、復旧、移行（引っ越し）、エラー修正等のご依頼を承ります。お見積もりは無料です。

＊当サイトへのリンクはご自由にしていただいて構いません。また、引用元をリンクしていただく事、記事のテキストを一部しか使用されない場合は、このブログの情報は自由に転載されても問題ございません。
情報がお役に立ちましたらあなたのメディアから当サイトの記事をご紹介いただけると幸いです。

カテゴリー: アプリケーション開発 ページ 1/2

その他の当社のサービス

AI Dev.

カテゴリー: アプリケーション開発ページ 1/2