タグ:LLM – AIディベロッパーblog

タグ: LLM

Sakana AIの新プロダクト「Fugu（フグ）」とは？マルチエージェントAIの全貌を解説

投稿:06/23/2026

2026年6月22日、東京を拠点とするAIスタートアップ・Sakana AIが新プロダクト「Sakana Fugu（サカナ・フグ）」を正式リリースしました。複数のAIモデルを束ねて「1つのモデル」として動かすという斬新なアーキテクチャで、リリース直後から大きな注目を集めています。 Sakana Fuguとは？概要 Sakana Fuguは、複数のAIエージェントをオーケストレーション（協調制御）しながら、ユーザーには単一のモデルとして振

無制限に無料でAIコーディング　VRAM 8GB のノートPCでQwen3 Coderを動かしてみる

投稿:06/18/2026

投稿先アプリケーション開発

無制限に無料でAIコーディングできるオープンソースのモデルQwen3 Coder　をVRAM 8GB のノートPCで動かしてみてその実力を見てみたいと思います。まずこちらの記事に従いOllamaを入れます。このソフトはローカルでChatGPTのような感じでLLMを動かすためのソフトです。次にモデル選択画面プルダウンで、qwen3-coderと入れて、qwen3-coderを選択状態にし何でもいいのでチャットを行います。するとモデル

エージェント型AIとLLMの違い、そして「できること」の本当の範囲

投稿:06/12/2026

投稿先その他

LLMとエージェントの違い LLM(大規模言語モデル)は、テキストを入力として受け取り、テキストを出力する基盤モデルそのものです。質問応答や文章生成など、単発の対話に強みがあります。エージェント型のAI(例:Claude Code)は、LLMを中核として、ファイル操作・コード実行・テスト・検索などのツールを自律的に組み合わせ、複数ステップのタスクを自分で計画・実行・検証するシステムです。LLMが「頭脳」、エージェントは「頭脳+手足+判

2026年版｜中国系AI APIは本当に危険なのか？DeepSeek・Qwen・GLMを価格・性能・セキュリティで徹底比較

投稿:05/28/2026

投稿先その他

生成AIブームが続く中、2025〜2026年にかけて急速に存在感を高めているのが、中国系LLM（大規模言語モデル）です。特に、 DeepSeek Qwen GLM Kimi Doubao などは、驚異的な低価格で高性能APIを提供し、世界中の開発者に利用され始めています。一方で、「中国製AIは危険なのでは？」「アメリカ製なら安全？」「実際に企業はどれを使っている？」という疑問を持つ人も多いでしょう。この記事では、2026年

Qwenモデルファミリーについてまとめてみました

投稿:05/22/2026

投稿先その他

「Qwenってよく聞くけど、モデルが多すぎて何が何だかわからない」——そんな声をよく耳にします。本記事では、Qwenの概要・ライセンス・モデルファミリーの全体像をわかりやすく整理します。 Qwenとは Qwen（クウェン）は、中国テック大手 Alibaba Cloud（アリババクラウド）が開発・公開する大規模AIモデルのファミリー総称です。正式名称は通義千問（Tōngyì Qiānwèn）。「千（Qian）＝千」と「問（Wen）＝問

LLMはなぜコードが書けるのか？現状・限界・リスク

投稿:05/21/2026

投稿先その他

ChatGPTやClaude、GitHub CopilotなどのLLM（大規模言語モデル）が、プログラムコードをすらすら書く姿を見て「なぜ？」と思ったことはないでしょうか。また、実際に使ってみると「意外と使えない場面もある」と感じた方も多いはず。この記事では、LLMがコードを書ける仕組みから、現在の実用レベル、エラーを防ぐ方法、そして将来の限界までを解説いたします。なぜLLMはプログラムが書けるのかコードも「テキスト」だからです。

ローカルで動かせる画像生成AIモデル6選【技術比較・VRAM目安・互換性まとめ】

投稿:05/19/2026

投稿先画像処理・作成

画像生成AIはクラウドサービスだけでなく、自分のPC上でローカル推論できるモデルも多数存在します。本記事では、ローカルで動作する主要モデルを6つ取り上げ、アーキテクチャの違い・必要なVRAM・各ツールとの互換性を徹底解説します。アーキテクチャ別モデル解説 ① Stable Diffusion 1.5（SD 1.5）アーキテクチャ：UNet + CLIP パラメータ数：約860M ネイティブ解像度：512 × 512 VAE：KL-f

Phi-3 Mini + OnnxRuntimeGenAI で作る C# 翻訳エージェント

投稿:04/14/2026

投稿先アプリケーション開発

1. Phi-3 Mini とは？ — 小型SLMの実力 Phi-3 Mini は Microsoft が 2024 年に公開した Small Language Model (SLM) です。パラメータ数は 3.8 億（3.8B）と GPT-4 系の 1/100 以下でありながら、多くのベンチマークで同規模または大規模モデルに匹敵する精度を達成しています。なぜ翻訳エージェントに向いているのか？日英翻訳の精度が高い — 高品質な英語

WAN 2.1の速度向上Self-Forcing とは何か？

投稿:04/06/2026

投稿先動画

WAN 2.1（Wan-AI製）は、中国アリババグループ傘下の研究チームが開発・公開したオープンソースの動画生成AIモデルです。テキストから動画を生成するT2V（Text-to-Video）、画像から動画を生成するI2V（Image-to-Video）、動画編集など複数のタスクに対応しており、2025年初頭に公開されて以来、ComfyUI ユーザーを中心に急速に普及しました。モデルの規模は 1.3B（13億パラメータ）と 14B（1

GGUFファイルの「Q・K・V」って何？AttentionとQuantizationをわかりやすく解説

投稿:04/01/2026

投稿先アプリケーション開発

GGUFファイルのファイル名に付いている Q・K・V という文字、気になったことはありませんか？これはLLM（大規模言語モデル）の中核技術である Attention（注意機構）と量子化（Quantization）に深く関係しています。この記事ではそれぞれをわかりやすく解説します。 Attention（注意機構）とは？一言で言うと「文章の中でどの単語がどの単語に関係しているか」を計算する仕組みです。具体例次の文を見てみましょ

Hugging Faceモデルの保存場所・容量・削除方法まとめ（QwenやStable Diffusionにも対応）

投稿:03/27/2026

投稿先アプリケーション開発

AIモデル（例：Qwen・Stable Diffusionなど）を使っていると、「どこにダウンロードされてるの？」「気づいたら容量がヤバい…」と感じたことはありませんか？この記事では、Hugging Face系モデルの保存場所・容量の仕組み・削除方法・保存先変更まで、まとめて解説します。 ■ モデルはどこにダウンロードされるのか？ from_pretrained() を使うと、モデルは自動的に Hugging Faceのキャッシュ領

Python（embed版）でCUDA対応PyTorchを使ったGPU推論環境の作り方

投稿:03/23/2026

投稿先アプリケーション開発

はじめに最近のGPU環境では「CUDAは自動で入っているのか？」「PyTorchはどこまで自動でやってくれるのか？」といった疑問を持つ人が多いと思います。この記事では、Pythonのembed版（ポータブル環境）でCUDA対応PyTorchを使ったGPU推論を行う方法を、最小構成でわかりやすく解説します。結論（重要ポイントまとめ） RTX 20xx以降でも CUDAは自動では入らないただし PyTorch（CUDA版）に必要なラ