近年は画像や文章から3Dモデルを生成するAIが急速に進化しています。以前は専門的な3Dソフトの知識が必要だった作業も、現在は数分でベースモデルを作れるようになりました。 ただし、実際に使ってみると「思ったより綺麗に作れない部分」もあります。AIは万能ではなく、得意なものと苦手なものがかなりはっきりしています。 この記事では、AIで実用的な3Dモデルを作る方法と、効率のよい制作手順を紹介します。 Tripo AIとは? 3D生成AIの中で
タグ: 最適化
DeepSeek V3では問題なく動作していたJSON出力が、V4 Flashに移行した途端に壊れる・空になるというケースが多数報告されています。この記事では原因の調査過程と、現時点で取れる対策をまとめます。 症状:content が空白トークンで埋まって返ってくる 典型的な症状は以下のようなレスポンスです。completion_tokens が 150〜220 あるにもかかわらず、content がスペースだらけで実質空になっています
「ChatGPTみたいなAIを、自分のPCだけで無料&無制限に使いたい」 そんな人におすすめなのが、ローカルAI実行ツール Ollama と、高性能モデル DeepSeek-R1 の組み合わせです。 この方法なら、 月額料金なし API料金なし 回数制限なし 入力データが外部送信されない オフラインでも使える PHPなどのプログラミングも可能 という、かなり強力な環境を作れます。 しかも、VRAM 8GBクラスのGPUでも動作可能です。
VAE(Variational Autoencoder)とは VAE(Variational Autoencoder)は、画像を「圧縮」と「復元」するためのニューラルネットワークです。 Stable Diffusion では、画像生成の効率を高めるために重要な役割を担っています。 VAEは主に次の2つの構成要素から成り立っています: Encoder(エンコーダー) 画像(RGB)を潜在表現(latent)に圧縮する Decoder(デコ
Stable Diffusionなどの画像生成モデルを動かすとき、特に問題になるのが「VRAM不足」です。この記事では、Diffusersでよく使われるメモリ最適化機能と、その仕組み・注意点をまとめます。 メモリ最適化機能の概要 enable_model_cpu_offload() モデル全体をGPUに常駐させず、必要なときだけCPUからGPUへ転送する仕組みです。 使う直前にGPUへロード 使い終わったらCPUへ戻す 特徴 VRAM使
Python製のAIアプリ(Stable Diffusion、Qwen、Wanなど)を「Python未導入のPCでもそのまま動くスタンドアロン実行ファイル」にしたい場合、よく使われるのが PyInstaller です。 pip install pyinstaller pyinstaller –onefile main.py しかし、AI系ライブラリを含むアプリでは単純にビルドしただけでは失敗することが多く、以下のような追加オ
GGUFファイルのファイル名に付いている Q・K・V という文字、気になったことはありませんか?これはLLM(大規模言語モデル)の中核技術である Attention(注意機構) と 量子化(Quantization) に深く関係しています。この記事ではそれぞれをわかりやすく解説します。 Attention(注意機構)とは? 一言で言うと 「文章の中でどの単語がどの単語に関係しているか」を計算する仕組みです。 具体例 次の文を見てみましょ
WindowsでTritonをインストールしたにもかかわらず、torch_has_triton()がFalseを返してしまう問題に遭遇することがあります。この記事では、その原因と解決方法を解説します。 Tritonとは? GPUカーネルをPythonで書けるようにするコンパイラ/言語です。 通常、GPUで高速な処理をするにはCUDA(C++)でカーネルを書く必要がありますが、TritonはそれをPythonに近い書き方で実現

