Archive
2026
11 posts
DiffusionGemma を M5 Pro で実測:拡散LLMの「4倍速」は Apple Silicon で消える
RAG を作る前に読む地図 — 用語が「どこで牙を剥くか」を先に押さえる
本番運用 — Logging Safety / Drift / Cost / Rollback で RAG を運用する
評価 (クライマックス) — RAGAs 4 指標で Part 1-3 の改善を客観評価する
Generation を引用付きで書く — Anthropic Citations API と cross-encoder reranker
Retrieval を真面目に — chunking と hybrid search で recall を数値改善する
素朴な RAG の限界 — 100 行で動くけど「使える」とは言えない理由
プロンプトは「手順書」から「契約書」へ:GPT-3.5からGPT-5.5までの公式ガイド変遷と移行実践
Qwen3.6-27B がアツい:27B dense でClaude 4.5 Opus に肉薄したオープンウェイトの転換点
gpt-image-2 徹底比較レポート:Nano Banana Pro/2との実運用コスト分析と使い分けガイド
【GLM-4.7】Opus 4.5級の性能で激安?新星LLMの実力を徹底検証【モデル評価テンプレート付き】
2025
2 posts
