ZeroZawa

Retrieval を真面目に — chunking と hybrid search で recall を数値改善する

2026-05-21

素朴な RAG の retrieval を、metadata 保持型 chunking と BM25+dense hybrid search で立て直す。版違い文書と同義語 miss を観察し、status filter で旧版 (archived) を top-5 から追い出す効果を実測で確認する。シリーズ「使える RAG の作り方 — 測って・直して・運用する」第 2 回

1,945 文字

10 分

素朴な RAG の限界 — 100 行で動くけど「使える」とは言えない理由

2026-05-20

rag

llm

ollama

LLM + ベクトル検索で「動く RAG」を 100 行で組んでみる。実装は驚くほど短い。けれど「動く」と「使える」の間には大きな谷がある。シリーズ「使える RAG の作り方 — 測って・直して・運用する」第 1 回。

2,203 文字

12 分

プロンプトは「手順書」から「契約書」へ：GPT-3.5からGPT-5.5までの公式ガイド変遷と移行実践

2026-05-16

llm

prompt-engineering

OpenAIの公式プロンプトガイドをGPT-3.5から最新のGPT-5.5まで通読すると、最適化の重心は「手順を並べる」から「成果物の契約を書く」へ移っている。Anthropic Opus 4.7とGemini 3 Proの推奨も同じ方向に揃った。思想変遷の整理と、旧プロンプトを書き直しで移行するためのテンプレート・チェックリストをまとめた。

1,880 文字

10 分

Qwen3.6-27B がアツい：27B dense でClaude 4.5 Opus に肉薄したオープンウェイトの転換点

2026-04-25

Tech

llm

qwen

2026年4月22日リリースのQwen3.6-27Bを徹底解説。27B denseでClaude 4.5 Opusに肉薄したコーディング性能、14.8倍コンパクトのアーキ転換、量子化16.8GBでのローカル実行まで整理。M5 Pro 48GBでの実測（約15 tok/s・品質テスト一発合格）も追記しました。

898 文字

5 分

gpt-image-2 徹底比較レポート：Nano Banana Pro／2との実運用コスト分析と使い分けガイド

2026-04-22

OpenAIが2026年4月21日にリリースしたgpt-image-2を一次情報ベースで整理。Nano Banana Pro・Nano Banana 2との三つ巴スペック比較、5つの実運用ユースケース別コスト試算、そして「どのモデルをいつ使うか」の決定フレームを提示します。

1,438 文字

8 分