ZeroZawa

Retrieval を真面目に — chunking と hybrid search で recall を数値改善する
2026-05-21
素朴な RAG の retrieval を、metadata 保持型 chunking と BM25+dense hybrid search で立て直す。版違い文書と同義語 miss を観察し、status filter で旧版 (archived) を top-5 から追い出す効果を実測で確認する。シリーズ「使える RAG の作り方 — 測って・直して・運用する」第 2 回
1,945 文字
|
10 分
Cover Image of the Post
素朴な RAG の限界 — 100 行で動くけど「使える」とは言えない理由
2026-05-20
LLM + ベクトル検索で「動く RAG」を 100 行で組んでみる。実装は驚くほど短い。けれど「動く」と「使える」の間には大きな谷がある。シリーズ「使える RAG の作り方 — 測って・直して・運用する」第 1 回。
2,203 文字
|
12 分
Cover Image of the Post
プロンプトは「手順書」から「契約書」へ:GPT-3.5からGPT-5.5までの公式ガイド変遷と移行実践
OpenAIの公式プロンプトガイドをGPT-3.5から最新のGPT-5.5まで通読すると、最適化の重心は「手順を並べる」から「成果物の契約を書く」へ移っている。Anthropic Opus 4.7とGemini 3 Proの推奨も同じ方向に揃った。思想変遷の整理と、旧プロンプトを書き直しで移行するためのテンプレート・チェックリストをまとめた。
1,880 文字
|
10 分
Cover Image of the Post
Qwen3.6-27B がアツい:27B dense でClaude 4.5 Opus に肉薄したオープンウェイトの転換点
2026-04-25
2026年4月22日リリースのQwen3.6-27Bを徹底解説。27B denseでClaude 4.5 Opusに肉薄したコーディング性能、14.8倍コンパクトのアーキ転換、量子化16.8GBでのローカル実行まで整理。M5 Pro 48GBでの実測(約15 tok/s・品質テスト一発合格)も追記しました。
898 文字
|
5 分
Cover Image of the Post
gpt-image-2 徹底比較レポート:Nano Banana Pro/2との実運用コスト分析と使い分けガイド
OpenAIが2026年4月21日にリリースしたgpt-image-2を一次情報ベースで整理。Nano Banana Pro・Nano Banana 2との三つ巴スペック比較、5つの実運用ユースケース別コスト試算、そして「どのモデルをいつ使うか」の決定フレームを提示します。
1,438 文字
|
8 分
Cover Image of the Post