主题
适用读者:已经会用 OpenAI / Anthropic / 开源 LLM API 写过 Demo,正在或即将把它推进生产环境的工程师。
RAG、Tool、Schema、解码控制能把错误率压到 < 1%
多采样、跨家族裁判、Spotlighting 等把概率事件摊薄到 1%-10%
反转诅咒、组合墙、否定盲、CoT 不忠实,业务上必须绕开