arXiv 2605.03505 — LATS-RCA: Language Agent Tree Search

TL;DR

把 RCA 从线性推理重构为 reflection-guided 树搜索(类似 MCTS)。

数据

  • LO2 基准 91.3% —— 三大前沿模型差异仅 1.6pp(model-agnostic
  • 真实生产 MSS(Zoner Oy,30 万站点)只剩 65.1% ⚠️

关键反共识

学术 benchmark ≠ 真实生产:揭示真实世界的三大挑战:

  1. 多因素根因
  2. 规模复杂度
  3. 不完整可观测性

→ 这验证了 80-Why-AI-Agents-Fail-at-Cloud-RCA-arXiv 的”架构是杠杆”结论。

涉及的实体 / 概念

原文链接