温嘉琪的博客 / BUILDING SOMETHING FUN

Agent-Native Research Artifact: 当研究产出从"论文"变成"可执行知识包"

Agent-Native Research Artifact: 当研究产出从"论文"变成"可执行知识包"

传统学术论文是一种 线性叙事。你把 3-6 个月的探索(试错的假设、废弃的路径、深夜发现的 trick)压缩成一条干净的故事线。所有没走到终点的分支都被剪掉了。

这在人类读者时代勉强可行。但在 AI agent 时代,这成了根本性障碍。

问题有多严重?

两个数据点:

  1. PaperBench 测试发现,23 篇 ICML 2024 论文中,只有 45.4% 的复现所需信息在 PDF 中有完整说明。一半以上的关键细节不在论文里——在代码里、在 README 里、在作者的脑子里。
  2. RE-Bench 的 24,008 次 agent 运行中,90.2% 的总成本花在了失败的运行上。原因很直接:每个 agent 都在独立重新发现所有死路——因为没有人把"这条路走不通"写进论文。

这就是 ARA(Agent-Native Research Artifact)要解决的问题。

ARA 的核心洞察

研究产出本质上是一个 分支知识对象(branching knowledge object)。你做了 10 件事,9 件失败了,1 件成功了。传统论文只讲那 1 件。但 agent 如果不知道那 9 件失败,它就会再去试一遍——然后失败,然后花时间去验证这确实行不通。

ARA 的解决方案是:把研究产出从一个叙事文档,重构成一个机器可执行的知识包。

四层结构

ARA 将单个研究项目组织为四层,放在一个目录里:

project/
├── PAPER.md          # 根清单(~200 tokens)
├── logic/            # 认知层:What & Why
├── src/              # 物理层:How