研究解读 · 小互解读

让模型「自己改作业」的论文，到底神在哪

一句话：它学会了给自己挑错。我用一个做菜的类比，把核心机制讲给你听。

过去我们让模型把答案一次写完就交，对错全凭它第一遍的发挥。这篇论文做的事很朴素：让它写完先别交，自己当一回审稿人，把刚写的东西挑一遍毛病，再改。听着简单，难的是怎么让它挑得准、改得动。

🍳 一句话类比

就像一个厨师出菜前先自己尝一口。不是换了灶台换了锅，而是多了「尝一口再端出去」这一下，废品率就掉下来了。

它的流程拆开看就是三步，关键全在中间那一步：模型要切换成「批评者」的视角看自己。

写初稿

照常先答一版

自我批改

扮成审稿人逐条挑错

改终稿

按自己挑的错重写

论文里真正的贡献，不是「让模型反思」这个想法（这个早有人提），而是给了一套办法，让这个「自己挑错」的过程稳定有效，而不是越改越乱。这才是它能发出来的原因。

「会自己回头看一眼，比第一遍就写对，更接近聪明的样子。」

⚐ 示例正文（石墨 + 余烬橙套餐）。这一篇用的是和上一篇完全不同的配色字体，但你往上往下看，外壳那层导航、来源条、相关解读，一点没变。这就是「五种配色的正文，一个稳定的画框」。