研究解读 · 小互解读
让模型「自己改作业」的论文,到底神在哪
一句话:它学会了给自己挑错。我用一个做菜的类比,把核心机制讲给你听。
过去我们让模型把答案一次写完就交,对错全凭它第一遍的发挥。这篇论文做的事很朴素:让它写完先别交,自己当一回审稿人,把刚写的东西挑一遍毛病,再改。听着简单,难的是怎么让它挑得准、改得动。
🍳 一句话类比
就像一个厨师出菜前先自己尝一口。不是换了灶台换了锅,而是多了「尝一口再端出去」这一下,废品率就掉下来了。
它的流程拆开看就是三步,关键全在中间那一步:模型要切换成「批评者」的视角看自己。
01
写初稿
照常先答一版
02
自我批改
扮成审稿人逐条挑错
03
改终稿
按自己挑的错重写
论文里真正的贡献,不是「让模型反思」这个想法(这个早有人提),而是给了一套办法,让这个「自己挑错」的过程稳定有效,而不是越改越乱。这才是它能发出来的原因。
「会自己回头看一眼,比第一遍就写对,更接近聪明的样子。」
⚐ 示例正文(石墨 + 余烬橙套餐)。这一篇用的是和上一篇完全不同的配色字体,但你往上往下看,外壳那层导航、来源条、相关解读,一点没变。这就是「五种配色的正文,一个稳定的画框」。