研究解读 · 小互解读

Anthropic 研究 40 万次 Claude Code 会话：行业专业度决定成败，会不会编程差别不大

半年内调试类会话占比腰斩，任务价值涨约 25%，但代码类任务里各行业成功率与程序员相差不到 7 个百分点。

一分钟速览

Anthropic 分析了 2025 年 10 月至 2026 年 4 月约 40 万次 Claude Code 交互会话，覆盖约 23.5 万名用户。
一次会话里，用户平均做出约 70% 的「做什么」规划决策，Claude 做出约 80% 的「怎么做」执行决策。
在能产出代码的会话里，十大职业的成功率都和软件工程师相差不到 7 个百分点，决定成败的是行业专业度而非编程背景。
七个月间，修 bug 类会话占比从 33% 降到 19%，运维部署、数据分析、写文档类会话占比明显上升。
按自由职业市场报价换算，典型任务的经济价值平均上涨约 25% 到 27%，构建类任务涨幅高达 43%。

⚑立场提示：这是 Anthropic 对自家产品 Claude Code 的官方研究。所有成功率、专业度、职业身份都由 AI 模型阅读会话记录来判断，不是对真实世界结果的核实；任务「价值」是对标自由职业报价的估算分，不是实际收费。下文如实转述其数据与方法。

01研究规模与方法

40 万次对话里，藏着人和 AI 怎么分工的答案

Anthropic 最近放出一份研究报告，用一套保护隐私的分析方法（内部工具 Clio，只看会话的统计特征，不读原始隐私内容），把 2025 年 10 月到 2026 年 4 月之间约 40 万次 Claude Code 的真实使用会话翻了个底朝天，涉及约 23.5 万名用户，覆盖命令行、Claude.ai 和桌面应用三种入口。

它想回答一个很实际的问题：一个没受过编程训练的人，到底能不能指挥 AI 完成复杂的技术活？这份数据给出了早期信号。

◈

为什么值得看：在能产出代码的会话里，最大的十个职业没有一个和软件工程师的成功率差出 7 个百分点；而当会话遇到麻烦之后，专家用户最终拿到实锤成功证据的比例，是新手的近 4 倍。这意味着放大 AI 编程效果的，是你对问题本身的理解，而不是你的编程履历。

约 40 万

分析的 Claude Code 交互会话数

约 23.5 万

覆盖的用户数

7 个月

观察窗口（2025.10 至 2026.4）

9 种

会话按工作模式的分类

02核心分工 · 招牌图

人负责「做什么」，AI 负责「怎么做」

一次 Claude Code 会话，本质是人和 AI 来回交接。研究把会话里所有有意义的决策拆成两类：规划决策做什么、选哪条技术路线、什么算完成，这类拿主意的决策和执行决策改哪些文件、写什么代码、用什么语言、跑什么命令，这类具体动手的决策，再逐一判断每个决策是人拍的板，还是 Claude 拍的板。

左盘：规划决策由用户拿主意（约 70%）。右盘：执行决策交给 Claude（约 80%）。这一对数字是全文的分工范式。

核心结论

用一句话概括这套分工：人决定造什么，AI 决定怎么造。平均下来，用户握着约 70% 的规划决策，Claude 握着约 80% 的执行决策。

再看会话的节奏。一次会话平均约 4 个来回：用户发一条指令，Claude 就连着做一长串动作，然后再交回给用户。在这份历史数据里，用户每发一条指令，平均触发 Claude 约 10 个动作（读文件、改代码、跑命令），一轮写下约 2400 字，多的时候一条指令能触发超过 100 个动作。

登录

Anthropic 研究 40 万次 Claude Code 会话：行业专业度决定成败，会不会编程差别不大

40 万次对话里，藏着人和 AI 怎么分工的答案

人负责「做什么」，AI 负责「怎么做」

后面约 6 分钟，是会员的。

相关解读