研究解读 · 小互解读
Anthropic 研究 40 万次 Claude Code 会话:行业专业度决定成败,会不会编程差别不大
半年内调试类会话占比腰斩,任务价值涨约 25%,但代码类任务里各行业成功率与程序员相差不到 7 个百分点。
一分钟速览
- Anthropic 分析了 2025 年 10 月至 2026 年 4 月约 40 万次 Claude Code 交互会话,覆盖约 23.5 万名用户。
- 一次会话里,用户平均做出约 70% 的「做什么」规划决策,Claude 做出约 80% 的「怎么做」执行决策。
- 在能产出代码的会话里,十大职业的成功率都和软件工程师相差不到 7 个百分点,决定成败的是行业专业度而非编程背景。
- 七个月间,修 bug 类会话占比从 33% 降到 19%,运维部署、数据分析、写文档类会话占比明显上升。
- 按自由职业市场报价换算,典型任务的经济价值平均上涨约 25% 到 27%,构建类任务涨幅高达 43%。
⚑立场提示:这是 Anthropic 对自家产品 Claude Code 的官方研究。所有成功率、专业度、职业身份都由 AI 模型阅读会话记录来判断,不是对真实世界结果的核实;任务「价值」是对标自由职业报价的估算分,不是实际收费。下文如实转述其数据与方法。
01研究规模与方法
40 万次对话里,藏着人和 AI 怎么分工的答案
Anthropic 最近放出一份研究报告,用一套保护隐私的分析方法(内部工具 Clio,只看会话的统计特征,不读原始隐私内容),把 2025 年 10 月到 2026 年 4 月之间约 40 万次 Claude Code 的真实使用会话翻了个底朝天,涉及约 23.5 万名用户,覆盖命令行、Claude.ai 和桌面应用三种入口。
它想回答一个很实际的问题:一个没受过编程训练的人,到底能不能指挥 AI 完成复杂的技术活?这份数据给出了早期信号。
◈
为什么值得看:在能产出代码的会话里,最大的十个职业没有一个和软件工程师的成功率差出 7 个百分点;而当会话遇到麻烦之后,专家用户最终拿到实锤成功证据的比例,是新手的近 4 倍。这意味着放大 AI 编程效果的,是你对问题本身的理解,而不是你的编程履历。
约 40 万
分析的 Claude Code 交互会话数
约 23.5 万
覆盖的用户数
7 个月
观察窗口(2025.10 至 2026.4)
9 种
会话按工作模式的分类
02核心分工 · 招牌图
人负责「做什么」,AI 负责「怎么做」
一次 Claude Code 会话,本质是人和 AI 来回交接。研究把会话里所有有意义的决策拆成两类:规划决策做什么、选哪条技术路线、什么算完成,这类拿主意的决策和执行决策改哪些文件、写什么代码、用什么语言、跑什么命令,这类具体动手的决策,再逐一判断每个决策是人拍的板,还是 Claude 拍的板。
左盘:规划决策由用户拿主意(约 70%)。右盘:执行决策交给 Claude(约 80%)。这一对数字是全文的分工范式。
核心结论
用一句话概括这套分工:人决定造什么,AI 决定怎么造。平均下来,用户握着约 70% 的规划决策,Claude 握着约 80% 的执行决策。
再看会话的节奏。一次会话平均约 4 个来回:用户发一条指令,Claude 就连着做一长串动作,然后再交回给用户。在这份历史数据里,用户每发一条指令,平均触发 Claude 约 10 个动作(读文件、改代码、跑命令),一轮写下约 2400 字,多的时候一条指令能触发超过 100 个动作。