产品发布 · 小互解读

Anthropic 发布 Claude Science：面向科学家的 AI 工作台，内置 60 多个科研技能

现已开放测试。一个协调 agent 拉起专家团队干活，末端还有个审稿 agent 专挑引用和数字的错；算力外包给 AI，原始数据不出本地。

一分钟速览

Anthropic 发布 Claude Science，一款面向科学家的 AI 工作台应用，现已向 Pro、Max、Team、Enterprise 用户开放测试版，支持在 macOS／Linux 本地，或通过 SSH／HPC 登录节点远程使用。
应用内置 60 多个预配置技能和连接器，覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学，背后接进成百上千个专业数据源（UniProt、PDB、Ensembl 等）以及期刊、预印本资源。
它能自主起草计算任务，征得用户同意后提交到用户自己的 HPC 集群或 Modal 云端 GPU，把分析从单块 GPU 扩展到数百块，而原始数据始终留在用户自己的系统里。
内置一个审稿 agent，全程检查生成内容里的引用是否真实、数字能否对上计算过程、图表是否和产出它的代码一致，发现问题会自动修正。
已有真实案例：Allen Institute 研究员把过去要写两年的综述产出了约十篇（多篇超百页）；UCSF 团队的种系变异全流程分析耗时缩短到原来的十分之一，且经实验室独立验证。

⚑立场提示：本文基于 Anthropic 官方发布公告整理，属厂商自述口径。文中性能数据（十分之一耗时、约十篇综述等）由合作实验室与厂商提供，其中 UCSF 案例称经实验室独立验证，其余数字未经第三方复核。

1科学家也有了自己的工作台

科学家也有了自己的 AI 工作台

Anthropic 近日发布 Claude Science，一款把科学家常用的工具、数据库和计算资源整合进单一环境的 AI 工作台应用，面向 Pro、Max、Team 和 Enterprise 用户开放测试版。

它是一个装在你自己电脑或服务器上的应用：你用大白话向一个 AI 提出科学问题，它调动数十个专业工具去查数据、跑分析、画图表、写手稿，而每一步产物都能倒查回它是怎么来的。你可以像用 Jupyter Notebook 那样，在本地（macOS／Linux）用它，也可以在远程机器上通过 SSH 或 HPC 登录节点用它。

⚡为什么值得看：UCSF 脑瘤中心团队实测，用它做胶质瘤种系变异的全流程分析，耗时缩短到过去的十分之一，而且实验室独立复核过，确认结果既快又靠得住。

招牌图：一个中心协调 agent 把过去散落各处的技能、数据库、期刊、专业模型和三种算力（笔记本／HPC／GPU 云）收进同一个对话里。

2旧办法有多碎

科学家平时到底有多头疼

科研的日常里有大量琐碎活。研究者要在几十个数据库之间来回切，每个库有自己的一套数据结构（schema）；碰到的文件格式还常常得配专门的处理流水线和查看器；工具则是一长串：PubMed、Jupyter、R、集群终端，一个接一个地换。

PubMedJupyterR集群终端各库各自的 schema专用文件查看器自建数据流水线

光是把这些工具凑到一起、让数据在它们之间流转，就要耗掉研究者大量精力。Claude Science 想做的，就是把这些散件收进一个环境，让人在其中走完从查文献到出手稿的全部环节。

3一个协调，一群专家

一个总协调 agent，背后一群专家在干活

你对话的对象是一个通用的协调 agent。它手里握着那 60 多个预配置技能和连接器，能拉起专门领域的专家子 agent，也能调用你自己创建的专属 agent。它们分头去查数据、跑分析、出结果。

什么是技能和连接器

可以把它想成手机的应用商店加快捷指令：需要操作哪个数据库或软件，就给协调 agent 装上对应的「技能包」，它就知道怎么调用那个工具。连接器则负责把你实验室现用的工具接进来。

关键的一环，是链条末端还站着一个专门挑错的角色，审稿 agent（reviewer agent）。它盯着其他 agent 的产出，逐项核查，发现问题就自己动手改。

你
用大白话提问

→

协调 agent

→

专家子 agent

你自建的 agent

→

审稿 agent 核查检查引用是否真实、数字能否对上计算过程、图表是否和产出它的代码一致

→

发现问题
自动修正

核心创新 · 一

这个审稿 agent 相当于一个全程在线的同行评审员：它专盯引用是不是真有出处、给出的数字能不能追回到原始计算、图表和生成它的代码对不对得上。查出错，它会自己改，而不是把问题留给你。这直接对着「AI 生成内容爱一本正经地编」这个老毛病。

这套配对叫 actor-critic（演员，评论家）

一个 agent 负责生成内容，是「演员」；另一个专职核对准确性和引用可信度，是「评论家」，两者分工制衡。就像一个记者写稿，另一个专职事实核查编辑逐句核对，谁也不替谁背书。

4每张图都能倒查

生成的每张图，都能倒查回它的代码

科研本身就很依赖看图，所以 Claude Science 出图和出手稿时，会把生成它们的代码一并给出。它还能原生渲染科研专用的可视化格式：3D 蛋白质结构、基因组浏览器轨道、化学结构等，不用另开专门的查看器。

Claude Science 原生渲染蛋白质、分子和结构，每个结果都可复现、可追溯到生成它的代码。图源：Anthropic

它生成一张图时，会一并附上：产出这张图的确切代码和运行环境、一句话说明它是怎么来的，以及完整的对话记录。这意味着几个月后你回头看，还能弄清当时喂进去的是什么、结果怎么验证、怎么复现。

一张图，随图带着

产出它的代码
运行环境
一句话由来说明
完整对话记录

于是你能

看清全部输入
随时验证
几个月后仍可复现

改图也不用自己动代码。你用大白话对它说「去掉网格线」或「把纵轴改成对数刻度」，它会去改自己写的那段代码，重出一张。

原图对它说：去掉网格线

带网格线的柱状图

网格线已去掉，agent 直接改了自己那段绘图代码

5AI 去调超算

AI 亲自去调你的超算，数据却不挪窝

大分析很折腾人：折叠一个蛋白质、在海量数据集上跑一条基因组流水线，研究者往往得停下手头的科学问题，去配置计算任务、等它排队上集群、盯着看成没成、再把结果拉回来。Claude Science 把这一整套接了过去。

Claude Science 在笔记本、集群或按需 GPU 上搭建环境并调度算力

Claude Science 在你的笔记本、集群或按需 GPU 上自动搭建运行环境、调度算力。图源：Anthropic

它先起草一个计划，在动用新资源前先问你，你可以审阅甚至撤回任何一个决定。得到同意后，它才把任务写好、提交到你实验室现用的算力上：走 SSH 的自有 HPC 集群，或你的 Modal 账户按需取用云 GPU。规模能从单块 GPU 弹到数百块。

起草计划

→

征求同意
可审阅／撤回

→

写并提交任务

→

你的 HPC（SSH）
／ Modal GPU

→

只回传
必要上下文

核心创新 · 二

整个过程跑在你实验室自己的基础设施上，你的笔记本、Linux 机器或 HPC 登录节点。所以又大又敏感的数据集根本不用离开它们本来所在的系统，每一步只把当步分析必需的那点上下文传给 Claude。算力可以外包给 AI 调度，原始数据不挪窝。

因为这些 agent 是在一个把上下文存在内存里的会话中干活，即便是海量数据集也只需加载一次。任务跑起来时，那个审稿 agent 也在同步检查产出，揪出错误引用、追不回来的数字、和代码对不上的图表，边跑边自我修正。

什么是 fork 会话

任务进行到一半，你可以复制出一个平行分支，用另一种方法各跑一遍，两边互不影响，原来的对话线程也不丢。就像把同一份文档另存成两个版本分别改，改坏了也不动原稿。

6预置的专业家底

开箱就懂行：各路数据库和专业模型都接好了

科学知识散落在成百上千个专门来源里。光是生物学，相关数据就可能分布在 UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO 这些资源里，每个都有自己的结构和查询语言，还有期刊、预印本服务器和领域专用的开源模型。你用大白话提一个问题，专家 agent 会跨这些来源去查、去综合，省得你一个个去摸。

内置对基因组学、单细胞、蛋白质组学、化学信息学的预配置，60 多个技能替你接进各路科学数据源。图源：Anthropic

60+

预置科研技能和连接器，覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学

成百上千

科学知识散落的专业数据源（UniProt、PDB、Ensembl 等）与期刊、预印本

1 → 数百块

计算任务可弹性扩展的 GPU 数量

UniProtPDBEnsemblReactomeClinVarChEMBLGEO

它还接入了 NVIDIA 的 BioNeMo Agent Toolkit，原生连上 BioNeMo 里的生命科学模型和库，包括 Evo 2、Boltz-2 和 OpenFold3。而科学家手里已经信得过的模型、数据集和流水线也能一并接进来：任何一条流水线可以存成可复用的技能，任何常用工具可以用连接器接上，后续会话会自动继承它们。你不必为了用 AI 就丢掉已经信任的工具链。

7三个实验室的实测

三个实验室已经用出了什么

过去几个月，研究者已在测试版里用它做单细胞 RNA 测序分析、CRISPR 筛选设计、蛋白质结构预测、化学信息学等工作。三个案例最能看出落地效果。

实验室	用它做了什么	量化结果
Manifold Bio	端到端筛选组织靶向药的靶点，逐个评估表面表达、体内转运和安全性，按自家专有数据学到的标准排序	一次跑通全流程；与通用编程助手的关键差别，是它能自己找对数据、带着过往项目经验下判断
Allen Institute 神经科学家 Jérôme Lecoq	搭了一套约 20 个自定义技能的多 agent「计算综述模板」，子 agent 读数千篇论文，抽出核心论点和关键定量结论存进证据库，再分节写综述，每节交给专属子 agent，用 actor-critic 配对边写边核	此前写一篇综述最多要两年，现已产出约 10 篇，多篇超 100 页，引用都经审稿 agent 核查
UCSF 脑瘤中心流行病学副教授 Stephen Francis	研究胶质瘤分子流行病学：数千个小效应种系变异如何叠加，塑造个体易感性，做跨多种方法的全面种系分析	耗时缩到约十分之一，其团队独立复核过结果，确认既快又稳

UCSF 分析耗时
此前

10×

UCSF 分析耗时
用后

1× · 十分之一

Allen 综述产出
此前 / 两年

1 篇

Allen 综述产出
现在

约 10 篇

8现在怎么用上

现在谁能用、怎么用

Claude Science 应用现以测试版形式，在 macOS 和 Linux 上向 Pro、Max、Team、Enterprise 用户开放。Team 和 Enterprise 用户需要由管理员开启。Anthropic 表示提早放出，是想让科学家先拿真问题上手，再反馈怎么打磨。

面向学术机构和非营利科研机构的活跃实验室，还有一档折扣席位的 Team 方案。

还有一笔面向科学项目的资助（点开看细节）

Anthropic 将支持最多 50 个 Claude Science「AI for Science」项目，每个提供最高 3 万美元额度；Modal 另为入选项目提供最高 2 千美元算力。方向优先落在生物和生物医学研究。申请开放到 2026 年 7 月 15 日，7 月 31 日前发通知，项目周期为 2026 年 9 月 1 日至 12 月 1 日。

每一个产出都带着它如何生成的可审计记录，你因此能验证并复现结果。 Anthropic，《Claude Science, an AI workbench for scientists》

本文基于 Anthropic 官方发布公告《Claude Science, an AI workbench for scientists》（claude.com/science）整理解读。文中数据、案例与产品能力均来自该公告，为厂商自述口径，其中 UCSF 案例称经实验室独立验证。图片来自 Anthropic 官方发布页。