产品发布 · 小互解读

Anthropic 发布 Claude Science:面向科学家的 AI 工作台,内置 60 多个科研技能

现已开放测试。一个协调 agent 拉起专家团队干活,末端还有个审稿 agent 专挑引用和数字的错;算力外包给 AI,原始数据不出本地。
一分钟速览
  • Anthropic 发布 Claude Science,一款面向科学家的 AI 工作台应用,现已向 Pro、Max、Team、Enterprise 用户开放测试版,支持在 macOS/Linux 本地,或通过 SSH/HPC 登录节点远程使用。
  • 应用内置 60 多个预配置技能和连接器,覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学,背后接进成百上千个专业数据源(UniProt、PDB、Ensembl 等)以及期刊、预印本资源。
  • 它能自主起草计算任务,征得用户同意后提交到用户自己的 HPC 集群或 Modal 云端 GPU,把分析从单块 GPU 扩展到数百块,而原始数据始终留在用户自己的系统里。
  • 内置一个审稿 agent,全程检查生成内容里的引用是否真实、数字能否对上计算过程、图表是否和产出它的代码一致,发现问题会自动修正。
  • 已有真实案例:Allen Institute 研究员把过去要写两年的综述产出了约十篇(多篇超百页);UCSF 团队的种系变异全流程分析耗时缩短到原来的十分之一,且经实验室独立验证。
立场提示:本文基于 Anthropic 官方发布公告整理,属厂商自述口径。文中性能数据(十分之一耗时、约十篇综述等)由合作实验室与厂商提供,其中 UCSF 案例称经实验室独立验证,其余数字未经第三方复核。
1科学家也有了自己的工作台

科学家也有了自己的 AI 工作台

Anthropic 近日发布 Claude Science,一款把科学家常用的工具、数据库和计算资源整合进单一环境的 AI 工作台应用,面向 Pro、Max、Team 和 Enterprise 用户开放测试版。

它是一个装在你自己电脑或服务器上的应用:你用大白话向一个 AI 提出科学问题,它调动数十个专业工具去查数据、跑分析、画图表、写手稿,而每一步产物都能倒查回它是怎么来的。你可以像用 Jupyter Notebook 那样,在本地(macOS/Linux)用它,也可以在远程机器上通过 SSH 或 HPC 登录节点用它。

为什么值得看:UCSF 脑瘤中心团队实测,用它做胶质瘤种系变异的全流程分析,耗时缩短到过去的十分之一,而且实验室独立复核过,确认结果既快又靠得住。
技能 · 连接器 科学数据库 期刊 · 预印本 Modal GPU 云 HPC 集群 你的笔记本 专业模型 协调 agent
招牌图:一个中心协调 agent 把过去散落各处的技能、数据库、期刊、专业模型和三种算力(笔记本/HPC/GPU 云)收进同一个对话里。
2旧办法有多碎

科学家平时到底有多头疼

科研的日常里有大量琐碎活。研究者要在几十个数据库之间来回切,每个库有自己的一套数据结构(schema);碰到的文件格式还常常得配专门的处理流水线和查看器;工具则是一长串:PubMed、Jupyter、R、集群终端,一个接一个地换。

PubMedJupyterR集群终端各库各自的 schema专用文件查看器自建数据流水线

光是把这些工具凑到一起、让数据在它们之间流转,就要耗掉研究者大量精力。Claude Science 想做的,就是把这些散件收进一个环境,让人在其中走完从查文献到出手稿的全部环节。

3一个协调,一群专家

一个总协调 agent,背后一群专家在干活

你对话的对象是一个通用的协调 agent。它手里握着那 60 多个预配置技能和连接器,能拉起专门领域的专家子 agent,也能调用你自己创建的专属 agent。它们分头去查数据、跑分析、出结果。

什么是技能和连接器

可以把它想成手机的应用商店加快捷指令:需要操作哪个数据库或软件,就给协调 agent 装上对应的「技能包」,它就知道怎么调用那个工具。连接器则负责把你实验室现用的工具接进来。

关键的一环,是链条末端还站着一个专门挑错的角色,审稿 agent(reviewer agent)。它盯着其他 agent 的产出,逐项核查,发现问题就自己动手改。


用大白话提问
协调 agent
专家子 agent
你自建的 agent
审稿 agent 核查检查引用是否真实、数字能否对上计算过程、图表是否和产出它的代码一致
发现问题
自动修正
核心创新 · 一

这个审稿 agent 相当于一个全程在线的同行评审员:它专盯引用是不是真有出处、给出的数字能不能追回到原始计算、图表和生成它的代码对不对得上。查出错,它会自己改,而不是把问题留给你。这直接对着「AI 生成内容爱一本正经地编」这个老毛病。

这套配对叫 actor-critic(演员,评论家)

一个 agent 负责生成内容,是「演员」;另一个专职核对准确性和引用可信度,是「评论家」,两者分工制衡。就像一个记者写稿,另一个专职事实核查编辑逐句核对,谁也不替谁背书。

4每张图都能倒查

生成的每张图,都能倒查回它的代码

科研本身就很依赖看图,所以 Claude Science 出图和出手稿时,会把生成它们的代码一并给出。它还能原生渲染科研专用的可视化格式:3D 蛋白质结构、基因组浏览器轨道、化学结构等,不用另开专门的查看器。

Claude Science 原生渲染蛋白质、结构和分子
Claude Science 原生渲染蛋白质、分子和结构,每个结果都可复现、可追溯到生成它的代码。图源:Anthropic

它生成一张图时,会一并附上:产出这张图的确切代码和运行环境、一句话说明它是怎么来的,以及完整的对话记录。这意味着几个月后你回头看,还能弄清当时喂进去的是什么、结果怎么验证、怎么复现。

一张图,随图带着
  • 产出它的代码
  • 运行环境
  • 一句话由来说明
  • 完整对话记录
于是你能
  • 看清全部输入
  • 随时验证
  • 几个月后仍可复现

改图也不用自己动代码。你用大白话对它说「去掉网格线」或「把纵轴改成对数刻度」,它会去改自己写的那段代码,重出一张。

带网格线的柱状图
网格线已去掉,agent 直接改了自己那段绘图代码
5AI 去调超算

AI 亲自去调你的超算,数据却不挪窝

大分析很折腾人:折叠一个蛋白质、在海量数据集上跑一条基因组流水线,研究者往往得停下手头的科学问题,去配置计算任务、等它排队上集群、盯着看成没成、再把结果拉回来。Claude Science 把这一整套接了过去。

Claude Science 在笔记本、集群或按需 GPU 上搭建环境并调度算力
Claude Science 在你的笔记本、集群或按需 GPU 上自动搭建运行环境、调度算力。图源:Anthropic

它先起草一个计划,在动用新资源前先问你,你可以审阅甚至撤回任何一个决定。得到同意后,它才把任务写好、提交到你实验室现用的算力上:走 SSH 的自有 HPC 集群,或你的 Modal 账户按需取用云 GPU。规模能从单块 GPU 弹到数百块

起草计划
征求同意
可审阅/撤回
写并提交任务
你的 HPC(SSH)
/ Modal GPU
只回传
必要上下文
核心创新 · 二

整个过程跑在你实验室自己的基础设施上,你的笔记本、Linux 机器或 HPC 登录节点。所以又大又敏感的数据集根本不用离开它们本来所在的系统,每一步只把当步分析必需的那点上下文传给 Claude。算力可以外包给 AI 调度,原始数据不挪窝。

因为这些 agent 是在一个把上下文存在内存里的会话中干活,即便是海量数据集也只需加载一次。任务跑起来时,那个审稿 agent 也在同步检查产出,揪出错误引用、追不回来的数字、和代码对不上的图表,边跑边自我修正。

什么是 fork 会话

任务进行到一半,你可以复制出一个平行分支,用另一种方法各跑一遍,两边互不影响,原来的对话线程也不丢。就像把同一份文档另存成两个版本分别改,改坏了也不动原稿。

6预置的专业家底

开箱就懂行:各路数据库和专业模型都接好了

科学知识散落在成百上千个专门来源里。光是生物学,相关数据就可能分布在 UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO 这些资源里,每个都有自己的结构和查询语言,还有期刊、预印本服务器和领域专用的开源模型。你用大白话提一个问题,专家 agent 会跨这些来源去查、去综合,省得你一个个去摸。

Claude Science 为科研预配置,60 多个技能替你接进各路数据源
内置对基因组学、单细胞、蛋白质组学、化学信息学的预配置,60 多个技能替你接进各路科学数据源。图源:Anthropic
60+
预置科研技能和连接器,覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学
成百上千
科学知识散落的专业数据源(UniProt、PDB、Ensembl 等)与期刊、预印本
1 → 数百块
计算任务可弹性扩展的 GPU 数量
UniProtPDBEnsemblReactomeClinVarChEMBLGEO

它还接入了 NVIDIA 的 BioNeMo Agent Toolkit,原生连上 BioNeMo 里的生命科学模型和库,包括 Evo 2、Boltz-2 和 OpenFold3。而科学家手里已经信得过的模型、数据集和流水线也能一并接进来:任何一条流水线可以存成可复用的技能,任何常用工具可以用连接器接上,后续会话会自动继承它们。你不必为了用 AI 就丢掉已经信任的工具链。

7三个实验室的实测

三个实验室已经用出了什么

过去几个月,研究者已在测试版里用它做单细胞 RNA 测序分析、CRISPR 筛选设计、蛋白质结构预测、化学信息学等工作。三个案例最能看出落地效果。

实验室用它做了什么量化结果
Manifold Bio端到端筛选组织靶向药的靶点,逐个评估表面表达、体内转运和安全性,按自家专有数据学到的标准排序一次跑通全流程;与通用编程助手的关键差别,是它能自己找对数据、带着过往项目经验下判断
Allen Institute
神经科学家 Jérôme Lecoq
搭了一套约 20 个自定义技能的多 agent「计算综述模板」,子 agent 读数千篇论文,抽出核心论点和关键定量结论存进证据库,再分节写综述,每节交给专属子 agent,用 actor-critic 配对边写边核此前写一篇综述最多要两年,现已产出约 10 篇,多篇超 100 页,引用都经审稿 agent 核查
UCSF 脑瘤中心
流行病学副教授 Stephen Francis
研究胶质瘤分子流行病学:数千个小效应种系变异如何叠加,塑造个体易感性,做跨多种方法的全面种系分析耗时缩到约十分之一,其团队独立复核过结果,确认既快又稳
UCSF 分析耗时
此前
10×
UCSF 分析耗时
用后
1× · 十分之一
Allen 综述产出
此前 / 两年
1 篇
Allen 综述产出
现在
约 10 篇
8现在怎么用上

现在谁能用、怎么用

Claude Science 应用现以测试版形式,在 macOS 和 Linux 上向 Pro、Max、Team、Enterprise 用户开放。Team 和 Enterprise 用户需要由管理员开启。Anthropic 表示提早放出,是想让科学家先拿真问题上手,再反馈怎么打磨。

面向学术机构和非营利科研机构的活跃实验室,还有一档折扣席位的 Team 方案。

还有一笔面向科学项目的资助(点开看细节)

Anthropic 将支持最多 50 个 Claude Science「AI for Science」项目,每个提供最高 3 万美元额度;Modal 另为入选项目提供最高 2 千美元算力。方向优先落在生物和生物医学研究。申请开放到 2026 年 7 月 15 日,7 月 31 日前发通知,项目周期为 2026 年 9 月 1 日至 12 月 1 日。

每一个产出都带着它如何生成的可审计记录,你因此能验证并复现结果。 Anthropic,《Claude Science, an AI workbench for scientists》
本文基于 Anthropic 官方发布公告《Claude Science, an AI workbench for scientists》(claude.com/science)整理解读。文中数据、案例与产品能力均来自该公告,为厂商自述口径,其中 UCSF 案例称经实验室独立验证。图片来自 Anthropic 官方发布页。