Anthropic 发布 Claude Science:面向科学家的 AI 工作台,内置 60 多个科研技能
- Anthropic 发布 Claude Science,一款面向科学家的 AI 工作台应用,现已向 Pro、Max、Team、Enterprise 用户开放测试版,支持在 macOS/Linux 本地,或通过 SSH/HPC 登录节点远程使用。
- 应用内置 60 多个预配置技能和连接器,覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学,背后接进成百上千个专业数据源(UniProt、PDB、Ensembl 等)以及期刊、预印本资源。
- 它能自主起草计算任务,征得用户同意后提交到用户自己的 HPC 集群或 Modal 云端 GPU,把分析从单块 GPU 扩展到数百块,而原始数据始终留在用户自己的系统里。
- 内置一个审稿 agent,全程检查生成内容里的引用是否真实、数字能否对上计算过程、图表是否和产出它的代码一致,发现问题会自动修正。
- 已有真实案例:Allen Institute 研究员把过去要写两年的综述产出了约十篇(多篇超百页);UCSF 团队的种系变异全流程分析耗时缩短到原来的十分之一,且经实验室独立验证。
科学家也有了自己的 AI 工作台
Anthropic 近日发布 Claude Science,一款把科学家常用的工具、数据库和计算资源整合进单一环境的 AI 工作台应用,面向 Pro、Max、Team 和 Enterprise 用户开放测试版。
它是一个装在你自己电脑或服务器上的应用:你用大白话向一个 AI 提出科学问题,它调动数十个专业工具去查数据、跑分析、画图表、写手稿,而每一步产物都能倒查回它是怎么来的。你可以像用 Jupyter Notebook 那样,在本地(macOS/Linux)用它,也可以在远程机器上通过 SSH 或 HPC 登录节点用它。
科学家平时到底有多头疼
科研的日常里有大量琐碎活。研究者要在几十个数据库之间来回切,每个库有自己的一套数据结构(schema);碰到的文件格式还常常得配专门的处理流水线和查看器;工具则是一长串:PubMed、Jupyter、R、集群终端,一个接一个地换。
光是把这些工具凑到一起、让数据在它们之间流转,就要耗掉研究者大量精力。Claude Science 想做的,就是把这些散件收进一个环境,让人在其中走完从查文献到出手稿的全部环节。
一个总协调 agent,背后一群专家在干活
你对话的对象是一个通用的协调 agent。它手里握着那 60 多个预配置技能和连接器,能拉起专门领域的专家子 agent,也能调用你自己创建的专属 agent。它们分头去查数据、跑分析、出结果。
可以把它想成手机的应用商店加快捷指令:需要操作哪个数据库或软件,就给协调 agent 装上对应的「技能包」,它就知道怎么调用那个工具。连接器则负责把你实验室现用的工具接进来。
关键的一环,是链条末端还站着一个专门挑错的角色,审稿 agent(reviewer agent)。它盯着其他 agent 的产出,逐项核查,发现问题就自己动手改。
用大白话提问
自动修正
这个审稿 agent 相当于一个全程在线的同行评审员:它专盯引用是不是真有出处、给出的数字能不能追回到原始计算、图表和生成它的代码对不对得上。查出错,它会自己改,而不是把问题留给你。这直接对着「AI 生成内容爱一本正经地编」这个老毛病。
一个 agent 负责生成内容,是「演员」;另一个专职核对准确性和引用可信度,是「评论家」,两者分工制衡。就像一个记者写稿,另一个专职事实核查编辑逐句核对,谁也不替谁背书。
生成的每张图,都能倒查回它的代码
科研本身就很依赖看图,所以 Claude Science 出图和出手稿时,会把生成它们的代码一并给出。它还能原生渲染科研专用的可视化格式:3D 蛋白质结构、基因组浏览器轨道、化学结构等,不用另开专门的查看器。
它生成一张图时,会一并附上:产出这张图的确切代码和运行环境、一句话说明它是怎么来的,以及完整的对话记录。这意味着几个月后你回头看,还能弄清当时喂进去的是什么、结果怎么验证、怎么复现。
- 产出它的代码
- 运行环境
- 一句话由来说明
- 完整对话记录
- 看清全部输入
- 随时验证
- 几个月后仍可复现
改图也不用自己动代码。你用大白话对它说「去掉网格线」或「把纵轴改成对数刻度」,它会去改自己写的那段代码,重出一张。
AI 亲自去调你的超算,数据却不挪窝
大分析很折腾人:折叠一个蛋白质、在海量数据集上跑一条基因组流水线,研究者往往得停下手头的科学问题,去配置计算任务、等它排队上集群、盯着看成没成、再把结果拉回来。Claude Science 把这一整套接了过去。
它先起草一个计划,在动用新资源前先问你,你可以审阅甚至撤回任何一个决定。得到同意后,它才把任务写好、提交到你实验室现用的算力上:走 SSH 的自有 HPC 集群,或你的 Modal 账户按需取用云 GPU。规模能从单块 GPU 弹到数百块。
可审阅/撤回
/ Modal GPU
必要上下文
整个过程跑在你实验室自己的基础设施上,你的笔记本、Linux 机器或 HPC 登录节点。所以又大又敏感的数据集根本不用离开它们本来所在的系统,每一步只把当步分析必需的那点上下文传给 Claude。算力可以外包给 AI 调度,原始数据不挪窝。
因为这些 agent 是在一个把上下文存在内存里的会话中干活,即便是海量数据集也只需加载一次。任务跑起来时,那个审稿 agent 也在同步检查产出,揪出错误引用、追不回来的数字、和代码对不上的图表,边跑边自我修正。
任务进行到一半,你可以复制出一个平行分支,用另一种方法各跑一遍,两边互不影响,原来的对话线程也不丢。就像把同一份文档另存成两个版本分别改,改坏了也不动原稿。
开箱就懂行:各路数据库和专业模型都接好了
科学知识散落在成百上千个专门来源里。光是生物学,相关数据就可能分布在 UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO 这些资源里,每个都有自己的结构和查询语言,还有期刊、预印本服务器和领域专用的开源模型。你用大白话提一个问题,专家 agent 会跨这些来源去查、去综合,省得你一个个去摸。
它还接入了 NVIDIA 的 BioNeMo Agent Toolkit,原生连上 BioNeMo 里的生命科学模型和库,包括 Evo 2、Boltz-2 和 OpenFold3。而科学家手里已经信得过的模型、数据集和流水线也能一并接进来:任何一条流水线可以存成可复用的技能,任何常用工具可以用连接器接上,后续会话会自动继承它们。你不必为了用 AI 就丢掉已经信任的工具链。
三个实验室已经用出了什么
过去几个月,研究者已在测试版里用它做单细胞 RNA 测序分析、CRISPR 筛选设计、蛋白质结构预测、化学信息学等工作。三个案例最能看出落地效果。
| 实验室 | 用它做了什么 | 量化结果 |
|---|---|---|
| Manifold Bio | 端到端筛选组织靶向药的靶点,逐个评估表面表达、体内转运和安全性,按自家专有数据学到的标准排序 | 一次跑通全流程;与通用编程助手的关键差别,是它能自己找对数据、带着过往项目经验下判断 |
| Allen Institute 神经科学家 Jérôme Lecoq | 搭了一套约 20 个自定义技能的多 agent「计算综述模板」,子 agent 读数千篇论文,抽出核心论点和关键定量结论存进证据库,再分节写综述,每节交给专属子 agent,用 actor-critic 配对边写边核 | 此前写一篇综述最多要两年,现已产出约 10 篇,多篇超 100 页,引用都经审稿 agent 核查 |
| UCSF 脑瘤中心 流行病学副教授 Stephen Francis | 研究胶质瘤分子流行病学:数千个小效应种系变异如何叠加,塑造个体易感性,做跨多种方法的全面种系分析 | 耗时缩到约十分之一,其团队独立复核过结果,确认既快又稳 |
现在谁能用、怎么用
Claude Science 应用现以测试版形式,在 macOS 和 Linux 上向 Pro、Max、Team、Enterprise 用户开放。Team 和 Enterprise 用户需要由管理员开启。Anthropic 表示提早放出,是想让科学家先拿真问题上手,再反馈怎么打磨。
面向学术机构和非营利科研机构的活跃实验室,还有一档折扣席位的 Team 方案。
还有一笔面向科学项目的资助(点开看细节)
Anthropic 将支持最多 50 个 Claude Science「AI for Science」项目,每个提供最高 3 万美元额度;Modal 另为入选项目提供最高 2 千美元算力。方向优先落在生物和生物医学研究。申请开放到 2026 年 7 月 15 日,7 月 31 日前发通知,项目周期为 2026 年 9 月 1 日至 12 月 1 日。
每一个产出都带着它如何生成的可审计记录,你因此能验证并复现结果。 Anthropic,《Claude Science, an AI workbench for scientists》