Anthropic が Claude Science を発表:科学者向けの AI ワークベンチ、60 以上の研究スキルを内蔵
- Anthropic が Claude Science を発表。科学者向けの AI ワークベンチアプリで、すでに Pro、Max、Team、Enterprise ユーザーにベータ版を公開。macOS/Linux でのローカル利用、または SSH/HPC ログインノード経由のリモート利用に対応する。
- アプリには 60 以上のプリセットスキルとコネクタが内蔵され、ゲノミクス、シングルセル、プロテオミクス、構造生物学、ケモインフォマティクスをカバー。背後には数百から数千の専門データソース(UniProt、PDB、Ensembl など)や、ジャーナル・プレプリントのリソースがつながっている。
- 計算タスクを自律的に起草し、ユーザーの同意を得てからユーザー自身の HPC クラスタや Modal クラウドの GPU に投入。分析を 1 枚の GPU から数百枚へと拡張できるが、生データは常にユーザー自身のシステム内にとどまる。
- レビュー agent を内蔵し、生成内容の引用が実在するか、数字が計算過程と一致するか、図表がそれを生み出したコードと整合するかを全工程でチェック。問題を見つけると自動で修正する。
- すでに実例がある:Allen Institute の研究者は、以前は書くのに 2 年かかっていたレビュー論文を約 10 本産出(うち複数は 100 ページ超)。UCSF チームの生殖細胞系列変異の全工程分析は所要時間が従来の 10 分の 1 に短縮され、しかも研究室が独立に検証済み。
科学者にも専用の AI ワークベンチが登場
Anthropic はこのほど Claude Science を発表した。科学者がよく使うツール、データベース、計算リソースを一つの環境に統合した AI ワークベンチアプリで、Pro、Max、Team、Enterprise ユーザーにベータ版を公開している。
これは自分のパソコンやサーバーにインストールするアプリだ:普段の言葉で AI に科学的な問いを投げると、数十の専門ツールを動かしてデータを調べ、分析を回し、図を描き、原稿を書く。しかも各ステップの成果は、それがどう生まれたかまで遡って追える。Jupyter Notebook のようにローカル(macOS/Linux)で使うこともできれば、リモートマシン上で SSH や HPC ログインノード経由で使うこともできる。
科学者は普段どれほど頭を悩ませているか
研究の日常には大量の雑務がある。研究者は数十のデータベースを行き来し、各データベースはそれぞれ独自のデータ構造(schema)を持つ。遭遇するファイル形式には、専用の処理パイプラインやビューアを用意しなければならないことも多い。ツールとなると長い列だ:PubMed、Jupyter、R、クラスタの端末と、次々に切り替えていく。
これらのツールを寄せ集め、その間でデータを流通させるだけで、研究者は多大な労力を費やす。Claude Science がやろうとしているのは、こうしたバラバラの部品を一つの環境にまとめ、文献調査から原稿執筆まですべての工程をその中で完結させることだ。
一つの総調整 agent、その背後で一群の専門家が働く
あなたが対話する相手は、汎用の調整 agent だ。それが例の 60 以上のプリセットスキルとコネクタを握っており、専門分野の専門家サブ agent を立ち上げることも、あなた自身が作った専用 agent を呼び出すこともできる。それらが手分けしてデータを調べ、分析を回し、結果を出す。
スマホのアプリストア+ショートカットのようなものだと考えればいい:どのデータベースやソフトを操作したいかに応じて、調整 agent に対応する「スキルパック」を入れると、そのツールの使い方を心得る。コネクタのほうは、あなたの研究室で現在使っているツールをつなぎ込む役割を担う。
肝心なのは、チェーンの末端に、誤りを専門に見つけ出す役割がもう一つ立っていることだ——レビュー agent(reviewer agent)。それは他の agent の成果を見張り、一項目ずつ照合し、問題を見つければ自ら手を入れて直す。
普段の言葉で質問
自動で修正
このレビュー agent は、全工程に常駐する査読者に等しい:引用に本当に出典があるか、示された数字が元の計算まで遡れるか、図表とそれを生成したコードが噛み合うかを専門に注視する。誤りを見つければ、問題をあなたに丸投げせず自分で直す。これは「AI が生成した内容はもっともらしく捏造しがち」という古くからの難点に真正面から対処するものだ。
一方の agent が内容の生成を担う「俳優」。もう一方は正確性と引用の信頼性の照合を専門にする「批評家」で、両者は役割を分けて互いを牽制する。ちょうど、一人の記者が原稿を書き、もう一人の専任ファクトチェック編集者が一文ずつ照合するように、どちらも相手を無条件に保証はしない。
生成したどの図も、それを生んだコードまで遡れる
研究はそもそも図を見ることに大きく依存する。だから Claude Science は図や原稿を出すとき、それらを生成したコードもあわせて示す。さらに研究専用の可視化形式——3D のタンパク質構造、ゲノムブラウザのトラック、化学構造など——をネイティブに描画でき、専用のビューアを別に開く必要がない。
一枚の図を生成するとき、あわせて次を添える:その図を生み出した正確なコードと実行環境、それがどう生まれたかの一言説明、そして完全な対話ログ。つまり数か月後に振り返っても、当時何を入力したのか、結果をどう検証し、どう再現するのかを突き止められる。
- それを生んだコード
- 実行環境
- 一言の由来説明
- 完全な対話ログ
- すべての入力を把握
- いつでも検証
- 数か月後も再現可能
図の修正も自分でコードをいじる必要はない。「グリッド線を消して」や「縦軸を対数スケールに変えて」と普段の言葉で伝えれば、自分が書いたそのコードを直し、一枚描き直す。
AI が自らあなたのスパコンを動かすが、データは動かない
大規模な分析は骨が折れる:タンパク質を一つ折りたたむ、膨大なデータセット上でゲノムのパイプラインを一本回す——研究者はしばしば手元の科学的な問いを中断し、計算タスクを設定し、クラスタでの順番待ちを待ち、成否を見張り、結果を引き戻す。Claude Science はこの一連をまるごと引き受ける。
まず計画を起草し、新しいリソースを動員する前にあなたに尋ねる。あなたはどの判断も確認でき、撤回することさえできる。同意を得て初めて、タスクを書き上げ、あなたの研究室が現在使っている計算リソースに投入する:SSH 経由の自前 HPC クラスタ、あるいはあなたの Modal アカウントでオンデマンドに使うクラウド GPU だ。規模は1 枚の GPU から数百枚まで伸縮できる。
確認/撤回可
/ Modal GPU
のみ返送
一連の処理は、あなたの研究室自身のインフラ——ノート PC、Linux マシン、または HPC ログインノード上で走る。だから大きく機微なデータセットは、もともと置かれているシステムから出る必要が一切ない。各ステップでは、そのステップの分析に必要なわずかなコンテキストだけを Claude に渡す。計算リソースは AI の配分に任せつつ、生データは動かない。
これらの agent は、コンテキストをメモリ上に保持するセッションの中で作業するため、膨大なデータセットでも一度読み込むだけで済む。タスクが走り出すと、例のレビュー agent も並行して成果をチェックし、誤った引用、遡れない数字、コードと合わない図表をあぶり出し、走らせながら自己修正する。
タスクの途中で、並行するブランチを一つ複製し、別の方法でそれぞれ走らせられる。両者は互いに影響せず、元の対話スレッドも失われない。ちょうど同じ文書を 2 つのバージョンに別名保存してそれぞれ手を入れるように、片方を壊しても原稿には手が触れない。
箱を開けた瞬間から通じている:各種データベースと専門モデルが接続済み
科学的な知識は、数百から数千の専門ソースに散らばっている。生物学だけでも、関連データは UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO といったリソースに分散し、それぞれ独自の構造とクエリ言語を持つ。さらにジャーナル、プレプリントサーバー、分野専用のオープンソースモデルもある。普段の言葉で一つ問いを投げれば、専門家 agent がこれらのソースを横断して調べ、統合してくれるので、一つずつ手探りせずに済む。
さらに NVIDIA の BioNeMo Agent Toolkit を組み込み、BioNeMo 内のライフサイエンスのモデルとライブラリ——Evo 2、Boltz-2、OpenFold3 を含む——にネイティブでつながる。そして科学者がすでに信頼しているモデル、データセット、パイプラインもあわせて接続できる:どのパイプラインも再利用可能なスキルとして保存でき、どの常用ツールもコネクタでつなげ、以降のセッションはそれらを自動で引き継ぐ。AI を使うために、信頼してきたツールチェーンを捨てる必要はない。
三つの研究室がすでに何を成し遂げたか
ここ数か月、研究者はすでにベータ版で、シングルセル RNA シーケンス解析、CRISPR スクリーニング設計、タンパク質構造予測、ケモインフォマティクスなどの作業にこれを使ってきた。三つの事例が、その実用効果を最もよく物語る。
| 研究室 | 何に使ったか | 定量的な結果 |
|---|---|---|
| Manifold Bio | 組織ターゲティング薬の標的を端から端までスクリーニング。表面発現、体内輸送、安全性を一つずつ評価し、自社の専有データから学んだ基準で順位付け | 一度で全工程を走破。汎用のコーディングアシスタントとの決定的な違いは、自ら正しいデータを見つけ、過去のプロジェクト経験を踏まえて判断できる点 |
| Allen Institute 神経科学者 Jérôme Lecoq | 約 20 のカスタムスキルからなるマルチ agent の「計算レビューテンプレート」を構築。サブ agent が数千本の論文を読み、核心的な論点と重要な定量的結論を抜き出して証拠データベースに保存。さらに節ごとにレビューを執筆し、各節を専用のサブ agent に任せ、actor-critic の組み合わせで書きながら照合する | 以前はレビューを 1 本書くのに最大 2 年かかっていたが、すでに約 10 本を産出。うち複数は 100 ページ超で、引用はすべてレビュー agent が照合済み |
| UCSF 脳腫瘍センター 疫学准教授 Stephen Francis | グリオーマの分子疫学を研究:数千の小さな効果の生殖細胞系列変異がどう積み重なり、個人の罹りやすさを形づくるか。複数の手法を横断する包括的な生殖細胞系列分析を実施 | 所要時間を約10 分の 1に短縮。チームが独立に結果を再検証し、速いうえに安定していると確認 |
今、誰が使えて、どう使うか
Claude Science アプリは現在ベータ版として、macOS と Linux 上で Pro、Max、Team、Enterprise ユーザーに公開されている。Team と Enterprise のユーザーは管理者による有効化が必要だ。Anthropic は、早めに公開したのは、科学者にまず本物の課題で使ってもらい、どう磨くべきかフィードバックをもらうためだとしている。
学術機関や非営利の研究機関で活動する研究室向けには、割引席の Team プランも用意されている。
科学プロジェクト向けの助成金もある(クリックで詳細)
Anthropic は最大 50 件の Claude Science「AI for Science」プロジェクトを支援し、各プロジェクトに最高 3 万ドルのクレジットを提供する。Modal は別途、選ばれたプロジェクトに最高 2 千ドル分の計算リソースを提供する。方向性は生物学・生物医学研究を優先する。応募は 2026 年 7 月 15 日まで、7 月 31 日までに通知、プロジェクト期間は 2026 年 9 月 1 日から 12 月 1 日まで。
あらゆる成果には、それがどう生成されたかの監査可能な記録が付随する。だからこそあなたは結果を検証し、再現できる。 Anthropic『Claude Science, an AI workbench for scientists』