製品リリース · 小互解読

Anthropic が Claude Science を発表:科学者向けの AI ワークベンチ、60 以上の研究スキルを内蔵

すでにベータ公開。一つの調整 agent が専門家チームを立ち上げて作業させ、末端にはレビュー agent が引用と数字の誤りを専門にチェックする。計算リソースは AI に任せ、生データはローカルから出さない。
一分で概観
  • Anthropic が Claude Science を発表。科学者向けの AI ワークベンチアプリで、すでに Pro、Max、Team、Enterprise ユーザーにベータ版を公開。macOS/Linux でのローカル利用、または SSH/HPC ログインノード経由のリモート利用に対応する。
  • アプリには 60 以上のプリセットスキルとコネクタが内蔵され、ゲノミクス、シングルセル、プロテオミクス、構造生物学、ケモインフォマティクスをカバー。背後には数百から数千の専門データソース(UniProt、PDB、Ensembl など)や、ジャーナル・プレプリントのリソースがつながっている。
  • 計算タスクを自律的に起草し、ユーザーの同意を得てからユーザー自身の HPC クラスタや Modal クラウドの GPU に投入。分析を 1 枚の GPU から数百枚へと拡張できるが、生データは常にユーザー自身のシステム内にとどまる。
  • レビュー agent を内蔵し、生成内容の引用が実在するか、数字が計算過程と一致するか、図表がそれを生み出したコードと整合するかを全工程でチェック。問題を見つけると自動で修正する。
  • すでに実例がある:Allen Institute の研究者は、以前は書くのに 2 年かかっていたレビュー論文を約 10 本産出(うち複数は 100 ページ超)。UCSF チームの生殖細胞系列変異の全工程分析は所要時間が従来の 10 分の 1 に短縮され、しかも研究室が独立に検証済み。
立場について:本記事は Anthropic の公式発表告知をもとに整理したもので、ベンダー自身の説明に基づく。本文中の性能データ(10 分の 1 の所要時間、約 10 本のレビュー論文など)は協力研究室とベンダーが提供したもので、うち UCSF の事例は研究室が独立に検証したとされるが、その他の数字は第三者の照合を経ていない。
1科学者にも専用のワークベンチ

科学者にも専用の AI ワークベンチが登場

Anthropic はこのほど Claude Science を発表した。科学者がよく使うツール、データベース、計算リソースを一つの環境に統合した AI ワークベンチアプリで、Pro、Max、Team、Enterprise ユーザーにベータ版を公開している。

これは自分のパソコンやサーバーにインストールするアプリだ:普段の言葉で AI に科学的な問いを投げると、数十の専門ツールを動かしてデータを調べ、分析を回し、図を描き、原稿を書く。しかも各ステップの成果は、それがどう生まれたかまで遡って追える。Jupyter Notebook のようにローカル(macOS/Linux)で使うこともできれば、リモートマシン上で SSH や HPC ログインノード経由で使うこともできる。

注目に値する理由:UCSF 脳腫瘍センターのチームが実測したところ、グリオーマの生殖細胞系列変異の全工程分析にこれを使うと、所要時間が従来の10 分の 1に短縮された。しかも研究室が独立に再検証し、速いだけでなく信頼できる結果だと確認している。
スキル · コネクタ 科学 DB 論文 · プレプリント Modal GPU クラウド HPC クラスタ 手元の PC 専門モデル 調整 agent
看板図:一つの中心の調整 agent が、かつて各所に散らばっていたスキル、データベース、ジャーナル、専門モデル、そして 3 種類の計算リソース(PC/HPC/GPU クラウド)を、同じ一つの対話にまとめ込む。
2従来のやり方はどれほど断片的か

科学者は普段どれほど頭を悩ませているか

研究の日常には大量の雑務がある。研究者は数十のデータベースを行き来し、各データベースはそれぞれ独自のデータ構造(schema)を持つ。遭遇するファイル形式には、専用の処理パイプラインやビューアを用意しなければならないことも多い。ツールとなると長い列だ:PubMed、Jupyter、R、クラスタの端末と、次々に切り替えていく。

PubMedJupyterRクラスタ端末DB ごとの schema専用ファイルビューア自作データパイプライン

これらのツールを寄せ集め、その間でデータを流通させるだけで、研究者は多大な労力を費やす。Claude Science がやろうとしているのは、こうしたバラバラの部品を一つの環境にまとめ、文献調査から原稿執筆まですべての工程をその中で完結させることだ。

3一つの調整役、一群の専門家

一つの総調整 agent、その背後で一群の専門家が働く

あなたが対話する相手は、汎用の調整 agent だ。それが例の 60 以上のプリセットスキルとコネクタを握っており、専門分野の専門家サブ agent を立ち上げることも、あなた自身が作った専用 agent を呼び出すこともできる。それらが手分けしてデータを調べ、分析を回し、結果を出す。

スキルとコネクタとは

スマホのアプリストア+ショートカットのようなものだと考えればいい:どのデータベースやソフトを操作したいかに応じて、調整 agent に対応する「スキルパック」を入れると、そのツールの使い方を心得る。コネクタのほうは、あなたの研究室で現在使っているツールをつなぎ込む役割を担う。

肝心なのは、チェーンの末端に、誤りを専門に見つけ出す役割がもう一つ立っていることだ——レビュー agent(reviewer agent)。それは他の agent の成果を見張り、一項目ずつ照合し、問題を見つければ自ら手を入れて直す。

あなた
普段の言葉で質問
調整 agent
専門家サブ agent
自作の agent
レビュー agent が照合引用が実在するか、数字が計算過程と一致するか、図表がそれを生み出したコードと整合するかをチェック
問題を発見
自動で修正
コア革新 · 一

このレビュー agent は、全工程に常駐する査読者に等しい:引用に本当に出典があるか、示された数字が元の計算まで遡れるか、図表とそれを生成したコードが噛み合うかを専門に注視する。誤りを見つければ、問題をあなたに丸投げせず自分で直す。これは「AI が生成した内容はもっともらしく捏造しがち」という古くからの難点に真正面から対処するものだ。

この組み合わせを actor-critic(俳優と批評家)と呼ぶ

一方の agent が内容の生成を担う「俳優」。もう一方は正確性と引用の信頼性の照合を専門にする「批評家」で、両者は役割を分けて互いを牽制する。ちょうど、一人の記者が原稿を書き、もう一人の専任ファクトチェック編集者が一文ずつ照合するように、どちらも相手を無条件に保証はしない。

4どの図も遡って追える

生成したどの図も、それを生んだコードまで遡れる

研究はそもそも図を見ることに大きく依存する。だから Claude Science は図や原稿を出すとき、それらを生成したコードもあわせて示す。さらに研究専用の可視化形式——3D のタンパク質構造、ゲノムブラウザのトラック、化学構造など——をネイティブに描画でき、専用のビューアを別に開く必要がない。

Claude Science がタンパク質、構造、分子をネイティブに描画
Claude Science がタンパク質、分子、構造をネイティブに描画。どの結果も再現可能で、それを生成したコードまで遡れる。画像出典:Anthropic

一枚の図を生成するとき、あわせて次を添える:その図を生み出した正確なコードと実行環境、それがどう生まれたかの一言説明、そして完全な対話ログ。つまり数か月後に振り返っても、当時何を入力したのか、結果をどう検証し、どう再現するのかを突き止められる。

一枚の図に、図とともについてくる
  • それを生んだコード
  • 実行環境
  • 一言の由来説明
  • 完全な対話ログ
だからあなたは
  • すべての入力を把握
  • いつでも検証
  • 数か月後も再現可能

図の修正も自分でコードをいじる必要はない。「グリッド線を消して」や「縦軸を対数スケールに変えて」と普段の言葉で伝えれば、自分が書いたそのコードを直し、一枚描き直す。

グリッド線ありの棒グラフ
グリッド線を削除。agent が自身の描画コードを直接修正した
5AI がスパコンを動かす

AI が自らあなたのスパコンを動かすが、データは動かない

大規模な分析は骨が折れる:タンパク質を一つ折りたたむ、膨大なデータセット上でゲノムのパイプラインを一本回す——研究者はしばしば手元の科学的な問いを中断し、計算タスクを設定し、クラスタでの順番待ちを待ち、成否を見張り、結果を引き戻す。Claude Science はこの一連をまるごと引き受ける。

Claude Science がノート PC、クラスタ、オンデマンド GPU 上で環境を構築し計算リソースを配分
Claude Science があなたのノート PC、クラスタ、オンデマンド GPU 上で実行環境を自動構築し、計算リソースを配分する。画像出典:Anthropic

まず計画を起草し、新しいリソースを動員する前にあなたに尋ねる。あなたはどの判断も確認でき、撤回することさえできる。同意を得て初めて、タスクを書き上げ、あなたの研究室が現在使っている計算リソースに投入する:SSH 経由の自前 HPC クラスタ、あるいはあなたの Modal アカウントでオンデマンドに使うクラウド GPU だ。規模は1 枚の GPU から数百枚まで伸縮できる。

計画を起草
同意を求める
確認/撤回可
タスクを作成し投入
あなたの HPC(SSH)
/ Modal GPU
必要なコンテキスト
のみ返送
コア革新 · 二

一連の処理は、あなたの研究室自身のインフラ——ノート PC、Linux マシン、または HPC ログインノード上で走る。だから大きく機微なデータセットは、もともと置かれているシステムから出る必要が一切ない。各ステップでは、そのステップの分析に必要なわずかなコンテキストだけを Claude に渡す。計算リソースは AI の配分に任せつつ、生データは動かない。

これらの agent は、コンテキストをメモリ上に保持するセッションの中で作業するため、膨大なデータセットでも一度読み込むだけで済む。タスクが走り出すと、例のレビュー agent も並行して成果をチェックし、誤った引用、遡れない数字、コードと合わない図表をあぶり出し、走らせながら自己修正する。

fork セッションとは

タスクの途中で、並行するブランチを一つ複製し、別の方法でそれぞれ走らせられる。両者は互いに影響せず、元の対話スレッドも失われない。ちょうど同じ文書を 2 つのバージョンに別名保存してそれぞれ手を入れるように、片方を壊しても原稿には手が触れない。

6作り付けの専門的な土台

箱を開けた瞬間から通じている:各種データベースと専門モデルが接続済み

科学的な知識は、数百から数千の専門ソースに散らばっている。生物学だけでも、関連データは UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO といったリソースに分散し、それぞれ独自の構造とクエリ言語を持つ。さらにジャーナル、プレプリントサーバー、分野専用のオープンソースモデルもある。普段の言葉で一つ問いを投げれば、専門家 agent がこれらのソースを横断して調べ、統合してくれるので、一つずつ手探りせずに済む。

Claude Science は研究向けにプリセット済み、60 以上のスキルが各種データソースにつないでくれる
ゲノミクス、シングルセル、プロテオミクス、ケモインフォマティクス向けのプリセットを内蔵。60 以上のスキルが各種の科学データソースにつないでくれる。画像出典:Anthropic
60+
作り付けの研究スキルとコネクタ。ゲノミクス、シングルセル、プロテオミクス、構造生物学、ケモインフォマティクスをカバー
数百〜数千
科学的知識が散らばる専門データソース(UniProt、PDB、Ensembl など)とジャーナル・プレプリント
1 → 数百枚
計算タスクを伸縮拡張できる GPU の枚数
UniProtPDBEnsemblReactomeClinVarChEMBLGEO

さらに NVIDIA の BioNeMo Agent Toolkit を組み込み、BioNeMo 内のライフサイエンスのモデルとライブラリ——Evo 2、Boltz-2、OpenFold3 を含む——にネイティブでつながる。そして科学者がすでに信頼しているモデル、データセット、パイプラインもあわせて接続できる:どのパイプラインも再利用可能なスキルとして保存でき、どの常用ツールもコネクタでつなげ、以降のセッションはそれらを自動で引き継ぐ。AI を使うために、信頼してきたツールチェーンを捨てる必要はない。

7三つの研究室の実測

三つの研究室がすでに何を成し遂げたか

ここ数か月、研究者はすでにベータ版で、シングルセル RNA シーケンス解析、CRISPR スクリーニング設計、タンパク質構造予測、ケモインフォマティクスなどの作業にこれを使ってきた。三つの事例が、その実用効果を最もよく物語る。

研究室何に使ったか定量的な結果
Manifold Bio組織ターゲティング薬の標的を端から端までスクリーニング。表面発現、体内輸送、安全性を一つずつ評価し、自社の専有データから学んだ基準で順位付け一度で全工程を走破。汎用のコーディングアシスタントとの決定的な違いは、自ら正しいデータを見つけ、過去のプロジェクト経験を踏まえて判断できる点
Allen Institute
神経科学者 Jérôme Lecoq
約 20 のカスタムスキルからなるマルチ agent の「計算レビューテンプレート」を構築。サブ agent が数千本の論文を読み、核心的な論点と重要な定量的結論を抜き出して証拠データベースに保存。さらに節ごとにレビューを執筆し、各節を専用のサブ agent に任せ、actor-critic の組み合わせで書きながら照合する以前はレビューを 1 本書くのに最大 2 年かかっていたが、すでに約 10 本を産出。うち複数は 100 ページ超で、引用はすべてレビュー agent が照合済み
UCSF 脳腫瘍センター
疫学准教授 Stephen Francis
グリオーマの分子疫学を研究:数千の小さな効果の生殖細胞系列変異がどう積み重なり、個人の罹りやすさを形づくるか。複数の手法を横断する包括的な生殖細胞系列分析を実施所要時間を約10 分の 1に短縮。チームが独立に結果を再検証し、速いうえに安定していると確認
UCSF 分析の所要時間
以前
10×
UCSF 分析の所要時間
利用後
1× · 10 分の 1
Allen のレビュー産出
以前 / 2 年
1 本
Allen のレビュー産出
現在
約 10 本
8今どう使い始めるか

今、誰が使えて、どう使うか

Claude Science アプリは現在ベータ版として、macOS と Linux 上で Pro、Max、Team、Enterprise ユーザーに公開されている。Team と Enterprise のユーザーは管理者による有効化が必要だ。Anthropic は、早めに公開したのは、科学者にまず本物の課題で使ってもらい、どう磨くべきかフィードバックをもらうためだとしている。

学術機関や非営利の研究機関で活動する研究室向けには、割引席の Team プランも用意されている。

科学プロジェクト向けの助成金もある(クリックで詳細)

Anthropic は最大 50 件の Claude Science「AI for Science」プロジェクトを支援し、各プロジェクトに最高 3 万ドルのクレジットを提供する。Modal は別途、選ばれたプロジェクトに最高 2 千ドル分の計算リソースを提供する。方向性は生物学・生物医学研究を優先する。応募は 2026 年 7 月 15 日まで、7 月 31 日までに通知、プロジェクト期間は 2026 年 9 月 1 日から 12 月 1 日まで。

あらゆる成果には、それがどう生成されたかの監査可能な記録が付随する。だからこそあなたは結果を検証し、再現できる。 Anthropic『Claude Science, an AI workbench for scientists』
本記事は Anthropic の公式発表告知『Claude Science, an AI workbench for scientists』(claude.com/science)をもとに整理・解読したもの。本文中のデータ、事例、製品の能力はいずれも同告知に由来し、ベンダー自身の説明に基づく。うち UCSF の事例は研究室が独立に検証したとされる。画像は Anthropic の公式発表ページより。