Articleanthropic.com·2026년 7월 5일·0

Claude Science, an AI workbench for scientists

Quick Summary

Anthropic은 과학자들이 문헌 분석, 데이터·계산 작업, 시각화·원고 작성, 재현 가능한 검증까지 한 환경에서 수행할 수 있도록 설계한 AI 워크벤치 Claude Science를 베타로 공개했다.

Claude Science, an AI workbench for scientists 관련 대표 이미지

🖼️ 인포그래픽

Claude Science, an AI workbench for scientists 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

Claude Science, an AI workbench for scientists 내용을 설명하는 본문 이미지

💡 한 줄 요약

Anthropic은 과학자들이 문헌 분석, 데이터·계산 작업, 시각화·원고 작성, 재현 가능한 검증까지 한 환경에서 수행할 수 있도록 설계한 AI 워크벤치 Claude Science를 베타로 공개했다.

📌 핵심 요약

  • Claude Science는 과학 연구에서 흩어져 있는 데이터베이스, 파일 형식, 분석 도구, 클러스터 작업을 하나의 연구 환경으로 묶는 앱으로 소개됐다.
  • 이 앱은 60개 이상의 과학용 스킬과 커넥터, 일반 조정 에이전트, 사용자 정의 전문 에이전트, 인용과 계산을 점검하는 리뷰어 에이전트를 포함한다.
  • 생성된 그림·원고·분석 결과에는 코드, 실행 환경, 설명, 메시지 이력이 함께 남아 나중에도 검증과 재현이 가능하도록 설계됐다.
  • Claude Science는 연구실의 노트북, Linux 장비, SSH 기반 HPC 로그인 노드, Modal 계정 등 기존 인프라에서 실행되며, 큰 데이터나 민감한 데이터가 기존 시스템을 떠나지 않도록 한다.
  • 베타 사용자 사례로는 Manifold Bio의 조직 표적 후보 선정, Allen Institute의 장문 리뷰 작성 파이프라인, UCSF Brain Tumor Center의 교모세포종 분자역학 분석 가속이 제시됐다.

🧩 주요 포인트

  1. Claude Science는 과학 연구에서 흩어져 있는 데이터베이스, 파일 형식, 분석 도구, 클러스터 작업을 하나의 연구 환경으로 묶는 앱으로 소개됐다.
  2. 이 앱은 60개 이상의 과학용 스킬과 커넥터, 일반 조정 에이전트, 사용자 정의 전문 에이전트, 인용과 계산을 점검하는 리뷰어 에이전트를 포함한다.
  3. 생성된 그림·원고·분석 결과에는 코드, 실행 환경, 설명, 메시지 이력이 함께 남아 나중에도 검증과 재현이 가능하도록 설계됐다.
  4. Claude Science는 연구실의 노트북, Linux 장비, SSH 기반 HPC 로그인 노드, Modal 계정 등 기존 인프라에서 실행되며, 큰 데이터나 민감한 데이터가 기존 시스템을 떠나지 않도록 한다.
  5. 베타 사용자 사례로는 Manifold Bio의 조직 표적 후보 선정, Allen Institute의 장문 리뷰 작성 파이프라인, UCSF Brain Tumor Center의 교모세포종 분자역학 분석 가속이 제시됐다.

🧠 상세 정리

1. Claude Science 공개와 목표

Anthropic은 2026년 6월 30일 과학자를 위한 AI 워크벤치인 Claude Science를 베타로 공개했다고 밝혔다. 이 제품은 지난해 가을 생명과학 분야에서 시작한 Anthropic의 노력, 즉 모델 능력 개선, 과학 생태계와의 연결, 파트너십 확대를 더 큰 형태로 확장한 결과로 설명된다. 핵심 목표는 과학적 발견과 의료 개입 개발의 속도를 높일 수 있는 AI 환경을 제공하는 것이다. 단순한 챗봇이나 코드 보조 도구가 아니라, 연구자가 실제로 사용하는 도구와 패키지를 통합하고 계산 자원 접근, 분석 산출물 생성, 검증 가능한 기록을 함께 제공하는 연구용 앱으로 제시된다.

2. 분산된 연구 도구를 하나의 환경으로 통합

원문은 과학 연구가 여러 데이터베이스, 제각각인 스키마, 특수한 파일 형식, 별도 뷰어와 데이터 파이프라인 때문에 번거롭다고 설명한다. 연구자는 PubMed, Jupyter, R, 클러스터 터미널 등 여러 도구 사이를 계속 이동해야 하며, 이 과정은 실제 과학적 판단보다 작업 환경 관리에 많은 시간을 쓰게 만든다. Claude Science는 이런 단절된 도구들을 하나의 연구 환경으로 모아 문헌 분석, 다단계 연구 실행, 산출물 작성, 그림과 원고의 반복 수정까지 지원한다. 또한 로컬 macOS나 Linux, SSH 원격 머신, HPC 로그인 노드처럼 연구자가 이미 일하는 장소에서 사용할 수 있다는 점을 강조한다.

3. 에이전트 구조와 과학 도메인별 지원

Claude Science의 사용자는 범용 조정 에이전트와 상호작용하며, 이 에이전트는 유전체학, 단일세포 분석, 단백질체학, 구조생물학, 화학정보학 등을 위해 미리 구성된 60개 이상의 스킬과 커넥터에 접근한다. 이 에이전트는 다른 에이전트를 생성하거나, 사용자가 만든 전문 에이전트와 함께 작업할 수 있다. 별도의 리뷰어 에이전트는 인용과 계산을 확인하고 오류를 표시하거나 수정하는 역할을 맡는다. 원문은 Claude Science가 Claude Pro, Max, Team, Enterprise 사용자에게 베타로 제공되며, 사용자 피드백을 통해 플랫폼을 계속 개선할 계획이라고 밝힌다.

4. 재현 가능한 과학 산출물과 시각 자료

Claude Science는 과학 연구가 본질적으로 시각적이라는 점을 전제로, 코드와 함께 그림과 원고를 생성하고 다양한 과학 산출물을 네이티브로 렌더링한다고 설명된다. 예로는 3D 단백질 구조, 유전체 브라우저 트랙, 화학 구조 등이 제시된다. 연구자는 생성된 그림이나 원고의 세부 사항에 대해 에이전트와 대화하고, 인라인으로 주석을 달아 출판 가능한 수준으로 수정할 수 있다. 그림이 생성될 때는 그 그림을 만든 정확한 코드와 실행 환경, 생성 과정에 대한 쉬운 설명, 전체 메시지 이력이 함께 포함되므로 몇 달 뒤에도 입력과 절차를 이해하고 재현할 수 있다.

5. 자연어 수정과 코드 기반 편집

Claude Science는 사용자가 자연어로 그림 수정을 요청하면 에이전트가 자신의 코드를 직접 수정하는 방식으로 작업한다. 원문에는 격자선을 제거하거나 축을 로그 스케일로 바꾸는 예가 나온다. 중요한 점은 시각적 결과만 바꾸는 것이 아니라, 그 결과를 만든 코드와 환경이 함께 관리된다는 점이다. 이는 연구자가 최종 이미지만 받아보는 것이 아니라 산출물의 생성 경로를 추적하고 검증할 수 있게 해 준다. 따라서 Claude Science의 산출물은 보기 좋은 결과물에 그치지 않고, 원문이 강조하듯 검토 가능하고 재현 가능한 연구 기록의 일부로 다뤄진다.

6. 계산 자원 관리와 데이터 위치

큰 분석 작업은 단백질 접힘이나 대규모 유전체 파이프라인처럼 연구자가 클러스터 작업 설정, 제출, 대기, 성공 여부 확인, 결과 회수에 신경 써야 하는 경우가 많다. Claude Science는 이 과정을 대신 처리하도록 설계되어 있으며, 계획을 작성하고 새로운 자원에 접근하기 전 사용자에게 확인을 요청한다. 사용자는 연구실이 이미 쓰는 HPC 클러스터나 Modal 계정에 작업을 제출하기 전 결정을 검토하거나 철회할 수 있다. 또한 Claude Science는 연구실의 노트북, Linux 장비, HPC 로그인 노드에서 실행되므로 크거나 민감한 데이터가 기존 시스템을 떠날 필요가 없고, 각 분석 단계에 필요한 맥락만 Claude로 전송된다고 설명된다.

7. 세션 맥락, 리뷰어 점검, 분기 실행

Claude Science의 에이전트는 실행 중인 세션 안에서 작업하며, 이 세션은 메모리에 맥락을 유지한다. 원문은 이 구조 덕분에 대규모 데이터셋도 한 번만 로드하면 된다고 설명한다. 파이프라인이 실행되는 동안 리뷰어 에이전트는 결과를 점검하며, 잘못된 인용, 추적 불가능한 숫자, 코드와 맞지 않는 그림을 표시하고 스스로 수정해 나간다. 사용자는 어느 시점에서든 세션을 포크해 원래 작업 흐름을 잃지 않고 두 접근법을 비교할 수 있다. 이 부분은 Claude Science가 단일 응답을 생성하는 도구가 아니라, 긴 연구 흐름을 유지하고 검증하는 작업 공간임을 보여준다.

8. 생명과학 데이터베이스와 기존 연구 자산 연결

원문은 과학 지식이 수백 개의 전문 출처에 흩어져 있으며, 생물학에서는 UniProt, PDB, Ensembl, Reactome, ClinVar, ChEMBL, GEO 같은 자원과 논문, 프리프린트 서버, 도메인별 오픈 모델이 함께 쓰인다고 설명한다. Claude Science는 사용자가 자연어로 질문하면 전문 에이전트들이 이런 출처를 질의하고 종합해 주도록 설계됐다. 또한 NVIDIA의 BioNeMo Agent Toolkit 스킬을 사용해 BioNeMo의 생명과학 모델과 라이브러리, 예를 들어 Evo 2, Boltz-2, OpenFold3에 연결한다고 밝힌다. 연구자가 이미 신뢰하는 모델, 데이터셋, 파이프라인도 커넥터로 연결하거나 재사용 가능한 스킬로 저장할 수 있다.

9. 베타 사용 사례와 연구 현장 적용

원문은 지난 몇 달 동안 베타 사용자들이 단일세포 RNA 시퀀싱 분석, CRISPR 스크린 설계, 단백질 구조 예측, 화학정보학 같은 작업에 Claude Science를 사용했다고 소개한다. Manifold Bio는 조직이나 세포 유형을 표적으로 하는 의약품 설계에서 후보 표적을 선정하는 데 Claude Science를 사용했으며, 표면 발현, 이동, 안전성을 평가해 자체 기준에 따라 후보를 순위화했다고 설명된다. Allen Institute의 Jérôme Lecoq은 약 20개의 맞춤 스킬로 구성된 다중 에이전트 리뷰 작성 템플릿을 만들었고, 수천 편의 논문에서 주장과 정량적 결과를 추출해 증거 데이터베이스에 저장하도록 했다. UCSF Brain Tumor Center의 Stephen Francis는 교모세포종 분자역학 연구에서 분석을 약 10분의 1 시간으로 단축했고, 독립 검증을 통해 빠르면서도 견고한 분석이 가능함을 확인했다고 밝혔다.

10. 베타 이용 조건과 지원 프로그램

Claude Science 앱은 macOS와 Linux에서 Claude Pro, Max, Team, Enterprise 플랜 사용자에게 베타로 제공된다. Team과 Enterprise 사용자는 관리자가 Claude Science를 활성화해야 한다. Anthropic은 학술기관과 비영리 연구기관의 현역 과학 연구실을 위한 할인 좌석이 포함된 Team 플랜도 소개했다. 또한 최대 50개의 Claude Science AI for Science 프로젝트를 지원하며, 프로젝트당 최대 3만 달러의 크레딧을 제공하고, Modal도 일부 프로젝트에 최대 2천 달러의 컴퓨팅을 제공한다고 밝혔다. 신청은 2026년 7월 15일까지 열려 있고, 선정 알림은 7월 31일까지 발송되며, 프로젝트 기간은 2026년 9월 1일부터 12월 1일까지로 안내됐다.

🧾 핵심 주장 / 시사점

  • Claude Science의 핵심 차별점은 연구 산출물 자체보다 산출물을 만든 코드, 환경, 메시지 이력, 검토 과정을 함께 남겨 재현성과 감사 가능성을 제품의 중심 기능으로 삼는 데 있다.
  • 원문에서 반복적으로 강조되는 문제는 AI 모델 성능만이 아니라 연구자가 실제로 겪는 도구 분절, 계산 자원 관리, 데이터 이동 부담이며, Claude Science는 이를 워크벤치 형태로 묶어 해결하려 한다.
  • 제시된 사례들은 Claude Science가 단순 문헌 요약이나 코드 생성보다 긴 연구 파이프라인, 다중 에이전트 검토, 기존 내부 데이터와 검증된 도구 연결에서 활용되도록 설계됐음을 보여준다.

✅ 액션 아이템

  • 과학적 과업을 문헌 분석·계산·시각화·원고 작성·재현 검증까지 한 흐름으로 묶어 Claude Science 적합성을 점검한다.
  • 60개 이상 과학 스킬·커넥터, 조정 에이전트, 전문 에이전트, 리뷰어 에이전트의 역할 경계를 기존 연구 도구와 분리해 범위를 정의한다.
  • 베타 사례의 Manifold Bio, Allen Institute, UCSF Brain Tumor Center 적용 맥락을 추려 도입 우선순위를 정한다.

❓ 열린 질문

  • 연구실 노트북, Linux 장비, SSH 기반 HPC 로그인 노드, Modal 계정 환경에서 민감 데이터가 이동 없이 유지될 수 있는 운영 구간은 어디인가?
  • 생성물에 남는 코드·실행환경·설명·메시지 이력이 재현성 검증 시 어떤 오차나 누락을 가장 먼저 가려낼 수 있는가?
  • 커스텀 전문 에이전트와 리뷰어 에이전트 조합이 인용 및 계산 점검의 신뢰도를 일정하게 유지하려면 어떤 기준이 필요한가?

관련 문서

공통 태그와 주제 흐름을 기준으로 같이 보면 좋은 문서를 이어서 제안합니다.