Curing All Disease by next century is too conservative" - Mark Zuckerberg
Quick Summary
“Curing All Disease by next century is too conservative" Mark Zuckerberg를 중심으로, Biohub의 핵심 목표는 특정 조직이 모든 질병을 직접 치료하는 것이 아니라, 과학 커뮤니티 전체가 더 빠르게 발견하고 개입할를 핵심 판단 포인트로 압축 정리한다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
“Curing All Disease by next century is too conservative" - Mark Zuckerberg를 중심으로, Biohub의 핵심 목표는 특정 조직이 모든 질병을 직접 치료하는 것이 아니라, 과학 커뮤니티 전체가 더 빠르게 발견하고 개입할를 핵심 판단 포인트로 압축 정리한다.
📌 핵심 요점
- Biohub의 핵심 목표는 특정 조직이 모든 질병을 직접 치료하는 것이 아니라, 과학 커뮤니티 전체가 더 빠르게 발견하고 개입할 수 있는 공통 도구를 만드는 데 있다.
- 생물학 AI의 병목은 컴퓨트보다 데이터에 가깝고, 인터넷 규모의 공개 데이터가 부족하기 때문에 이미징, 세포공학, 단일세포 분석, 염증 측정 같은 실제 실험 데이터 생성 능력이 중요하다.
- 단백질 구조 예측에서 시작된 모델링은 단백질, 세포, 면역계, 신체 시스템으로 확장되어야 하며, 각 층위를 연결하는 계층형 생물학 월드 모델이 장기 목표로 제시된다.
- 오픈소스와 비영리 구조는 모델과 도구를 더 넓은 연구자 집단에 배포해 흔한 질병뿐 아니라 희귀질환, 개인별 유전 변이, 장기 꼬리 연구 주제까지 다룰 수 있게 하는 전략으로 설명된다.
- ESM Fold와 단백질·항체 설계 사례는 디지털 탐색이 실험 비용과 반복 속도를 바꿀 수 있음을 보여주지만, 실제 치료 적용까지는 세포 검증, 독성 예측, 임상 설계, 규제와 환자 모집이라는 간극이 남아 있다.
🧩 배경과 문제 정의
- 생물학 연구의 주요 병목은 지식·도구·데이터가 개별 연구실과 기관에 분산돼 있고, 이를 함께 활용할 공유 인프라가 부족해 과학 전반의 발견 속도가 늦어진다는 데 있다.
- Biohub의 핵심 문제의식은 한 조직이 모든 질병을 직접 치료하려는 것이 아니라, 과학 커뮤니티 전체가 더 빠르게 발견하고 개입할 수 있도록 돕는 도구를 만드는 데 있다.
- 가상 생물학 이니셔티브는 AI 모델만으로는 충분하지 않으며, 새로운 생물학 데이터를 생산할 수 있는 습식 실험·이미징·측정 역량이 함께 필요하다는 전제에서 출발한다.
- 단백질·세포·면역계 같은 생물학 시스템은 각기 다른 층위에 있지만 서로 연결돼 있어, 이를 계층적으로 모델링하는 접근이 질병 이해와 개입 가능성을 넓힌다.
🕒 시간순 섹션별 상세정리
1. 과학 전반을 가속하는 개방형 도구
- Biohub의 목표는 과학 커뮤니티 전체에 도구를 제공해 개인의 유전 정보, 질병 위험, 생물학적 메커니즘을 더 잘 이해하고, 환자별 개입으로 연결하게 하는 것이다. [00:17]
- 오픈소스 프로젝트는 더 많은 과학자에게 더 빠르게 확산될 수 있으며, 핵심은 데이터를 많이 만드는 데 그치지 않고 새로운 과학적 접근 자체를 발명하는 데 있다. [00:32]
2. Biohub의 출발점과 과학계의 병목
- Biohub는 CZI의 핵심 자선 활동으로 자리 잡았고, 5억 달러 규모의 가상 생물학 이니셔티브는 장기 정체성의 중심이 됐다. [01:26]
- 10년 전 출발점은 세기 말까지 모든 질병을 치료·예방·관리할 수 있는 조직을 만드는 것이었으며, 당시 과학자들은 이를 비현실적인 목표로 받아들였다. [01:52]
3. 장기 도구 개발과 가상 생물학 인프라
- 초기 Biohub 모델은 여러 대학의 엔지니어와 과학자를 모아 장기 도구 개발에 집중하는 구조였고, 이 방식이 성과를 내면서 과학 부문 투자가 확대됐다. [03:40]
- 샌프란시스코 Biohub는 뉴욕과 시카고 등으로 확장됐으며, 공통 축은 단백질에서 세포와 전체 생물학 시스템으로 이어지는 가상 생물학 모델링이었다. [04:12]
4. 단일세포 데이터에서 모델 기반 생물학으로
- 첫 RFA는 단일세포 시퀀싱에 초점을 맞췄고, 개별 세포에서 전사되는 RNA와 DNA 발현 방식을 이해하기 위한 방법 공유가 초기 과제였다. [06:21]
- Human Cell Atlas 지원은 대규모 단일세포 전사체 데이터베이스로 이어졌고, 데이터 주석이 어려워지자 과학자들이 활용할 수 있는 CELLxGENE 도구가 만들어졌다. [06:51]
5. 프런티어 AI와 프런티어 생물학의 결합
- EvolutionaryScale에서 쌓은 팀과 모델 경험은 Biohub의 방향과 맞물렸고, 핵심 전환점은 프런티어 AI와 프런티어 생물학을 하나의 구조로 통합하는 데 있었다. [08:43]
- AI는 다음 토큰 예측과 데이터 학습을 통해 월드 모델을 만들 수 있으며, 생물학 데이터에서도 새로운 과학 시대를 여는 학습 시스템으로 작동할 수 있다. [08:57]
6. 단백질에서 세포·시스템으로 쌓는 계층형 모델
- AlphaFold 같은 초기 돌파구는 단백질 접힘을 대규모로 다룰 수 있음을 보였고, 이후 모델링 과제는 분자·단백질·세포·더 큰 생물학 시스템으로 확장된다. [09:47]
- 세포 행동 모델링은 단백질 접힘과 데이터·모델링 방식이 다르며, 미시적 구성 요소에서 거시적 시스템으로 확장할 때 층위별 차이를 다뤄야 한다. [10:15]
7. 생물학 층위 연결과 통합 데이터의 필요성
- 세포 내부 위치, 제브라피시 발생 과정, 세포 간 소통 센서 같은 데이터는 서로 다른 생물학 층위를 잇는 재료가 되며, 이런 연결점이 모델링의 기반을 이룬다. [12:02]
- 기존 실험 환경에서는 발생생물학자와 분자생물학자가 각자 다른 실험을 수행했고, 여러 생물학 층위를 통합하는 구조는 부족했다. [13:00]
8. 정보 이론적 생물학과 디지털 실험 모델
- 생물학에는 복잡성과 위계가 있으며, 각 층위가 더 낮은 층위로 구성되기 때문에 모든 수준에서 적절한 모델링 기반이 필요하다. [13:23]
- 실험실에서 던질 수 있는 질문에 디지털 시스템이 답하려면, 여러 생물학 층위의 데이터와 그 연결점을 충분한 규모로 수집해야 한다. [13:40]
9. 모델 내부 표현에서 새로운 생물학 지식 추출
- 인간 행동 예측형 AI와 달리 생물학에는 아직 이해하지 못한 영역이 많아, 모델이 내부적으로 포착한 구조에서 새로운 지식을 추출할 가능성이 중요해진다. [14:22]
- 기계적 해석 가능성은 대형 언어모델의 표현 공간을 이해하는 도구에서 출발했지만, 같은 질문을 생물학 모델에도 적용할 수 있다. [15:03]
10. 오픈소스 비영리 모델과 데이터 병목
- 모델의 예측 원리를 해석하면 블랙박스 안에서 모델이 포착한 생물학적 표현을 이해할 수 있고, 이는 새로운 치료 작용 기전이나 신체 시스템 이해로 이어질 수 있다. [16:36]
- 핵심 목표는 도구를 과학자들에게 더 빠르고 넓게 배포하는 것이며, 오픈소스 방식은 특정 회사의 수익화보다 과학계 전체의 활용 속도를 높이는 데 유리하다. [17:24]
11. 장기 자본, 중립성, 희귀질환까지 포함하는 분산형 연구
- 복잡한 과학 도구 개발에는 10~15년의 시간 지평과 큰 자본이 필요하며, 수익화 부담이 없는 구조는 모델 공개와 과학계 확산을 더 단순하게 만든다. [19:04]
- 이 접근의 목표는 직접 질병을 치료하는 것이 아니라 과학 전반의 진전 속도를 높이는 것이며, 오픈소스 모델 배포는 그 목적에 맞는 전략이다. [19:36]
12. 질병 우선순위보다 개인별 기전 이해가 핵심
- 단기적으로 어떤 질병 영역이 먼저 영향을 받을지보다, 생물학의 작동 원리를 이해하고 개인 단위의 유전적 위험을 파악하는 방향이 더 중요하다. [21:42]
- 개인의 유전 변이, 단백질, 질병 과정 사이의 기계적 연결을 이해하면, 그 사람에게 맞는 단백질이나 약물을 설계해 개입할 수 있다. [22:08]
13. 질병별 치료보다 시스템 수준 도구가 중요해진다
- 개인별 맞춤 치료는 대형 모델이 범용 도구로 작동할 때 가능해지며, 질병의 원인 이해와 실제 치료 가능성을 함께 높이는 것이 중요하다. [24:02]
- 모든 질병을 예방·치료한다는 목표는 100년보다 앞당겨질 수 있지만, 생물학은 동적 시스템이어서 기존 문제를 해결해도 새로운 과제는 계속 생긴다. [24:37]
14. 기초 연구의 속도와 임상 적용 사이에 간극이 남는다
- 이 도구 세트의 역할은 모든 질병을 직접 치료하는 것이 아니라, 바이오텍과 학계가 구체적 치료로 이어갈 수 있는 기반을 제공해 개발 속도를 높이는 데 있다. [26:08]
- 의사와 환자에게 체감될 변화는 연구 속도의 증가이며, 최근 출시된 도구와 팀의 작업은 과학 연구를 더 빠르게 움직이게 한다. [26:52]
15. ESM Fold는 단백질 생물학을 예측하는 공개 세계 모델로 작동한다
- 새 ESM Fold는 단백질 생물학을 위한 공개 과학 발견 시스템이며, 수십억 개 단백질 서열을 학습한 언어 모델 기반 세계 모델이다. [28:13]
- 모델은 단백질 생물학의 표현을 학습한 뒤 원자 수준의 단백질 구조를 예측하며, 빠른 속도와 높은 정확도로 구조 예측의 효율을 높인다. [28:31]
16. 디지털 단백질·항체 설계가 실험 비용을 줄인다
- 단백질 세계 모델 안에서 탐색이 가능해지면 새로운 단백질 설계가 가능해지고, 구조 예측과 단백질 상호작용 분석에서 높은 성능이 중요해진다. [29:17]
- 항체 결합은 치료 설계의 핵심이며, 모델이 특정 항체 전용으로 만들어지지 않았더라도 단백질 이해 능력을 바탕으로 단일사슬 항체 설계 역량을 보인다. [29:40]
17. 모델 설계는 세포·극저온 전자현미경 검증을 거쳐야 한다
- 항체 스크리닝 데이터는 세포에서 PDL을 확인하고 극저온 전자현미경 관찰로 이어지며, 모델 결과와 실제 분자 작동 여부를 함께 검증한다. [31:17]
- 설계된 분자는 실험실에서 생물물리학적·기능적으로 특성화되어야 하며, cryo-EM 현미경은 결합 계면을 원자 수준에서 확인하게 한다. [31:34]
18. 세포 모델과 전달 전략은 개인 맞춤 의학의 새 경로를 연다
- 포괄적인 세포 작동 모델은 오프타깃 효과 예측에 쓰일 수 있고, 예컨대 신장세포가 예상 밖 수용체를 발현하면 인간 시험에서 신장 독성이 드러날 위험이 있다. [32:56]
- 단일세포 아틀라스는 다양한 세포 유형과 수용체 분포를 확인해, 특정 표적 치료가 어떤 세포에 영향을 줄지 인간 시험 전에 예측하게 한다. [33:25]
19. 희귀질환 개발의 경제성과 환자 주도 실험 구조
- 신장 세포 같은 특정 환경에서 약물 영향과 독성 예측이 강해지면, 연구자와 기업은 더 많은 프로그램을 시도할 유인이 생기고 실패 비용 부담도 줄어든다. [36:00]
- 희귀질환은 환자 수가 적어 기업의 경제성이 낮지만, 환자 그룹이 직접 모이고 실험적 약물을 받아들일 준비가 되면 장기 꼬리 질환도 연구 대상이 된다. [36:21]
20. 환자 선택권과 개방형 생태계가 연구 속도를 바꾸는 방식
- 새로운 치료 후보가 많이 만들어져도 일반 대중에게는 기존 수준의 검증이 필요하지만, 더 프런티어에 서고 싶은 환자에게는 자발적 참여 통로가 중요하다. [38:14]
- 임상시험에 참여하려는 사람들이 직접 옵트인할 수 있으면 모집 구조가 바뀌고, 생물학 연구 전반의 반복 속도도 빨라진다. [38:33]
21. 오픈소스 과학의 장점과 바이오안전성의 균형
- 소셜미디어가 개인에게 발언권을 준 것처럼, 개인용 AI와 오픈소스는 기술을 더 많은 사람의 손에 넣는 방식이며 과학에서도 같은 논리가 작동한다. [40:13]
- 생물학 분야의 오픈소스는 더 많은 연구자가 도구를 활용하게 만들지만, 바이오안전성과 같은 리스크를 함께 다뤄야 하므로 개방성과 안전 장치의 균형이 필요하다. [40:32]
22. Biohub가 AI 인재를 끌어들이는 이유
- AI 연구자 시장은 경쟁이 치열하지만, 뛰어난 연구자들은 스스로 풀고 싶은 문제를 선택할 수 있다. Biohub는 프런티어 AI와 프런티어 생물학을 함께 다루는 드문 환경을 제공한다. [41:25]
- 주요 AI 연구소가 언어모델 같은 범용 문제에 집중한다면, Biohub는 질병 예방·치료라는 생물학적 목표와 AI 연구를 한 조직 안에서 직접 결합한다. [41:44]
23. 작은 강팀과 단백질 모델 이후의 약물 개발 병목
- AI의 중요한 진전이 반드시 수백 명, 수천 명 규모의 조직에서만 나오는 것은 아니다. 강한 12명 또는 수십 명 규모의 팀도 의미 있는 돌파구를 만들 수 있다. [43:34]
- 사람마다 끌리는 미션은 다르지만, 질병 치료처럼 전 세계적으로 중요한 문제는 작은 최정예 팀을 모을 만큼 충분히 강한 동기를 제공한다. [44:08]
24. 에이전트 설계와 가상 세포 모델로 가는 연구 agenda
- 모델 공개 이후 사람들은 이를 다양한 시스템에 통합했고, 특히 에이전트 시스템과 연결해 자동 설계 과정을 만드는 실험이 빠르게 확산됐다. [46:13]
- 에이전트형 AI와 생물학 월드모델이 결합하면, 생물학적 현상을 추론하고 전체 설계 프로세스를 자동화하는 방향으로 연구의 초점이 이동한다. [46:24]
25. 일반화 예측을 위한 데이터와 제약 관리
- 생물학 모델은 훈련 데이터에 없던 새로운 개입과 맥락에도 답을 내야 한다. 현재 분야의 핵심 공백은 이런 예측이 실제 상황으로 충분히 일반화되지 못한다는 점이다. [48:01]
- 이 일반화 격차를 줄이려면 방대한 데이터 생성이 필요하며, 모델의 활용 범위는 결국 데이터의 규모와 품질에 크게 좌우된다. [48:23]
26. 5년 목표: 계층적 생물학 월드 모델과 독자적 기여
- 현재 모델 발전 속도는 예측하기 어렵다. 에이전트형 흐름과 모델이 다른 모델 개발을 돕는 초기 신호가 나타나면서, 성장 곡선이 더 가팔라질 가능성도 커지고 있다. [50:06]
- 핵심 목표는 생물학을 설명하는 계층적 월드 모델을 구축하는 것이다. 동시에 이 목표를 실현하려면 세계 최고 수준의 연구 품질을 확보하는 것이 필수 조건이다. [50:37]
27. Biohub의 전략 전환과 AI 중심 리더십
- 지난 1년의 가장 큰 변화는 Biohub가 자선 활동의 중심축으로 공식화됐다는 점이다. 이는 조직의 초점과 자원 배분을 크게 바꾼 전략적 전환점이다. [52:05]
- Alex와 팀의 합류는 단순한 리더십 교체가 아니다. 오랫동안 함께 일해 온 고역량 집단이 안정적인 환경에서 복리 효과를 만들 수 있다는 점에서 중요하다. [52:21]
28. 지수 성장 곡선, 생물학 폐루프, 통합된 팀 실행
- 지수 성장 곡선은 너무 빠르게 올라가기 때문에 곧 멈출 것처럼 보이지만, 그 본질은 정지가 아니라 계속되는 가속에 있다. [53:53]
- AI 산업은 여전히 이 성장 곡선 위에 있으며, 그 흐름은 여러 분야에 큰 함의를 만든다. 이것이 대규모 투자를 정당화하는 핵심 근거로 드러난다. [54:24]
🧾 결론
- 이 대화의 중심 메시지는 “AI가 생물학을 대체한다”가 아니라, AI 모델과 습식 실험, 데이터 생성, 오픈소스 배포가 하나의 폐루프로 묶일 때 과학 연구 속도가 달라질 수 있다는 것이다.
- 저커버그가 말하는 “모든 질병 치료”는 단일 치료제 개발보다 더 넓은 개념이다. 개인의 유전 변이, 단백질 기능, 세포 행동, 질병 기전을 이해해 각 환자에게 맞는 개입 지점을 찾는 체계를 뜻한다.
- Biohub의 차별점은 장기 자본, 비영리 중립성, 공개 도구 배포, 프런티어 AI 인재, 실제 생물학 실험 인프라를 한 조직적 방향으로 묶으려는 데 있다.
- 다만 transcript 기준으로도 임상 적용은 아직 불확실한 영역이다. 벤치 연구에서 환자 치료까지 이어지는 과정에는 안전성, 독성, 전달 방식, 임상시험 설계, 규제라는 병목이 남아 있다.
- 따라서 “세기 말까지 모든 질병 치료는 보수적”이라는 표현은 확정된 예측이라기보다, 생물학 도구와 AI 모델의 발전 속도에 대한 강한 낙관론으로 보는 것이 적절하다.
📈 투자·시사 포인트
- 생명과학 투자 관점에서는 단일 신약 후보보다 데이터 생성 인프라, 단일세포 아틀라스, 세포공학, 이미징, cryo-EM, 생물학 모델 검증 플랫폼처럼 연구 반복 속도를 높이는 기반 기술의 중요성이 커질 수 있다.
- AI 바이오의 핵심 경쟁력은 모델 크기만이 아니라 고품질 생물학 데이터와 실험 폐루프에 있다. transcript에서는 프런티어 AI와 프런티어 생물학을 동시에 갖춘 조직이 차별적 위치를 가질 수 있다고 설명한다.
- 희귀질환과 개인 맞춤 의학은 경제성이 낮아 기존 산업 구조에서 소외되기 쉬웠지만, 모델 기반 설계와 환자 주도 데이터·임상 구조가 결합되면 장기 꼬리 질환 연구의 가능성이 넓어질 수 있다.
- 검증 필요: 디지털 단백질·항체 설계가 실제 임상 비용과 기간을 얼마나 줄일 수 있는지는 아직 단정할 수 없다. 영상에서는 가능성과 초기 사례가 제시되지만, 임상 실패율과 규제 병목은 별도의 검증 영역으로 남아 있다.
- 검증 필요: “세기 말보다 빠른 모든 질병 예방·치료·관리”라는 전망은 Biohub의 장기 비전이자 낙관적 시나리오이며, 실제 달성 여부는 모델 일반화, 데이터 규모, 안전한 환자 적용, 치료 전달 기술의 진전에 달려 있다.
⚠️ 불확실하거나 확인이 필요한 부분
- “세기 말까지 모든 질병을 치료·예방·관리한다는 목표가 이제는 보수적으로 보인다”는 발언은 영상 속 전망에 해당하며, 실제 달성 가능성이나 시점은 검증된 결론이 아니라 장기적 가설로 다뤄야 한다.
- Biohub의 가상 생물학 이니셔티브에 5억 달러가 투입됐다는 내용은 영상에서 언급된 수치로 보이며, 최종 노트에 확정 수치로 쓰려면 CZI/Biohub 공식 발표나 보도자료 확인이 필요하다.
- ESM Fold가 11억 개 이상 단백질 구조를 예측했다는 설명은 영상 내 핵심 사례지만, 모델 버전, 공개 범위, 예측 데이터셋의 정확한 명칭은 별도 확인이 필요하다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- Biohub, CZI, Virtual Biology 관련 공식 자료를 확인해 5억 달러 투자 규모, 조직 구조, 목표 표현을 정확히 검증한다.
- ESM Fold 또는 관련 단백질 모델의 공식 릴리스, 논문, 데이터 페이지를 확인해 “11억 개 이상 단백질 구조 예측”의 정확한 출처와 맥락을 보강한다.
- Baby KJ 사례, CHOP, CRISPR 치료, 간세포 전달 관련 원자료를 찾아 영상 속 설명과 실제 임상·보도 내용이 일치하는지 확인한다.
- “모든 질병 치료”라는 표현은 과장으로 읽힐 수 있으므로, 노트에서는 “치료·예방·관리 역량을 크게 높이려는 장기 목표”처럼 조건부·전망형 문장으로 정리한다.
❓ 열린 질문
- “모든 질병을 치료·예방·관리한다”는 목표는 실제로 어떤 기준으로 측정할 수 있는가?
- Biohub가 만드는 오픈소스 도구는 학계, 바이오텍, 환자 단체에 얼마나 빠르게 확산될 수 있는가?
- 생물학 데이터가 부족한 상황에서 가상 세포나 계층적 월드 모델은 어느 수준까지 일반화된 예측을 할 수 있는가?