EP 100. Claude Mythos, Fable 5, 그리고 다음 국면은?
Quick Summary
Claude Mythos와 Fable 5 논쟁은 모델 성능 경쟁이 post training 인프라, 도메인 데이터셋, 접근 통제, sovereign AI로 넘어가는 다음 국면을 보여준다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
Claude Mythos와 Fable 5 논쟁은 모델 성능 경쟁이 post-training 인프라, 도메인 데이터셋, 접근 통제, sovereign AI로 넘어가는 다음 국면을 보여준다.
📌 핵심 요점
- AI Frontier 100회 시점에서 지난 3년의 변화는 ChatGPT 초기 충격, GPT-4, reasoning model, Fable 공개로 이어지며 “불가능”의 기준이 반복적으로 무너진 과정으로 정리된다.
- Anthropic의 Mythos/Fable 공개는 단순한 신모델 출시가 아니라, 비미국 국적자 접근 제한과 고위험 도메인 차단 사례까지 겹치며 모델 성능·안전·정책·접근권 문제가 동시에 드러난 사건으로 다뤄진다.
- 프런티어 경쟁의 중심은 단순한 pretraining scale만이 아니라 post-training, post-training 인프라, inference와 training loop 운영, 그리고 도메인별 고품질 데이터셋 생산 능력으로 이동하고 있다.
- 바이오·신약개발·longevity 영역에서는 기존 산업 내부자가 문제의 난이도를 높게 보는 반면, AI 진영은 생물학을 DNA·protein·cell·organ 등 여러 modal의 통합 학습 문제로 보고 GPT-2 moment에 가까운 초기 기회로 해석한다.
- Fable 5의 체감 성능은 사용 영역에 따라 갈리지만, 사이버 보안·생물학 같은 최전선 연구 영역에서는 이전에 어려웠던 작업이 가능해지는 경계 효과가 더 크게 관찰되며, 비용과 성능의 trade-off가 핵심 판단 기준이 된다.
🧩 배경과 문제 정의
- AI Frontier가 100회를 맞은 지금, 지난 3년간 ChatGPT 초기 국면에서 GPT-4, reasoning model, Fable 공개로 이어지며 AI 프런티어의 변화 속도는 크게 달라졌다.
- Anthropic의 Mythos/Fable 공개, 미국 정부 규제, 비미국 국적자의 접근 제한이 맞물리면서 모델 성능뿐 아니라 통제, 접근권, 정책 리스크가 핵심 쟁점으로 부상했다.
- 샌프란시스코의 스타트업, 데이터셋 기업, 에이전트 구축 기업, 프런티어 랩 관계자들과의 접점 속에서 다음 경쟁축은 단순한 모델 크기가 아니라 post-training 인프라와 도메인별 데이터셋 공급으로 좁혀지고 있다.
- LLM에서 불가능하다고 여겨졌던 과제가 반복적으로 깨진 경험은 바이오, 신약개발, longevity 같은 다른 도메인에도 투영되며, 기존 산업 내부자와 AI 출신 창업자 사이의 기대치 차이를 키우고 있다.
🕒 시간순 섹션별 상세정리
1. 100회와 지난 3년의 변화 속도
- 2026년 6월 14일 녹화 기준 AI Frontier는 100회에 도달했고, 처음에는 학습 목적의 대화로 시작했지만 약 3년 사이 프런티어 소식을 빠르게 따라가는 채널로 확장됐다 [00:13]
- ChatGPT 출시 직후와 GPT-4 공개 초기를 지나, GPT-4를 AGI의 불꽃으로 해석하던 시기부터 유니콘 그림 같은 과제는 더 복잡한 시각 생성 과제로 이어졌고, 불가능하다고 여긴 기준도 계속 무너졌다 [00:57]
2. Mythos/Fable 공개와 접근 제한 논란
- Anthropic은 4월 Mythos라는 모델을 제한적으로 공개했고, 약 두 달 뒤 Fable이라는 이름으로 공식 공개되면서 커뮤니티에서 모델 변화와 파급효과 검증이 빠르게 확산됐다 [01:53]
- Fable 공개 직후 미국 정부 규제로 비미국 국적자의 접근을 완전히 막는 정책이 나오면서, 성능 논쟁에 정책·국적·접근권 문제가 함께 얹혀 논란이 커졌다 [02:18]
3. 스케일 경쟁의 중심축과 post-training 인프라
- AI 경쟁에서 가능성 자체를 부정하는 분위기는 약해졌고, 핵심 쟁점은 scale이 더 커질 때 어떤 변화가 생기며 어떤 인프라가 이를 뒷받침할 수 있는지로 이동했다 [03:38]
- 모델 규모가 커질수록 더 많은 데이터셋과 고품질 pretraining 데이터가 필요해지고, 작은 모델로 pretraining 데이터 품질을 높여 성능을 끌어올리려는 연구 흐름도 관찰된다 [04:11]
4. 도메인별 데이터셋 생산과 프런티어 랩의 반복 경쟁
- 금융만 보더라도 investment banking, 세무 처리, 개인 금융 업무처럼 세부 task가 나뉘며, 각 task에 맞는 데이터셋을 잘게 쪼개 만드는 방식이 확산되고 있다 [06:20]
- 모델 scale이 계속 커질수록 도메인과 직업 전문가의 case-by-case 데이터를 만들어 학습시키는 순환이 반복되고, 이 과정이 benchmark 상승으로 계속된다 [06:40]
5. 바이오·신약개발을 바라보는 기존 산업과 AI 진영의 온도차
- 바이오와 material science, 특히 biology 영역에서는 Periodic Labs 같은 사례와 함께 프런티어 스타트업의 방향이 주목받고, 관련 사업 기회를 찾는 젊은 창업자들도 예상보다 많이 포착된다 [08:14]
- LLM 영역에서는 지난 3~4년 동안 불가능하다고 여겨진 과제들이 reasoning model과 post-training 발전으로 차례로 무너졌고, AGI에 가까운 능력이 이미 등장했다는 인식도 생겼다 [09:05]
6. 생물학을 새로운 modal로 보는 접근
- DNA, protein, cell, organ 수준에서 일어나는 생물학적 현상을 소리·이미지·비디오처럼 서로 다른 modal로 보고, 이를 한 번에 넣어 학습시키려는 접근이 AI 진영의 기본 관점에 가깝다 [11:20]
- 생물학의 여러 층위를 수작업 문제로 각각 쪼개기보다 멀티모달 학습 대상으로 통합하면, 대형 모델의 일반화 능력이 기존 과학 도메인의 specific problem까지 확장될 수 있다는 기대가 생긴다 [11:35]
7. 미국 AI 스타트업 밸류에이션과 한국 창업자의 접근 격차
- 미국에서는 트랜스포머의 한계와 새로운 월드 모델을 주장하는 10대·20대 천재 창업자들에게 자본이 반복적으로 반응하고, 아직은 실패보다 기대가 더 강하게 작동한다 [12:30]
- 과거에도 비슷한 주장을 내세운 젊은 창업자들이 실제 문제를 풀지 못하고 팀과 회사가 무너진 사례가 있어, 자본시장 안에는 기대와 회의가 동시에 존재한다 [12:55]
8. 글로벌 네트워크가 프런티어 정보 접근성을 바꾼다
- 미국 현지에서는 한국 네트워크만으로 만나기 어려운 젊은 창업자와 연구자를 접할 수 있고, 인도·중국 네트워크가 프런티어 랩 내부 정보 흐름에 큰 역할을 한다 [14:29]
- 중국계 인력이 프런티어 랩 안에 많이 존재하며, 현재 프런티어가 어디에 있는지와 각 회사의 상황에 대한 비공개성 높은 정보가 그 네트워크를 통해 흘러나온다 [14:46]
9. Fable 5 출시는 Mythos의 안전 공개 버전으로 읽힌다
- Opus 4.8 이후 몇 주가 아니라 12일 만에 Fable 5가 공개됐고, 출시 명분은 안전장치 확보에 맞춰져 있다 [15:28]
- 안전·생물학 관련 내용은 앞단에서 기계적으로 차단되는 구조로 보이며, Mythos를 그대로 공개하기보다 Fable이라는 공개용 형태로 포장한 흐름이 드러난다 [15:45]
10. Dario Amodei 글과 Anthropic 일정은 공개·통제·상장 맥락으로 계속된다
- Dario Amodei의 블로그 흐름은 Machines of Loving Grace, DeepSeek 규제와 수출통제, 기술의 청소년기, AI exponential 정책 논의로 이어지며 안전과 정책 프레임을 반복한다 [18:17]
- 5월 28일 Opus 4.8 공개 시점에는 H라운드 965억 달러 밸류에이션이 나왔고, 6월 1일에는 Anthropic의 S-1 관련 비공개 초안 제출로 보이는 일정이 겹친다 [19:18]
11. Fable 5 사건은 IPO 전략과 전략자산화 신호를 동시에 만든다
- TAM 관점에서는 국가권력이 언제든 개입할 수 있다는 신호가 불리하지만, 사건이 작은 해프닝으로 수습되면 오히려 능력 인증 효과가 남을 수 있다 [20:34]
- OpenAI의 GPT-5.5가 아직 나오지 않은 가운데 RSI 흐름과 Anthropic의 일정이 겹치며, 2028년 완전 자동화 AI 연구원 전망과도 연결된다 [21:12]
12. 체감 성능은 사용 영역에 따라 갈리고, 프런티어 연구에서는 차이가 커진다
- Fable 5 사용 반응은 갈린다. 어떤 사용자는 Opus보다 크게 낫지 않다고 느끼지만, 다른 사용자는 유료로라도 써야 할 만큼 의미 있는 모델로 받아들인다 [22:35]
- Opus 4.8의 경계를 넘을 필요가 없는 영역에서는 Fable 5의 추가 이득이 잘 체감되지 않으며, 그런 사용자에게는 기존 모델이 비용 면에서 더 나은 선택지가 된다 [23:00]
13. Loop Engineering의 등장과 기존 루프와의 차이
- 수백 쪽 분량의 자료를 모두 읽기 어렵기 때문에 초반 검토는 세부 검증보다 전체 감각을 파악하는 수준에 머문다 [24:03]
- 판매·마케팅 영역에서 Loop Engineering이라는 새 용어가 떠오르고, Claude Code의 Boris Cherny와 OpenClaw의 Peter Steinberger, OpenAI 관계자들이 비슷한 시기에 loop 관련 논의를 꺼낸다 [24:19]
14. Fable 가격이 드러내는 토큰 비용과 모델 규모 추정의 한계
- 프런티어 모델이 작업을 펼친 뒤 다시 수렴하는 구조가 공식화되면서 token 비용이 크게 늘 수 있고, Fable을 위임형 loop에 직접 넣으면 비용 문제가 곧바로 드러난다 [25:28]
- Fable은 Opus보다 대략 2배 비싸며, 100만 출력 token 기준 가격이 50달러라 입력보다 출력 비용 부담이 훨씬 크다 [25:55]
15. Anthropic의 비싼 가격과 분산 인프라가 만든 압박
- 경쟁 환경에서는 모델 가격이 원가에 가깝게 형성될 수 있고, Fable의 100만 token당 입력 10달러·출력 50달러 구조는 현재 가장 비싼 축에 속한다 [27:58]
- Anthropic은 Google TPU, Amazon Trainium, NVIDIA를 모두 활용하는 넓은 인프라 전선을 갖고 있어 inference에서는 이해 가능한 선택이지만, training과 post-training에서는 통합 플랫폼 대비 불리해질 수 있다 [28:49]
16. Fable을 loop에 태울 때 생기는 API 비용 폭증
- Fable은 6월 22일까지 임시 공개된 뒤 구독 모델 편입이나 종량 과금 지속 여부를 지켜볼 예정이었지만, 이후 정부 제재라는 변수까지 겹친다 [30:36]
- Dynamic Workflows에서는 단일 실행이 최대 1,000개 agent까지 확장될 수 있고, 1,500개의 Sonnet 4.6을 쓰던 작업은 약 400달러에서 Fable 기준 약 1,500달러 수준으로 뛰어오른다 [31:06]
17. Test-time compute의 가능성과 인간 노력 대비 비용 논쟁
- 더 낮은 비용으로 사람이 일부 노력을 투입하면 더 빠르고 정확하게 끝낼 수 있는 일도 있는데, 현재 흐름은 더 비싼 돈을 내고 모델을 오래 일하게 하는 쪽으로 기운다 [32:07]
- test-time compute에는 아직 더 뽑아낼 수 있는 여지가 많고, 더 큰 규모를 만들 수 있으면 모델이 처리할 수 있는 영역도 크게 넓어진다 [32:23]
18. Claude의 재귀적 확장과 RSI 방향성
- Claude가 혼자 일하다가 여러 Claude가 함께 일하고, Claude가 다시 Claude를 만드는 그림은 recursive self-improvement에 가까운 방향성을 상징한다 [33:20]
- 하나의 구조가 더 큰 블록에서도 자기 자신과 비슷하게 반복되는 모습은 생명세포 분열이나 프랙털 같은 동형 구조에 가깝다 [33:43]
19. Mythos 10T와 프런티어 학습 규모의 급팽창
- Mythos는 10T 모델로 다뤄지며, 이 규모를 학습시키는 계산량 자체가 이미 산정하기 어려운 수준에 들어선다 [36:00]
- 과거 프런티어 모델은 3T나 5T 수준에서 학습됐다는 이야기가 많았지만, 현재 기준은 30T 쪽으로 이동하고 토큰 수는 계속 늘어나는 흐름이다 [36:16]
20. 한계효용 체감과 반도체·전력·데이터센터 수혜
- Dario Amodei의 “Machines of Loving Grace”에서 다뤄진 수학적 한계효용 체감 전망은 특정 영역에서 이미 현실화되는 흐름으로 보인다 [37:03]
- Sam Altman이나 Dario Amodei의 발언을 해석하던 시기와 달리, 현재 국면은 당사자들도 정리할 여유 없이 미지의 영역으로 끌려 올라가는 상태에 가깝다 [37:23]
21. 투입 대비 성능 향상과 10T 이후의 현실적 장벽
- 대형 기술기업들이 아직 무너지지 않는 이유는 시장의 기대가 계속 커지는 동시에, 그 기대에 부응하는 outcome도 일정 수준 이어져 왔기 때문이다 [38:03]
- 투입을 10배 늘릴 때 체감 gain이 약 2배 늘어나는 흐름이라면, 1T에서 10T로 올라간 Mythos의 성능 개선도 같은 스케일링 관점에서 이해할 수 있다 [38:33]
22. Sovereign AI와 미중 전략 게임, 한국의 기회
- 10T 모델을 둘러싼 situational awareness는 이미 미국 정부의 관리 움직임과 맞물려 있으며, sovereign AI 수요도 빠르게 확대되고 있다 [40:08]
- 목표 모델이 확인되면 중국도 계산량과 시간의 함수로 같은 목표에 접근할 수 있고, 수출통제 역시 중국이 대응 전략을 세울 수 있는 변수로 작동한다 [40:20]
23. Fable 5와 모델 대화가 드러내는 사용자-모델 관계
- Norbert Wiener의 《The Human Use of Human Beings》는 자동화 사회에서 인간의 쓸모를 묻는 고전으로 다시 소환되며, Fable 5 경험과 맞닿은 문제의식이 된다 [42:35]
- 교육 관련 글을 Fable 5에 넣고 대화한 뒤, 별도 세션에서 그 대화를 다시 검토하면서 모델과 사용자를 둘러싼 이중 대화 구조가 형성된다 [43:19]
24. 시스템의 목적, 자기 인식, Fable 5의 한계와 강점
- “The purpose of a system is what it does”라는 사이버네틱스 문장은 의도나 목표보다 실제로 수행되는 일이 모델과 사용자의 관계를 보여준다는 관점으로 계속된다 [45:11]
- Fable 5와의 대화는 코드 생성 같은 실용적 사용을 넘어, 매혹적인 주제 안으로 깊이 들어가고 그 과정을 즐기는 자기 모습을 다시 인식하게 만든다 [45:45]
25. 1년 만에 달라진 AI 개발 환경
- 지금이 AI 혁명의 결정적 시기로 남을 수도 있지만, 2~3년 뒤에는 더 극단적인 변화가 나타나며 지금의 판단 기준 자체가 다시 바뀔 가능성도 있다 [48:02]
- 지난해 5~6월에는 Claude Code가 무엇이고 어떻게 써야 하는지가 유튜브 커뮤니티에 막 퍼지기 시작했는데, 1년 뒤의 변화 폭은 전혀 다른 시대처럼 느껴질 만큼 커졌다 [48:59]
26. 코딩보다 커진 엔지니어링과 도구 자가증식
- 사람이 실제 코드를 한 줄씩 쓰지 않는 경우가 늘어도, 사용 가능한 시스템을 만들려면 에이전트와 함께 더 높은 수준의 아키텍처와 공학 문제를 풀어야 한다 [50:00]
- 수천 줄 규모에서는 문제가 없던 코드가 며칠 사이 6만 줄까지 커지면 중복과 리팩터링 부담이 커지고, 의미 수준의 중복을 찾아내는 도구가 필요해진다 [50:17]
27. AI Frontier의 다음 단계와 커뮤니티 확장
- AI Frontier 주변에는 이미 정보를 제공하는 사람들이 커뮤니티를 이루고 있으며, 주간 단위 요약만으로는 변화 속도를 따라가기 어려워지고 있다 [51:02]
- 사람의 속도로는 감당하기 어려운 변화 속도 속에서 커뮤니티 구성원을 서로 연결하는 시스템이 필요하며, 실리콘밸리와 서울 사이의 기회를 더 강하게 이어가는 것이 다음 과제가 된다 [51:39]
🧾 결론
- 이번 에피소드의 중심 메시지는 “더 큰 모델이 더 좋다”에 머물지 않고, 프런티어 AI 경쟁이 데이터셋, post-training, 인프라, 정책 통제, 전략자산화의 결합 문제로 바뀌고 있다는 점이다.
- Mythos와 Fable 5는 성능 논쟁뿐 아니라 안전 공개 버전, 생물학 관련 차단, 미국 정부 개입, 비미국 접근 제한이라는 이슈를 통해 AI 모델이 국가 단위 관리 대상이 될 수 있음을 보여주는 사례로 해석된다.
- 사용자는 Fable 5 같은 프런티어 모델을 평가할 때 일반적인 체감 성능만으로 판단하기 어렵고, 자신이 다루는 문제가 Opus급 모델의 경계를 넘는지, 고난도 연구·분석 영역인지, 비용 대비 산출물이 충분한지 따져야 한다.
- 바이오와 material science 영역에서는 기존 산업의 세부 문제 해결 방식과 AI 진영의 멀티모달 일반화 접근이 충돌하고 있으며, 이 간극이 새로운 창업·투자 기회로 이어질 수 있다.
- 검증 필요: Mythos의 정확한 규모, Anthropic의 S-1 관련 일정, Amazon 개발자의 jailbreak 신고 정황, 정부 제재의 구체적 배경 등은 영상 내 해석과 정황으로 제시된 내용이므로 별도 확인이 필요하다.
📈 투자·시사 포인트
- 프런티어 모델 경쟁이 계속될수록 반도체, 전력, 데이터센터, 분산 인프라, inference 최적화, post-training 시스템은 구조적 수혜 영역으로 남을 가능성이 크다.
- 모델 자체보다 도메인별 데이터셋을 생산·정제·평가하는 기업, 그리고 post-training loop를 효율적으로 운영하는 인프라 기업의 중요성이 커질 수 있다.
- Fable 5처럼 고성능이지만 비싼 모델은 모든 업무에 일괄 적용되기보다, 고난도 연구·보안·바이오·복잡한 분석처럼 비용을 정당화할 수 있는 영역에서 먼저 경제성이 검증될 가능성이 높다.
- Sovereign AI 흐름은 미국과 중국의 전략 게임 속에서 한국에도 기회를 만들 수 있지만, 단순 모델 개발보다 자원 배분, 데이터 확보, 글로벌 네트워크, 국가 차원의 우선순위 설정이 함께 필요하다.
- 미국 AI 스타트업 시장에서는 작은 팀도 높은 밸류에이션을 인정받는 사례가 언급되며, 한국 창업자에게는 현지 네트워크 접근성과 프런티어 정보 흐름에 직접 연결되는 능력이 중요한 경쟁력이 된다.
- 검증 필요: Fable 5의 장기 가격 정책, Anthropic·OpenAI·Meta 등 프런티어 랩의 실제 학습 규모, sovereign AI 관련 국가별 정책 방향은 영상 시점 이후 바뀔 수 있으므로 최신 공개 자료와 함께 확인해야 한다.
⚠️ 불확실하거나 확인이 필요한 부분
- 영상에서는 Anthropic의 Mythos, Fable, Fable 5, Opus 4.8 공개 시점과 관계가 언급되지만, 각 모델명·출시일·공개 범위·접근 제한 여부는 공식 발표나 신뢰 가능한 외부 자료로 별도 확인이 필요하다.
- Fable 공개 직후 미국 정부 규제로 비미국 국적자의 접근이 막혔다는 설명은 영상 내 해석으로 제시되며, 실제 규제 주체, 적용 범위, 법적 근거, 시행 기간은 확인이 필요하다.
- Mythos가 10T 모델이고 프런티어 학습 규모가 30T 방향으로 이동했다는 언급은 transcript 안에서 확정 근거가 제시되지는 않으므로, 공식 문서나 독립적인 기술 분석 없이는 단정하기 어렵다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- Anthropic 공식 블로그, 모델 릴리스 노트, API 문서에서 Mythos/Fable/Fable 5/Opus 4.8 관련 명칭과 출시 일정을 대조한다.
- 미국 정부 규제 또는 수출통제와 관련된 공식 발표, 행정명령, 보도자료가 실제로 있었는지 확인한다.
- 영상에서 언급된 Fable 가격, 입력·출력 토큰 단가, 구독/종량 과금 조건을 공식 가격표 기준으로 검증한다.
- “post-training 인프라”와 “도메인별 데이터셋 공급”이 프런티어 경쟁의 핵심이라는 주장에 대해 최근 연구·기업 사례를 추가로 수집한다.
❓ 열린 질문
- Fable 5의 의미는 범용 사용자 경험보다 사이버 보안·생물학 같은 최전선 연구 영역에서 더 크게 드러나는가?
- post-training 경쟁에서 병목은 모델 아키텍처보다 데이터셋 생성, 평가 루프, inference/training 인프라 쪽으로 완전히 이동하고 있는가?
- 생물학을 DNA·protein·cell·organ의 멀티모달 문제로 통합해 학습하는 접근은 실제 신약개발 성과로 이어질 수 있는가?