My bets on open models, mid-2026
Quick Summary
네이선 램버트는 2026년 중반의 오픈 모델 경쟁을 단순한 ‘따라잡기’가 아니라 역량 격차, 자금 조달, 배포, 규제, 실제 사용처가 얽힌 복잡한 경제·기술 문제로 본다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 요약
네이선 램버트는 2026년 중반의 오픈 모델 경쟁을 단순한 ‘따라잡기’가 아니라 역량 격차, 자금 조달, 배포, 규제, 실제 사용처가 얽힌 복잡한 경제·기술 문제로 본다.
📌 핵심 요약
- 저자는 오픈 모델이 폐쇄형 연구소를 모든 영역에서 완전히 따라잡을 가능성에는 회의적이지만, 벤치마크상 격차가 예상만큼 크게 벌어지지 않았다는 점을 중요하게 본다.
- 오픈 모델 연구소들은 잘 정립된 벤치마크에서 빠르게 추격할 기술력과 충분한 컴퓨팅 자원을 갖췄으며, 특히 중국 오픈웨이트 연구소들은 벤치마크 점수와 추격 서사를 강하게 의식한다.
- 다만 같은 점수를 받더라도 폐쇄형 모델은 더 견고하고 범용적인 경우가 많으며, 지식 노동자를 직접 지원하는 개인 비서형 시장에서는 측정하기 어려운 품질 차이가 중요해질 수 있다.
- 오픈 모델 경쟁의 핵심은 장기적으로 능력 자체보다 경제적 지속력, 자금 조달, 실제 매출, 배포 구조에 달려 있으며, 중국 오픈웨이트 연구소들은 이르면 올해부터 자금 압박을 겪을 수 있다고 전망한다.
- 반복적 자동화, 도메인 특화 모델, 개인·로컬 에이전트, 주권적 AI 수요는 오픈 모델 채택을 늘릴 수 있지만, 강력한 폐쇄형 모델이 등장할수록 안전성 충격과 규제 압력도 함께 커질 것으로 본다.
🧩 주요 포인트
- 저자는 오픈 모델이 폐쇄형 연구소를 모든 영역에서 완전히 따라잡을 가능성에는 회의적이지만, 벤치마크상 격차가 예상만큼 크게 벌어지지 않았다는 점을 중요하게 본다.
- 오픈 모델 연구소들은 잘 정립된 벤치마크에서 빠르게 추격할 기술력과 충분한 컴퓨팅 자원을 갖췄으며, 특히 중국 오픈웨이트 연구소들은 벤치마크 점수와 추격 서사를 강하게 의식한다.
- 다만 같은 점수를 받더라도 폐쇄형 모델은 더 견고하고 범용적인 경우가 많으며, 지식 노동자를 직접 지원하는 개인 비서형 시장에서는 측정하기 어려운 품질 차이가 중요해질 수 있다.
- 오픈 모델 경쟁의 핵심은 장기적으로 능력 자체보다 경제적 지속력, 자금 조달, 실제 매출, 배포 구조에 달려 있으며, 중국 오픈웨이트 연구소들은 이르면 올해부터 자금 압박을 겪을 수 있다고 전망한다.
- 반복적 자동화, 도메인 특화 모델, 개인·로컬 에이전트, 주권적 AI 수요는 오픈 모델 채택을 늘릴 수 있지만, 강력한 폐쇄형 모델이 등장할수록 안전성 충격과 규제 압력도 함께 커질 것으로 본다.
🧠 상세 정리
1. 오픈 모델과 폐쇄형 모델의 격차는 단순한 추격전이 아니다
저자는 지금이 오픈 모델이 폐쇄형 연구소를 계속 따라갈 수 있는지 확인하게 되는 시기라고 말한다. 그의 기본 입장은 오픈 모델이 모든 영역에서 폐쇄형 모델을 완전히 따라잡지는 못할 것이라는 쪽에 가깝다. 그러나 이는 오픈 모델이 무의미하다는 뜻이 아니라, 모든 모델이 포화되어 서로 비슷해진다는 단순한 전망을 경계하는 표현이다. 핵심 관찰 대상은 모델 간 역량 격차이지만, 그 격차는 자금 조달, 개발 주체, 증류와 같은 추격 기술, 규제 가능성, 실제 사용자 기반과 복잡하게 얽혀 있다. 따라서 오픈 모델의 미래는 하나의 벤치마크 그래프만으로 설명하기 어렵고, 공급과 수요가 서로 다른 힘에 의해 움직이는 구조로 봐야 한다.
2. 벤치마크에서는 오픈 모델이 예상보다 잘 버티고 있다
저자가 놀랍게 보는 지점은 2025년 하반기부터 현재까지 최고 수준의 폐쇄형 모델들이 오픈 모델에 대해 점점 더 큰 역량 우위를 보이지 않았다는 점이다. 훈련 컴퓨팅과 연구 자원의 차이를 고려하면 폐쇄형 연구소가 더 뚜렷하게 앞설 것처럼 보였지만, 실제 벤치마크상 격차는 그렇게 단순하게 확대되지 않았다. 오픈 모델 연구소들은 잘 정립된 평가 지표에서 매우 강한 추격 능력을 보이고 있으며, 이는 풍부한 인재와 충분한 컴퓨팅 파워의 균형을 반영한다고 설명한다. 특히 중국 오픈웨이트 연구소들은 미국의 비슷한 폐쇄형 연구소보다 벤치마크 점수에 약간 더 집중하는 경향이 있다고 본다. 이는 최전선 모델을 따라가고 있다는 서사를 유지해야 투자 유치와 채택에 유리하기 때문이다.
3. 증류는 도움이 되지만 결정적 만능 해법은 아니다
저자는 중국 LLM 기업들이 벤치마크 추격에서 증류의 도움을 받고 있다고 말하지만, 그것이 모든 문제를 해결하는 만능 수단은 아니라고 선을 긋는다. 증류 역학이 규제 같은 요인으로 바뀌더라도 전체 역량 균형을 결정하는 단일 요인이 되지는 않을 것이라고 본다. 오픈 모델 연구소들이 벤치마크 점수에 집중하는 것은 단순한 기술 선택이 아니라, 자신들이 프런티어를 계속 따라가고 있다는 인식을 유지하려는 인센티브의 자연스러운 결과다. 이 서사는 자금 조달과 사용자 채택에 직접적으로 연결되기 때문에 중요하다. 따라서 증류의 역할은 빠른 추격을 가능하게 하는 도구 중 하나이지만, 오픈 모델 생태계의 장기 승패는 더 넓은 경제적 조건과 시장 구조에 달려 있다.
4. 폐쇄형 모델은 같은 점수에서도 더 견고하고 유용할 수 있다
저자는 지금까지 폐쇄형 모델이 비슷한 벤치마크 점수를 가진 오픈 모델보다 더 견고하고 일반적으로 유용한 경향이 있었다고 지적한다. 이는 현재 또는 과거의 벤치마크가 잘 포착하지 못하는 품질 차이와 관련된다. 예를 들어 개별 사용자가 계속 새로운 문제를 제시하는 지식 노동자 지원형 시장에서는 단순 평가 점수보다 안정성, 폭넓은 맥락 처리, 예측하기 어려운 상황에서의 대응력이 더 중요해질 수 있다. 이런 영역에서는 폐쇄형 모델이 시장 지배력을 확보할 가능성이 크다고 본다. 특히 실제 사용자가 에이전트형 도구를 통해 업무 문제를 해결하는 환경에서는 배포와 사용자 피드백이 지속적 성능 개선의 중요한 재료가 된다.
5. 장기 경쟁의 핵심은 기술 능력보다 경제적 지속력이다
저자는 오픈 모델과 폐쇄형 모델의 경쟁이 벤치마크상으로는 빠른 추격과 경제적 버티기의 게임이 될 것이라고 전망한다. 시장 구조가 좁아지기 전까지는 누가 계속 투자하고 모델을 개선할 수 있는지가 중요하다는 뜻이다. 그는 중국 오픈웨이트 연구소들이 이르면 올해부터 자금 조달의 어려움을 먼저 겪을 수 있으며, 그 영향은 3개월에서 9개월 뒤 서로 다른 역량 궤적으로 나타날 수 있다고 본다. 결국 실제 AI 매출이 더 많은 투자를 낳고, 그 투자가 다시 빠른 모델 개선 능력으로 연결된다. 현재까지는 경제 현실이 오픈 모델 확장 전반에 본격적으로 영향을 주지 않았지만, 장기적으로는 능력의 문제가 아니라 수익과 투자 구조의 문제가 될 것이라는 판단이다.
6. 오픈 모델의 채택, 규제, 새로운 수요는 동시에 커진다
저자는 반복적 자동화 작업에서 오픈 모델 채택이 늘어날 것으로 본다. 새로운 AI 네이티브 애플리케이션, 기업 백엔드 자동화, 도메인 특화의 효율적 모델 수요가 이런 흐름을 이끌 수 있다. 동시에 강력한 폐쇄형 모델이 등장할수록 가장 강한 모델의 오픈웨이트 버전을 허용해서는 안 된다는 안전성 충격과 규제 압력도 반복될 수 있다고 전망한다. 하지만 특정 오픈 모델을 금지하자는 요구는 계속 나오더라도 실제 구현은 어렵다고 본다. 어떤 국가가 일정 기준 이상의 오픈 모델을 금지하더라도 다른 주권적 행위자가 모델을 훈련해 공개할 수 있고, 그 모델은 더 적은 감독 아래 시장에 들어올 수 있기 때문이다. 주권 국가와 기존 권력 구조는 강력한 AI 도구가 한두 기업 손에만 놓이는 상황을 원치 않기 때문에, 오픈 모델을 다른 거버넌스 방식으로 바라보게 될 것이라고 설명한다.
🧾 핵심 주장 / 시사점
- 오픈 모델 논쟁의 핵심은 ‘성능을 따라잡느냐’보다 ‘누가 지속적으로 투자하고 배포하며 실제 사용 데이터를 얻느냐’에 더 가까워지고 있다.
- 벤치마크에서의 근접성은 오픈 모델의 힘을 보여주지만, 견고성·범용성·실사용 피드백처럼 측정하기 어려운 영역에서는 폐쇄형 모델의 우위가 더 뚜렷해질 수 있다.
- 로컬 에이전트와 개인 에이전트 시장은 저자가 ‘암흑 물질’처럼 아직 과소평가된 오픈 모델 수요로 보는 영역이며, 장기적인 오픈·폐쇄 균형에 영향을 줄 수 있다.
✅ 액션 아이템
- 오픈 모델 평가에서 벤치마크 점수뿐 아니라 견고성, 범용성, 개인 비서형 품질처럼 측정하기 어려운 기준을 별도로 분리해 비교한다.
- 반복적 자동화, 도메인 특화 모델, 개인·로컬 에이전트, 주권적 AI 수요 중 오픈 모델 채택 가능성이 큰 사용처를 우선순위화한다.
- 오픈 모델 전략 검토 시 기술 격차보다 자금 조달, 실제 매출, 배포 구조, 규제 압력을 함께 보는 체크리스트를 만든다.
❓ 열린 질문
- 벤치마크 격차가 작아 보여도 실제 지식 노동자 지원 업무에서 폐쇄형 모델의 견고성 차이는 얼마나 크게 체감될까?
- 중국 오픈웨이트 연구소들이 자금 압박을 받기 시작하면 벤치마크 추격 속도와 모델 공개 전략은 어떻게 달라질까?
- 오픈 모델 채택을 늘릴 반복적 자동화·도메인 특화·로컬 에이전트 수요는 규제 압력과 안전성 우려를 어디까지 상쇄할 수 있을까?