What comes next with open models - by Nathan Lambert | Article 정리

🖼️ 인포그래픽

What comes next with open models - by Nathan Lambert 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 요약

네이선 램버트는 오픈 모델이 영향력 확보의 빠른 경로로 부상했지만, 폐쇄형 프런티어 모델과의 격차는 줄기보다 커질 가능성이 높으며, 앞으로의 핵심은 거대 오픈 프런티어 경쟁보다 폐쇄형 에이전트를 보완하는 작고 특화된 오픈 모델 생태계라고 본다.

📌 핵심 요약

2025년에는 DeepSeek R1의 성공 이후 많은 기업이 오픈 모델을 AI 생태계에서 영향력을 얻는 전략으로 진지하게 받아들이기 시작했지만, 실제로 오픈 모델을 만들 경제적 이유를 가진 기업은 많지 않다.
오픈 모델은 좋은 모델 하나를 공개하는 것만으로도 기업 계약이나 대규모 마케팅 없이 사용량과 인지도를 확보할 수 있어 초기 AI 산업에서 잠재적 가치가 큰 영향력 수단으로 여겨진다.
저자는 오픈 모델이 폐쇄형 최고 모델을 절대 성능에서 이길 가능성은 작다고 보며, 과학적 돌파구가 비밀리에 유지되거나 성능 발전이 벽에 부딪히는 경우가 아니라면 격차가 좁혀지기 어렵다고 설명한다.
오픈 모델은 지금까지 최고 폐쇄형 모델보다 대체로 6~18개월 뒤처져 왔고, 작은 예산으로 이 격차를 유지한 것은 놀랍지만, 장기 과제와 전문 영역으로 AI가 이동하면서 폐쇄형 모델의 수직 통합 우위가 커질 가능성이 있다.
앞으로 모델은 진정한 폐쇄형 프런티어 모델, 대형 오픈 프런티어 모델, 폐쇄형 에이전트를 보완하는 작고 특화된 오픈 모델이라는 세 부류로 나뉘며, 특히 반복적이고 좁은 작업을 빠르고 저렴하게 수행하는 소형 오픈 모델의 수요가 과소평가되어 있다고 주장한다.

🧩 주요 포인트

2025년에는 DeepSeek R1의 성공 이후 많은 기업이 오픈 모델을 AI 생태계에서 영향력을 얻는 전략으로 진지하게 받아들이기 시작했지만, 실제로 오픈 모델을 만들 경제적 이유를 가진 기업은 많지 않다.
오픈 모델은 좋은 모델 하나를 공개하는 것만으로도 기업 계약이나 대규모 마케팅 없이 사용량과 인지도를 확보할 수 있어 초기 AI 산업에서 잠재적 가치가 큰 영향력 수단으로 여겨진다.
저자는 오픈 모델이 폐쇄형 최고 모델을 절대 성능에서 이길 가능성은 작다고 보며, 과학적 돌파구가 비밀리에 유지되거나 성능 발전이 벽에 부딪히는 경우가 아니라면 격차가 좁혀지기 어렵다고 설명한다.
오픈 모델은 지금까지 최고 폐쇄형 모델보다 대체로 6~18개월 뒤처져 왔고, 작은 예산으로 이 격차를 유지한 것은 놀랍지만, 장기 과제와 전문 영역으로 AI가 이동하면서 폐쇄형 모델의 수직 통합 우위가 커질 가능성이 있다.
앞으로 모델은 진정한 폐쇄형 프런티어 모델, 대형 오픈 프런티어 모델, 폐쇄형 에이전트를 보완하는 작고 특화된 오픈 모델이라는 세 부류로 나뉘며, 특히 반복적이고 좁은 작업을 빠르고 저렴하게 수행하는 소형 오픈 모델의 수요가 과소평가되어 있다고 주장한다.

🧠 상세 정리

1. 오픈 모델이 영향력 전략으로 부상한 배경

저자는 2025년을 많은 기업이 오픈 모델을 AI 생태계에서 영향력을 얻는 길로 진지하게 받아들이기 시작한 해로 설명한다. 이 흐름은 DeepSeek R1의 돌파적 성공 이후 더 빠르게 확산되었다. 다만 그는 대부분의 오픈 모델 개발이 명확한 수익 동기보다는 희망, 원칙, 관대함 같은 이유로 추진된다고 본다. Meta의 Llama처럼 보완재를 상품화한다는 논리는 자주 인용되지만, 제대로 참여하는 데 수십억 달러가 드는 현실에서는 이를 실행하기 어렵다. 그럼에도 AI가 아직 초기 산업화 단계에 있고 인프라 확장이 핵심인 만큼, 최첨단 AI에 조금이라도 영향력을 갖는 것 자체가 거대한 잠재가치로 여겨진다.

2. 오픈 모델의 매력과 과장된 기대

오픈 모델은 기업 계약이나 대규모 마케팅 없이도 좋은 모델 하나를 공개하는 것만으로 상당한 사용량과 관심을 얻을 수 있다는 점에서 빠른 영향력 확보 수단이다. 저자는 많은 AI 기업이 그보다 약한 기반 위에서도 많은 자금을 조달해 왔다고 지적한다. 동시에 오픈 모델에 대한 열기는 폐쇄형 연구소를 진정으로 앞지르는 미래에 대한 기대, 불안 섞인 자기위안, 공상과학적 상상에 의해 증폭된다. 만약 오픈 모델이 정말 최고 성능을 넘어서면 AI 생태계의 수익과 매출은 급락할 수 있지만, 장기적으로 모델 권력과 통제의 균형은 더 안정될 수 있다. 저자는 이를 경제적으로는 파괴적 성공일 수 있는 시나리오로 묘사한다.

3. 오픈 모델이 절대 성능에서 이기기 어려운 이유

저자는 오픈 모델이 절대 성능에서 승리할 가능성은 작다고 본다. 그런 일이 가능하려면 선도 연구소들이 모르는 진정한 과학적 돌파구가 비밀리에 유지되거나, 모델 성능 발전이 실제로 벽에 부딪혀야 한다. 두 가능성 모두 완전히 불가능하지는 않지만 매우 낮다고 평가한다. 지금까지 AI 발전에는 뚜렷한 벽이 없었고, 저자가 대화한 최상위 AI 연구자들은 여전히 성능 향상을 위한 낮게 열린 기회들이 많다고 설명한다. 저자는 이것이 특이점으로 향하는 재귀적 자기개선일 필요는 없지만, 대형 기술 기업들이 정의상 변혁적인 도구를 만드는 직접 경로 위에 있다고 강조한다.

4. 오픈 모델과 폐쇄형 모델의 현재 격차

저자는 오픈 모델과 폐쇄형 모델의 격차를 공정하게 평가하면, 오픈 모델이 늘 최고 폐쇄형 모델보다 6~18개월 뒤처져 있었다고 말한다. 훨씬 작은 예산으로 운영되는 오픈 연구소들이 이 격차를 비교적 안정적으로 유지해 온 것은 매우 놀라운 성과다. 그는 자신을 포함한 많은 분석가가 격차가 더 크지 않다는 점에 당혹감을 느낀다고 표현한다. 증류는 품질 향상에 어느 정도 도움을 주고, 공개 벤치마크에 더 적극적으로 맞추는 전략은 인식을 개선할 수 있다. 그러나 그럼에도 선도 오픈 모델의 진전은 그 자체로 대단하다고 평가한다.

5. 격차가 커질 가능성과 복제의 어려움

저자는 앞으로 오픈-폐쇄 모델 격차가 줄기보다 커질 가능성이 높다고 본다. 최상위 몇몇 연구소는 여전히 빠르게 개선되고 있으며, 강력한 새 모델들을 계속 공개하고 있다. 특히 공개 벤치마크로는 잘 측정되지 않는 프런티어 모델의 개선이 오픈 모델과의 차이를 키운다고 본다. 코딩 에이전트 시대에는 폐쇄형 모델의 성능을 증류로 복사하는 일도 더 창의적인 접근을 요구한다. 예전에는 모델의 전체 출력을 학생 모델 학습에 활용할 수 있었지만, 이제 중요한 부분은 복잡한 강화학습 환경과 그 안에 에이전트를 배치하는 프롬프트이며, 이런 요소들은 훨씬 숨기기 쉽다.

6. 전문 영역과 장기 과제에서 드러날 폐쇄형 모델의 우위

AI 모델이 더 긴 시간 범위의 과제와 더 전문화된 작업으로 이동하면서, 저자는 폐쇄형 모델과 오픈 모델 사이에 큰 성능 격차가 나타날 것으로 예상한다. 법률이나 의료처럼 미국 경제 안에서 복잡하고 값비싼 관문을 거치는 영역은 공개 웹 데이터만으로 복제하기 어렵다. 코딩은 GitHub 스크래핑, 신중한 데이터 처리, 영리한 환경 설계로 상당 부분 해결될 수 있지만, 앞으로 학습의 초점은 공개 웹에 없는 도메인으로 이동한다. 프런티어 AI 개발은 이제 하나의 대형 돌파보다 인프라를 기반으로 중소 규모의 개선을 오랜 시간 쌓아 올리는 과정에 가깝다. 이는 범위를 확장하면서 품질을 유지할 수 있는 매우 비싼 조직에 유리하다.

7. 앞으로의 세 가지 모델 부류

저자는 이런 흐름 속에서 앞으로의 모델 세계가 세 가지 부류로 정리될 것이라고 제안한다. 첫째는 진정한 폐쇄형 프런티어 모델로, 가장 강력한 지식 노동과 코딩 에이전트를 구동하며 인간이 일과 맺는 관계를 재고하게 만들 도구가 된다. 둘째는 오픈 프런티어 모델로, 최고 폐쇄형 모델과 같은 방향에서 경쟁하려는 대형 오픈 웨이트 모델이다. 이들은 최고 모델이 필요한 일부 용도에는 부족하겠지만, 많은 사용 사례에서는 매우 잘 작동할 수 있다. 저자는 개인이 전기 비용에 가까운 한계비용으로 강력한 지능을 비공개로 활용하는 의미를 AI 생태계가 이해하는 데에도 아직 시간이 걸릴 것이라고 말한다.

8. 소형 오픈 모델과 분산 지능의 기회

저자가 가장 강조하는 방향은 분산 지능으로서의 작고 열린 모델이다. 그는 가장 성공적인 오픈 모델이 폐쇄형 에이전트와 경쟁하기보다 이를 보완하는 도구가 될 가능성이 크다고 본다. 기술 경제 전반에는 반복적이고 좁은 작업을 자동화하려는 압력이 크며, 이런 작업을 최고 폐쇄형 모델에서 훨씬 빠르고 저렴한 소형 오픈 모델로 옮기려는 수요가 있다. 저자는 이 모델들이 거의 지루할 정도로 구체적이고 특화되어야 한다고 말한다. 그러나 현재 소형 모델들은 여전히 일반 벤치마크 중심으로 홍보되는 경우가 많고, 오픈 모델이 프런티어를 따라잡는다는 과열된 담론이 이 큰 수요 영역을 가리고 있다고 지적한다.

9. 모델 가중치만으로는 부족한 AI 시스템의 현실

저자는 앞으로 AI를 이해할 때 모델 가중치만이 아니라 생각하고, 검색하고, 행동하는 시스템 전체를 봐야 한다고 말한다. 최근 사용자가 크게 놀라는 AI 경험은 단순한 자기회귀 토큰 출력만이 아니라 도구와 결합된 시스템에서 나온다. 수학 증명이나 경쟁 프로그래밍 같은 특정 영역을 제외하면, 순수한 출력만으로 놀라움을 주는 상황은 GPT-4 이후 크게 변하지 않았다고 본다. 폐쇄형 모델은 칩, 추론 소프트웨어, 가중치, 도구, 사용자 인터페이스까지 수직 통합할 수 있어 이 세계에서 뚜렷한 장점을 갖는다. 반면 오픈 모델은 다양한 추론 환경, 여러 도구, 많은 사용 사례에서 작동해야 하므로 동일한 수준의 통합 경험을 만들기 어렵다.

10. 오픈 시스템의 사업 전략과 미완성된 개방성

저자는 오픈 모델의 사업성과 실용성을 이해하기 위해 과거 오픈소스와 현대 기술 기업의 관계에 대한 논의로 돌아간다. 구글의 ‘The Meaning of Open’ 글을 인용하며, 오픈 시스템은 산업을 만들고 더 많은 사람의 지성을 활용해 기업들이 사업 전술보다 제품의 장점으로 경쟁하게 할 수 있다고 설명한다. 그는 오픈 모델 생태계에서 가장 큰 이익을 얻는 회사는 이를 가장 잘 이해하는 회사일 것이라고 본다. 그러나 현재 많은 오픈 모델 기업의 사업 모델은 아직 그런 깊은 참여와 연구, 실험에 기반하지 않는다. 또한 오픈 웨이트 모델만으로는 제품이 아니며, 실제 제품은 도구와 하네스까지 포함하기 때문에 지금의 시스템은 완전히 열린 시스템이라기보다 부분적으로 열리고 부분적으로 닫힌 복합 구조라고 지적한다.

🧾 핵심 주장 / 시사점

오픈 모델의 핵심 가치는 최고 폐쇄형 모델을 정면으로 추월하는 데서보다, 영향력 확보와 생태계 형성, 특정 작업의 비용 절감에서 더 현실적으로 나타난다.
AI 경쟁이 모델 가중치 중심에서 도구·환경·제품 하네스가 결합된 시스템 경쟁으로 이동하면서, 폐쇄형 연구소의 수직 통합 우위는 더 커질 수 있다.
소형 오픈 모델은 일반 벤치마크 경쟁보다 폐쇄형 에이전트가 호출하고 싶어 하는 지루하지만 구체적인 도구가 될 때 더 큰 경제적 기회를 가질 수 있다.

✅ 액션 아이템

오픈 모델 도입 판단 시 절대 성능 경쟁보다 사용량·인지도 확보와 영향력 확대 효과를 별도 기준으로 평가한다.
반복적이고 좁은 업무 중 빠르고 저렴한 처리가 중요한 영역을 골라 소형 특화 오픈 모델 적용 후보로 정리한다.
폐쇄형 에이전트 중심 전략을 세울 때 이를 보완할 오픈 모델의 역할을 프런티어 경쟁이 아닌 보조 생태계 관점에서 설계한다.

❓ 열린 질문

오픈 모델을 공개하는 기업이 실제로 얻을 수 있는 경제적 보상은 사용량·인지도 확대만으로 충분한가?
폐쇄형 최고 모델과 오픈 모델의 6~18개월 격차가 장기 과제와 전문 영역으로 이동할수록 더 커질 가능성은 얼마나 큰가?
소형 특화 오픈 모델이 폐쇄형 에이전트를 보완할 때 가장 먼저 수요가 드러날 반복 업무는 무엇인가?