Modal

🖼️ 인포그래픽

🖼️ 4컷 인포그래픽

💡 한 줄 요약

Modal은 3억5500만 달러 규모의 시리즈 C 투자를 유치하며 AI 워크로드에 맞춘 범용 클라우드 인프라 플랫폼으로서 모델 소유, 에이전트 실행 환경, 대규모 추론·학습 루프를 핵심 성장축으로 제시했다.

📌 핵심 요약

Modal은 2023년 9월 이후 5배 성장했고 연환산 매출 3억 달러를 넘겼으며, General Catalyst와 Redpoint가 주도한 시리즈 C 라운드에서 3억5500만 달러를 조달했다.
회사는 전통적인 웹 애플리케이션 중심 클라우드가 AI 워크로드에 맞지 않는다고 보고, 단일 목적 GPU 클라우드가 아니라 다양한 AI 애플리케이션을 만들 수 있는 개발자용 기본 구성요소를 제공하는 플랫폼을 지향한다.
DoorDash와 Reducto 같은 기업들은 자체 데이터로 모델을 파인튜닝하고 RL을 실행하며 지연시간, 처리량, 비용에 맞춰 추론을 조정하는 방식으로 모델 소유권을 확대하고 있다.
Modal은 AI 생성 코드 실행 수요를 보고 Sandboxes를 1급 기능으로 만들었고, 최근 6개월 동안 에이전트 실행 환경의 필요성이 뚜렷해지면서 누적 10억 개 이상의 샌드박스가 실행됐다고 밝혔다.
앞으로 Modal은 저지연 추론, 학습과 추론 루프의 통합, 에이전트를 위한 컴퓨트 계층을 강화하며 자체 스토리지·컴퓨트 스택을 기반으로 개발자 경험을 개선하겠다고 설명했다.

🧩 주요 포인트

Modal은 2023년 9월 이후 5배 성장했고 연환산 매출 3억 달러를 넘겼으며, General Catalyst와 Redpoint가 주도한 시리즈 C 라운드에서 3억5500만 달러를 조달했다.
회사는 전통적인 웹 애플리케이션 중심 클라우드가 AI 워크로드에 맞지 않는다고 보고, 단일 목적 GPU 클라우드가 아니라 다양한 AI 애플리케이션을 만들 수 있는 개발자용 기본 구성요소를 제공하는 플랫폼을 지향한다.
DoorDash와 Reducto 같은 기업들은 자체 데이터로 모델을 파인튜닝하고 RL을 실행하며 지연시간, 처리량, 비용에 맞춰 추론을 조정하는 방식으로 모델 소유권을 확대하고 있다.
Modal은 AI 생성 코드 실행 수요를 보고 Sandboxes를 1급 기능으로 만들었고, 최근 6개월 동안 에이전트 실행 환경의 필요성이 뚜렷해지면서 누적 10억 개 이상의 샌드박스가 실행됐다고 밝혔다.
앞으로 Modal은 저지연 추론, 학습과 추론 루프의 통합, 에이전트를 위한 컴퓨트 계층을 강화하며 자체 스토리지·컴퓨트 스택을 기반으로 개발자 경험을 개선하겠다고 설명했다.

🧠 상세 정리

1. 시리즈 C 투자와 성장 지표

Modal은 시리즈 C 라운드에서 3억5500만 달러를 조달했고, 투자 후 기업가치는 46억5000만 달러라고 밝혔다. 회사는 9월 이후 5배 성장했으며 연환산 매출이 3억 달러를 넘어섰다고 설명한다. 이번 라운드는 General Catalyst와 Redpoint가 주도했고 Menlo, Bain Capital Ventures, Accel이 신규 투자자로 참여했다. 기존 주요 투자자들도 모두 참여해 Modal에 대한 신뢰를 다시 확인했다는 점을 강조했다.

2. AI 시대를 위한 새로운 클라우드 계층

Modal은 전통적인 웹 애플리케이션을 위해 만들어진 클라우드가 AI 워크로드에는 맞지 않는다는 문제의식에서 출발했다고 설명한다. 이 판단은 생성형 AI 혁명 이전부터 명확했으며, 모델과 기술이 발전할수록 더 타당해지고 있다고 본다. Modal이 지향하는 것은 단일 목적의 GPU 클라우드가 아니라 개발자가 넓은 범위의 AI 애플리케이션을 만들 수 있는 기본 요소를 갖춘 플랫폼이다. 현재 그 활용 형태는 저지연 탄력 추론, 동적 에이전트 런타임, 강화학습, 대규모 배치 작업 등으로 나타난다.

3. 프런티어 API 의존에서 모델 소유로의 이동

Modal은 앞서가는 팀들이 모델을 직접 소유하고 운영하는 방향으로 움직이고 있다고 진단한다. DoorDash 같은 디지털 네이티브 기업부터 Reducto 같은 AI 네이티브 기업까지, 자체 데이터를 활용해 파인튜닝하고 강화학습을 실행하며 추론의 지연시간, 처리량, 비용을 직접 조정하고 있다는 것이다. DeepSeek, Qwen 등 오픈웨이트 모델은 프로덕션 품질에 도달했고, vLLM과 SGLang 같은 추론 엔진도 함께 성숙했다고 설명한다. Modal은 이제 기업들이 성능을 희생하지 않고도 모델을 소유하고 서비스할 수 있는 전체 스택이 갖춰졌다고 본다.

4. 에이전트를 위한 실행 환경의 부상

Modal은 2023년에 사용자들이 AI가 생성한 코드를 Modal 위에서 실행하는 모습을 보기 시작했다고 밝혔다. 회사는 이것이 보편적 수요가 될 것이라고 판단하고, 신뢰할 수 없는 코드를 격리해 실행하는 Sandboxes를 핵심 기능으로 구축했다. 이후 2년이 지나 최근 6개월 동안 에이전트가 다양한 영역에 확산될 것이라는 흐름이 분명해졌다고 설명한다. DoorDash의 상인용 AI 에이전트, Ramp의 Inspect처럼 병합된 PR의 70%를 작성하는 코딩 에이전트, 병렬 환경 수천 개에서 실행되는 강화학습 워크로드, 대규모 훈련 실험을 수행하는 자동 연구 에이전트가 사례로 제시됐다.

5. 확장되는 AI 애플리케이션의 형태

Modal은 자신을 AI 워크로드의 근본 요구인 탄력적 컴퓨트, 안전한 격리, 프로그래밍 가능한 제어를 제공하는 범용 컴퓨트 플랫폼으로 설명한다. 개발자들은 같은 기본 요소를 조합해 서로 매우 다른 애플리케이션을 만든다. Physical Intelligence는 실시간 로봇 추론을 실행하고, Chai Discovery는 단백질 임베딩부터 항체 설계까지 신약 개발 파이프라인을 확장한다. Suno는 하루 수백만 곡을 생성하며 수천 개 GPU까지 확장했다가 거의 0에 가까운 수준으로 되돌리는 작업을 수행한다. Modal은 같은 원시 기능들이 완전히 다른 형태의 AI 서비스로 이어진다는 점을 강조한다.

6. 다음 단계: 추론, 학습 루프, 에이전트 컴퓨트

Modal은 지난 5년 동안 자체 스토리지와 컴퓨트 계층을 처음부터 구축하는 등 기술에 깊게 투자해왔다고 설명한다. 그 결과 GPU 스냅샷으로 콜드 스타트를 100배 개선하고, 전 세계 저지연 탄력 추론을 제공하며, 예약 없이도 수분 또는 수초 안에 0개에서 1000개 GPU로 확장하는 성과를 냈다고 말한다. 앞으로는 대규모 저지연 추론을 위해 서빙 기본 요소와 관측성을 강화하고, Flash Attention, vLLM, SGLang 등 오픈 추론 스택에도 기여할 계획이다. 또한 강화학습을 전체 모델 학습 생애주기의 자연스러운 확장으로 보고, 파인튜닝부터 프로덕션 서빙까지 더 많은 팀이 접근할 수 있게 만들겠다고 밝혔다.

7. 샌드박스와 권한 제어를 통한 에이전트 계층 확장

Modal은 Sandboxes가 이미 매출의 3분의 1 이상을 차지하고 있으며 고객들이 더 많은 기능을 요구하고 있다고 밝혔다. 이에 따라 샌드박스 표면적을 넓히고 수백만 개를 병렬로 실행할 수 있는 규모를 제공하려 한다. 회사는 에이전트 기반 개발이 이미 현실이 됐다고 보고, Modal이 코드로 구성된 플랫폼이라는 점이 에이전트가 작업하기 좋은 환경을 만든다고 설명한다. 동시에 위험을 줄이기 위해 고객이 에이전트에 필요한 능력만 부여할 수 있도록 세분화된 RBAC를 우선 제공하겠다고 밝혔다.

🧾 핵심 주장 / 시사점

Modal의 핵심 메시지는 단순 GPU 공급이 아니라 AI 워크로드의 실행·격리·확장·제어를 하나의 개발자 플랫폼으로 묶는 데 있다.
오픈웨이트 모델과 성숙한 추론 엔진의 결합은 기업들이 외부 API 사용을 넘어 자체 모델 운영으로 이동할 수 있는 조건을 만들고 있다.
샌드박스가 매출의 큰 비중을 차지한다는 점은 에이전트 시대의 병목이 모델 자체뿐 아니라 안전하고 확장 가능한 실행 환경에도 있음을 보여준다.

✅ 액션 아이템

Modal의 Series C 발표를 투자 소식이 아니라 AI workload용 cloud primitive 확장 신호로 보고, GPU, sandbox, batch job, agent runtime 수요가 어떻게 연결되는지 정리한다.
내부 AI agent, RL rollout, autoresearch, coding agent 같은 workload를 기존 web cloud와 비교해 어떤 인프라 요구사항이 다른지 분리한다.
Modal 도입을 검토할 때 valuation보다 cold start, autoscaling, cost control, environment isolation, developer workflow integration을 기준으로 평가한다.

❓ 열린 질문

AI cloud의 차별화는 GPU 공급량보다 agent와 RL workload를 실행하는 runtime primitive에서 더 크게 생길까?
Modal이 말하는 production cloud for AI는 기존 hyperscaler 위의 개발자 경험 계층일까, 아니면 새로운 독립 클라우드 범주일까?
에이전트와 autoresearch가 늘어날수록 기업은 고정 cluster보다 burst 가능한 실행 환경을 더 선호하게 될까?