Welcome to Agents Week
Quick Summary
Cloudflare는 에이전트 시대의 인터넷은 기존 클라우드와 컨테이너 중심 모델만으로는 감당하기 어렵고, isolates 기반 실행 환경·보안·정체성·경제 모델·개발자 경험을 함께 재설계해야 한다고 주장한다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 요약
Cloudflare는 에이전트 시대의 인터넷은 기존 클라우드와 컨테이너 중심 모델만으로는 감당하기 어렵고, isolates 기반 실행 환경·보안·정체성·경제 모델·개발자 경험을 함께 재설계해야 한다고 주장한다.
📌 핵심 요약
- Cloudflare는 Agents Week를 시작하며, 인터넷과 클라우드가 스마트폰 시대의 대규모 사용자 처리에는 적응했지만 AI 에이전트 시대의 일대일 실행 모델에는 맞지 않는다고 설명한다.
- 기존 애플리케이션은 한정된 수의 앱 인스턴스가 많은 사용자를 처리하는 구조였지만, 에이전트는 사용자별·작업별로 고유한 실행 환경을 필요로 하며 LLM이 코드 경로와 도구 호출을 동적으로 결정한다.
- 미국 지식노동자만 기준으로 해도 동시 실행 에이전트 수요는 수천만 세션에 이를 수 있고, 이를 컨테이너로 처리하면 필요한 CPU와 비용이 급격히 커져 전 세계 규모에서는 계산 격차가 훨씬 커진다.
- Cloudflare는 Workers와 V8 isolates가 밀리초 단위 시작, 낮은 메모리 사용, 안전한 샌드박싱, 높은 하드웨어 효율 덕분에 에이전트 시대의 대량·일회성 실행 환경에 더 적합한 기본 단위라고 본다.
- 동시에 전환기에는 컨테이너, 브라우저 렌더링, 기존 웹·API와의 호환도 필요하므로 Cloudflare는 오늘 작동하는 방식과 내일 필요한 방식 사이를 잇는 플랫폼을 만들겠다고 밝힌다.
🧩 주요 포인트
- Cloudflare는 Agents Week를 시작하며, 인터넷과 클라우드가 스마트폰 시대의 대규모 사용자 처리에는 적응했지만 AI 에이전트 시대의 일대일 실행 모델에는 맞지 않는다고 설명한다.
- 기존 애플리케이션은 한정된 수의 앱 인스턴스가 많은 사용자를 처리하는 구조였지만, 에이전트는 사용자별·작업별로 고유한 실행 환경을 필요로 하며 LLM이 코드 경로와 도구 호출을 동적으로 결정한다.
- 미국 지식노동자만 기준으로 해도 동시 실행 에이전트 수요는 수천만 세션에 이를 수 있고, 이를 컨테이너로 처리하면 필요한 CPU와 비용이 급격히 커져 전 세계 규모에서는 계산 격차가 훨씬 커진다.
- Cloudflare는 Workers와 V8 isolates가 밀리초 단위 시작, 낮은 메모리 사용, 안전한 샌드박싱, 높은 하드웨어 효율 덕분에 에이전트 시대의 대량·일회성 실행 환경에 더 적합한 기본 단위라고 본다.
- 동시에 전환기에는 컨테이너, 브라우저 렌더링, 기존 웹·API와의 호환도 필요하므로 Cloudflare는 오늘 작동하는 방식과 내일 필요한 방식 사이를 잇는 플랫폼을 만들겠다고 밝힌다.
🧠 상세 정리
1. Agents Week의 문제의식: 다음 인터넷을 위한 인프라
글은 Cloudflare의 사명이 더 나은 인터넷을 만드는 데 있으며, 때로는 현재의 인터넷을 위해, 때로는 곧 다가올 인터넷을 위해 구축해야 한다는 선언으로 시작한다. Agents Week는 바로 그 ‘다음’에 해당하는 에이전트 시대를 겨냥한 행사로 제시된다. 핵심 문제의식은 인터넷과 클라우드가 AI 에이전트를 전제로 설계되지 않았다는 점이다. 따라서 이 글은 단순한 제품 소개가 아니라, 에이전트가 보편화될 때 기존 인프라 가정이 어디서 깨지는지를 설명하는 서론 역할을 한다.
2. 스마트폰 시대가 만든 기존 클라우드 모델
Cloudflare는 오늘날의 클라우드가 직전의 큰 기술 전환, 즉 스마트폰 확산의 산물이라고 설명한다. 스마트폰은 인터넷을 모두의 주머니에 넣었고, 사용자는 항상 연결되어 있으며 즉각적인 응답을 기대하게 되었다. 이에 따라 애플리케이션은 훨씬 더 많은 사용자를 처리해야 했고, 인프라도 같은 방향으로 진화했다. 업계가 택한 해법은 더 많은 사용자에게 더 많은 애플리케이션 복사본을 제공하는 것이었고, 애플리케이션이 복잡해지자 이를 마이크로서비스로 나누어 각 팀이 독립적으로 운영할 수 있게 했다.
3. 기존 확장 방식의 핵심: 하나의 앱이 많은 사용자를 처리
기존 클라우드 확장 방식의 핵심 원리는 유한한 수의 애플리케이션이 많은 사용자를 상대한다는 ‘일대다’ 모델이었다. Kubernetes와 컨테이너는 이런 모델에 잘 맞았다. 인스턴스를 쉽게 띄우고, 로드밸런싱하고, 필요 없으면 종료할 수 있었기 때문이다. 단일 인스턴스가 여러 사용자를 처리할 수 있었고, 사용자 수가 수십억 명으로 늘어도 관리해야 할 대상의 수는 여전히 유한한 범위에 머물렀다. Cloudflare는 바로 이 전제가 에이전트에서 깨진다고 말한다.
4. 에이전트가 기존 애플리케이션과 다른 이유
에이전트는 이전의 애플리케이션과 달리 일대일 구조를 가진다. 각 에이전트는 한 사용자를 위해, 하나의 작업을 수행하는 고유한 인스턴스다. 전통적 애플리케이션이 누가 사용하든 대체로 같은 실행 경로를 따르는 반면, 에이전트는 LLM이 코드 경로를 결정하고, 도구를 동적으로 호출하며, 접근 방식을 조정하고, 작업이 끝날 때까지 상태를 유지해야 한다. 글은 이를 식당과 개인 셰프의 차이에 비유한다. 식당은 고정 메뉴를 대량으로 제공하는 데 최적화되어 있지만, 개인 셰프는 매번 다른 재료와 도구와 방식을 필요로 하므로 같은 주방 구조로 운영하기 어렵다는 것이다.
5. 코딩 에이전트에서 모두의 에이전트로 확장될 때의 계산 문제
지난 1년 동안 에이전트는 빠르게 확산되었고, 특히 개발자가 초기 수용자인 만큼 코딩 에이전트가 앞서 나갔다. 현재 많은 코딩 에이전트는 LLM에 파일시스템, git, bash, 임의 바이너리 실행 능력을 제공하기 위해 컨테이너를 띄우는 방식으로 작동한다. 그러나 글은 코딩 에이전트가 시작일 뿐이라고 본다. 에이전트가 행정 보조, 리서치 분석, 고객 서비스, 개인 일정 관리 등 비기술 사용자 영역으로 확산되면 필요한 동시 실행 규모가 급격히 커진다. 미국의 1억 명 이상 지식노동자가 약 15% 동시성으로 에이전트를 쓴다고 가정하면 약 2,400만 동시 세션이 필요하다는 계산이 제시된다.
6. 컨테이너 없는 서버리스와 Workers의 재해석
Cloudflare는 8년 전 Workers를 출시하며 컨테이너 없는 서버리스 컴퓨트에 베팅했다고 설명한다. 당시 동기는 실용적이었다. 속도에 민감한 고객을 위해 콜드스타트가 없는 가벼운 컴퓨트가 필요했기 때문이다. Workers는 컨테이너가 아니라 V8 isolates를 기반으로 했고, 그 결과 시작이 빠르고 운영 비용이 낮으며 ‘띄우고, 실행하고, 종료하는’ 패턴에 적합했다. 글은 당시에는 이 모델이 에이전트 시대와 이렇게 잘 맞을 줄 예상하지 못했다고 말한다. 컨테이너가 모든 에이전트에게 완비된 대형 주방을 제공하는 것이라면, isolates는 특정 작업에 필요한 조리대와 버너와 칼만 제공하는 방식으로 묘사된다.
7. isolate가 에이전트 실행의 기본 단위가 되어야 하는 이유
Cloudflare는 장기 실행 애플리케이션 수천 개가 아니라 일시적이고 단일 목적을 가진 실행 환경 수십억 개를 지원해야 하는 세계에서는 isolates가 적절한 기본 단위라고 주장한다. 각 isolate는 밀리초 단위로 시작하고, 안전하게 샌드박싱되며, 같은 하드웨어에서 컨테이너보다 훨씬 더 많은 수를 실행할 수 있다. 글은 Dynamic Workers 오픈 베타를 언급하며, 런타임에 온디맨드로 실행 환경을 띄울 수 있다고 설명한다. isolate는 몇 밀리초 안에 시작하고 몇 메가바이트 메모리를 사용해, 컨테이너보다 대략 100배 빠르고 최대 100배 메모리 효율적이라고 제시된다. 이는 에이전트가 초기 수용자를 넘어 모두에게 보급되려면 비용 구조가 맞아야 한다는 주장과 연결된다.
8. 전환기에는 낡은 모델과 새 모델이 함께 존재한다
글은 올바른 미래 기반을 만드는 것이 중요하지만 아직 그 미래에 완전히 도달한 것은 아니라고 말한다. 모든 패러다임 전환기에는 새 기술을 낡은 모델 안에서 작동시키려는 시도가 나타난다. 초기 자동차가 ‘말 없는 마차’로 불렸고, 초기 웹사이트가 디지털 브로슈어였으며, 초기 모바일 앱이 축소된 데스크톱 UI였던 것처럼 지금의 에이전트도 과도기적 형태를 보인다. 예컨대 사람 눈을 위해 설계된 웹사이트를 탐색하도록 에이전트에게 헤드리스 브라우저를 주거나, 기존 REST API를 얇게 감싼 MCP 서버를 만들거나, 사람이 맞는지 묻는 CAPTCHA와 행동 지문 인식으로 에이전트를 다루는 상황이 그렇다. Cloudflare는 이것이 이상한 일이 아니라 전환의 자연스러운 모습이라고 본다.
9. 보안, 정체성, 권한 모델은 실행 환경 안에 내장되어야 한다
에이전트가 이메일을 읽고, 코드에 작업하고, 금융 서비스와 상호작용하게 된다면 보안은 나중에 덧붙이는 층이 아니라 실행 모델 자체에 포함되어야 한다. 글은 CISO들이 이 문제를 가장 먼저 직면하고 있다고 설명한다. 에이전트를 조직 전체에 배포하면 생산성 향상은 분명하지만, 현재는 프롬프트 인젝션, 데이터 유출, 무단 API 접근, 불투명한 도구 사용 같은 위험이 크다. 개발자의 코딩 에이전트는 저장소와 배포 파이프라인에 접근해야 하고, 기업 고객 서비스 에이전트는 내부 API와 사용자 데이터에 접근해야 한다. 기존 자격증명, 네트워크 정책, 접근 제어를 억지로 엮는 방식만으로는 자율 소프트웨어에 맞는 보안 모델을 만들기 어렵다는 것이 글의 논지다.
10. 에이전트 시대의 경제, 거버넌스, 개발자 플랫폼
글은 컴퓨트와 보안 외에도 경제와 거버넌스가 에이전트 시대의 중요한 축이라고 말한다. 에이전트가 사람을 대신해 글을 읽고, API를 소비하고, 서비스에 접근한다면 콘텐츠와 서비스를 만든 사람들이 조건을 설정하고 정당하게 보상받을 수 있어야 한다. 기존 웹의 경제 모델은 광고, 페이월, 구독처럼 인간의 주의를 중심으로 구성되어 있지만, 에이전트는 그런 의미의 주의를 갖지 않고 광고를 보거나 쿠키 배너를 클릭하지 않는다. Cloudflare는 게시자와 콘텐츠 소유자가 에이전트의 상호작용 방식을 정책으로 설정하고 집행할 수 있는 도구가 필요하다고 본다. 또한 개발자 플랫폼도 인간 개발자뿐 아니라 에이전트가 최신 모범 사례와 도구, CLI를 발견하고 코드 작성에서 배포까지 이어갈 수 있도록 진화해야 한다고 설명한다.
🧾 핵심 주장 / 시사점
- 핵심 전환은 ‘더 많은 사용자에게 더 많은 앱 복사본을 제공하는 문제’에서 ‘각 사용자와 작업마다 별도 실행 환경을 제공하는 문제’로 바뀌는 데 있다.
- Cloudflare가 isolates를 강조하는 이유는 단순한 성능 개선이 아니라 에이전트를 대중화할 때 발생하는 동시성·비용·시작 지연 문제를 동시에 해결하려는 인프라 논리다.
- 에이전트 시대의 플랫폼 경쟁은 컴퓨트만이 아니라 보안, 권한, 정체성, 콘텐츠 보상, 개발 워크플로까지 묶어 제공할 수 있는지에 달려 있다는 메시지가 강하다.
✅ 액션 아이템
- 에이전트 서비스를 설계할 때 컨테이너 기반 장기 실행 모델과 V8 isolate 기반 단기 실행 모델의 시작 지연, 메모리 사용량, 동시성 비용을 비교한다.
- 에이전트가 웹사이트·API·콘텐츠와 상호작용할 때 필요한 권한, 정체성, 접근 제어, 보상 정책을 실행 환경 설계 단계에서 함께 정의한다.
- 사람을 위한 웹을 에이전트가 억지로 탐색하게 하는 임시 해법과, 에이전트가 직접 발견·호출·배포할 수 있는 개발자 플랫폼 구조를 구분해 로드맵을 세운다.
❓ 열린 질문
- 에이전트가 사용자별·작업별로 짧게 실행되는 세계에서 컨테이너보다 isolate가 유리한 경계는 어디까지일까?
- 프롬프트 인젝션, 데이터 유출, 무단 API 접근을 막으려면 에이전트 런타임 안에 어떤 보안 primitive가 기본으로 들어가야 할까?
- 인간의 주의와 광고를 중심으로 만든 웹 경제가 에이전트 트래픽으로 바뀔 때 게시자와 서비스 제공자는 어떤 정책 집행 도구가 필요할까?