The internet is being rebuilt for machines
Quick Summary
AI 에이전트가 순간적으로 대량의 검색·API 호출을 만들고 사라지는 방식으로 인터넷 트래픽을 바꾸면서, 클라우드 인프라는 인간 중심 설계에서 기계 생성 워크로드 중심 설계로 재편되고 있다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 요약
AI 에이전트가 순간적으로 대량의 검색·API 호출을 만들고 사라지는 방식으로 인터넷 트래픽을 바꾸면서, 클라우드 인프라는 인간 중심 설계에서 기계 생성 워크로드 중심 설계로 재편되고 있다.
📌 핵심 요약
- 기존 클라우드 인프라는 사람이 검색하고 클릭하고 스크롤하고 스트리밍하는 비교적 예측 가능한 사용 패턴을 전제로 설계됐지만, AI 에이전트는 짧은 시간에 여러 하위 에이전트를 만들고 수많은 데이터베이스·문서·API를 호출하는 전혀 다른 패턴을 보인다.
- Amazon은 이런 변화에 대응해 OpenSearch Serverless의 차세대를 출시했으며, 이 시스템은 에이전트 작업이 몰릴 때 즉시 확장하고 유휴 상태에서는 0까지 축소되도록 설계된 완전관리형 검색 및 벡터 데이터베이스다.
- Cloudflare에 따르면 최근 6개월간 전체 HTTP 트래픽의 31%가 봇이었고, 그중 약 4분의 1은 AI 크롤러, 검색 엔진, 어시스턴트에서 발생해 이미 기계 생성 트래픽의 비중이 상당한 수준에 이르렀다.
- Google은 개발자 콘퍼런스에서 사용자가 구매 조사, 여행 예약, 웹 탐색, 앱 상호작용 등을 AI 시스템에 위임할 수 있게 될 것이라고 밝혔고, 기업들도 내부 업무와 고객 대상 서비스에 에이전트를 배치하면서 기계 간 트래픽이 더 늘어날 전망이다.
- 이 변화는 Amazon뿐 아니라 Databricks, Snowflake, Microsoft, Cloudflare 등 인프라 기업 전반으로 확산되고 있으며, 더 많은 기업이 AI 에이전트를 배포할수록 기계 생성 워크로드에 맞춘 인프라 재설계 압력은 커질 것으로 보인다.
🧩 주요 포인트
- 기존 클라우드 인프라는 사람이 검색하고 클릭하고 스크롤하고 스트리밍하는 비교적 예측 가능한 사용 패턴을 전제로 설계됐지만, AI 에이전트는 짧은 시간에 여러 하위 에이전트를 만들고 수많은 데이터베이스·문서·API를 호출하는 전혀 다른 패턴을 보인다.
- Amazon은 이런 변화에 대응해 OpenSearch Serverless의 차세대를 출시했으며, 이 시스템은 에이전트 작업이 몰릴 때 즉시 확장하고 유휴 상태에서는 0까지 축소되도록 설계된 완전관리형 검색 및 벡터 데이터베이스다.
- Cloudflare에 따르면 최근 6개월간 전체 HTTP 트래픽의 31%가 봇이었고, 그중 약 4분의 1은 AI 크롤러, 검색 엔진, 어시스턴트에서 발생해 이미 기계 생성 트래픽의 비중이 상당한 수준에 이르렀다.
- Google은 개발자 콘퍼런스에서 사용자가 구매 조사, 여행 예약, 웹 탐색, 앱 상호작용 등을 AI 시스템에 위임할 수 있게 될 것이라고 밝혔고, 기업들도 내부 업무와 고객 대상 서비스에 에이전트를 배치하면서 기계 간 트래픽이 더 늘어날 전망이다.
- 이 변화는 Amazon뿐 아니라 Databricks, Snowflake, Microsoft, Cloudflare 등 인프라 기업 전반으로 확산되고 있으며, 더 많은 기업이 AI 에이전트를 배포할수록 기계 생성 워크로드에 맞춘 인프라 재설계 압력은 커질 것으로 보인다.
🧠 상세 정리
1. 인간 중심 인터넷과 다른 에이전트의 사용 패턴
원문은 클라우드 인프라가 오랫동안 인간의 행동을 기준으로 설계됐다는 점에서 출발한다. 사람은 검색하고, 클릭하고, 스크롤하고, 스트리밍하는 일을 비교적 일정하고 예측 가능한 흐름으로 수행한다. 반면 AI 에이전트는 특정 작업이 주어지면 여러 하위 에이전트를 동시에 띄우고, 수백 개의 데이터베이스를 조회하며, 문서를 검색하고, API를 몇 초 안에 호출할 수 있다. 그리고 작업이 끝나면 등장했을 때만큼 빠르게 사라진다. 이처럼 에이전트는 지속적이고 완만한 사용자가 아니라, 갑작스러운 폭증과 급격한 유휴 상태를 반복하는 새로운 종류의 인프라 사용자로 제시된다.
2. Amazon의 OpenSearch Serverless 재설계
Amazon은 이러한 전제를 바탕으로 클라우드 인프라의 핵심 구성요소 중 하나를 다시 설계하고 있다고 설명된다. 기사에 따르면 AWS는 차세대 OpenSearch Serverless를 출시했는데, 이는 대규모 정보 저장과 검색을 위한 완전관리형 검색 및 벡터 데이터베이스다. 이 시스템은 특히 에이전트형 워크로드를 염두에 두고 설계됐으며, 에이전트가 작업을 촉발할 때 즉시 확장하고 사용하지 않을 때는 0까지 축소될 수 있다고 AWS는 밝혔다. 핵심은 검색과 검색 기반 데이터 접근이 더 이상 사람의 요청만을 처리하는 기능이 아니라, 에이전트가 대량으로 정보를 회수하고 도구를 호출하는 흐름의 기반이 되고 있다는 점이다.
3. 기계 생성 트래픽 증가와 업계의 위기감
이번 출시는 인간 주도 인터넷을 전제로 만든 인프라가 에이전트가 늘어나는 세계에서는 충분히 맞지 않는다는 업계의 인식 변화를 보여준다. AI 에이전트가 아직 전체 인터넷 활동에서 차지하는 비중은 상대적으로 작지만, 기계가 생성하는 트래픽 자체는 이미 의미 있는 규모에 도달했다. Cloudflare는 최근 6개월 동안 전체 HTTP 트래픽의 31%가 봇에서 나왔다고 밝혔다. 또 이 기간 봇 요청 중 약 4분의 1은 AI 크롤러, 검색 엔진, 어시스턴트에서 발생했다. Cloudflare의 Lai Yi Ohlsen은 2027년 상반기 어느 시점에는 비인간 트래픽이 인간 트래픽을 넘어설 것이라고 전망했다.
4. 소비자용 에이전트와 기업 내부 배치의 확산
원문은 에이전트 트래픽 증가가 소비자용 AI 서비스에만 국한되지 않는다고 설명한다. Google은 I/O 개발자 콘퍼런스에서 사용자가 구매 조사, 여행 예약, 웹 탐색, 앱 상호작용 같은 일을 AI 시스템에 위임할 수 있게 될 것이라고 밝혔다. 이런 기능은 일반 사용자가 직접 웹을 돌아다니는 대신 AI가 대신 조사하고 실행하는 사용 방식을 의미한다. 동시에 기업들도 내부 업무와 고객 대상 서비스에 에이전트를 배치하고 있다. 그 결과 표면적으로는 사용자 한 명의 요청처럼 보이더라도, 뒤에서는 여러 시스템이 서로 정보를 검색하고 도구를 호출하는 새로운 종류의 기계 생성 트래픽이 만들어진다.
5. 갑작스러운 폭증과 유휴 비용 문제
Amazon OpenSearch Service의 총괄 매니저 Tia White는 에이전트가 실험 단계에서 실제 운영 환경으로 이동하고 있으며, 기존 인프라가 설계되지 않았던 트래픽 패턴을 만든다고 말했다. 에이전트는 예고 없이 트래픽을 폭증시키고, 아무런 신호 없이 유휴 상태로 들어갈 수 있다. 기업 입장에서는 이런 변동을 처리할 수 있는 검색 인프라가 필요하지만, 동시에 쓰지 않는 컴퓨트 자원에 계속 비용을 지불하고 싶지는 않다. 이전 Serverless 버전에서도 스토리지와 컴퓨트가 결합돼 있어 최소 하나의 인스턴스를 계속 실행해야 했다고 White는 설명했다. 이 때문에 사용 여부와 무관하게 유휴 컴퓨트를 확보해 두는 구조적 비용이 발생했다.
6. 컴퓨트와 스토리지 분리, 그리고 클라우드 업계의 재편
새로운 OpenSearch Serverless의 핵심 기술 변화는 컴퓨트와 스토리지를 분리한 것이다. 이를 통해 에이전트 트래픽이 갑자기 몰릴 때 컴퓨트를 몇 초 안에 확장하고, 에이전트가 유휴 상태일 때는 0까지 줄여 고객이 유휴 컴퓨트 비용을 내지 않도록 한다. 원문은 이를 사용하지 않는 주차 공간에 계속 돈을 내는 방식에서, 실제 사용한 만큼 내는 미터식 주차 방식으로 바뀌는 것에 비유한다. 출시 시점에는 Vercel, Kiro 같은 AI 개발 플랫폼과 기본 통합돼 개발자가 인프라를 직접 관리하지 않고도 에이전트용 검색 및 벡터 백엔드를 배포할 수 있게 된다. Databricks, Snowflake, Microsoft, Cloudflare도 각자의 방식으로 AI 메모리, 검색, 에이전트 확장성 문제에 대응하고 있어, 클라우드 업계 전반이 기계 생성 워크로드에 맞춰 재편되는 흐름이 드러난다.
🧾 핵심 주장 / 시사점
- AI 에이전트의 확산은 단순히 애플리케이션 기능의 변화가 아니라, 검색·저장·API 호출·확장 비용 구조를 포함한 인프라 설계 원칙 자체를 바꾸는 변화로 볼 수 있다.
- 에이전트 워크로드의 핵심 과제는 평균 트래픽보다 순간 폭증과 급격한 유휴 상태를 어떻게 비용 효율적으로 처리하느냐이며, 컴퓨트와 스토리지의 분리는 이 문제에 대한 직접적인 대응이다.
- 기계 생성 트래픽이 인간 트래픽을 넘어설 가능성이 제기되는 만큼, 앞으로 인터넷 서비스의 성능·비용·보안·운영 전략은 사람보다 에이전트의 행동 패턴을 더 중요하게 고려하게 될 수 있다.
✅ 액션 아이템
- AI 에이전트가 만드는 순간 폭증형 검색·API 호출 패턴을 기존 사용자 트래픽 모델과 분리해 capacity planning 기준을 다시 잡는다.
- OpenSearch Serverless처럼 컴퓨트와 스토리지를 분리하고 유휴 시 0까지 축소되는 구조가 검색·벡터 DB 비용을 얼마나 줄일 수 있는지 현재 워크로드로 시뮬레이션한다.
- Cloudflare가 제시한 봇/AI 크롤러 트래픽 비중을 참고해 rate limiting, bot policy, cache, observability를 사람 사용자와 에이전트 사용자로 나누어 설계한다.
❓ 열린 질문
- 인터넷 트래픽의 주요 사용자가 사람에서 AI 에이전트로 이동하면, 클라우드 인프라의 병목은 compute, storage, search, API gateway 중 어디에서 먼저 드러날까?
- 에이전트가 작업 완료 후 빠르게 사라지는 패턴에서는 항상 켜진 서버보다 serverless search/vector DB가 어느 수준까지 비용 우위를 가질까?
- Cloudflare, Amazon, Google이 각각 보는 “기계 생성 인터넷”의 위험과 기회는 보안·검색·광고·커머스 모델을 어떻게 바꿀까?