Browse.sh, a catalog of browser skills for the Agentic future

🖼️ 인포그래픽

Browse.sh, a catalog of browser skills for the Agentic future 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 요약

Browse.sh는 브라우저 에이전트가 매번 같은 웹사이트 탐색을 다시 학습하지 않도록, 검증된 웹 작업 절차를 재사용 가능한 “브라우저 스킬”로 축적하려는 오픈 카탈로그다.

📌 핵심 요약

Kyle Jeong은 브라우저 에이전트의 핵심 병목이 추론 능력 부족이 아니라, 이전 실행에서 배운 웹사이트별 절차를 보존하지 못하는 “기억의 부재”라고 주장한다.
Browse.sh는 실제 웹사이트 탐색 방법을 담은 100개 이상의 브라우저 스킬 카탈로그와, 이를 설치·실행하는 오픈소스 Browse CLI로 구성된다.
각 스킬은 SKILL.md와 보조 스크립트로 이루어진 플레이북이며, 셀렉터, API 엔드포인트, 예외 처리, 사이트별 함정 등을 사람이 읽고 에이전트가 실행할 수 있는 형태로 담는다.
Browserbase는 Craigslist 작업 벤치마크에서 일반 에이전트 루프 대비 Browse.sh 스킬 사용 시 실행 비용이 약 45% 줄었다고 설명한다.
저자는 Claude Code, Cursor, Codex 등에서 브라우저를 조작하는 에이전트가 확산되는 만큼, 웹 작업 지식을 재사용 가능한 단위로 축적하는 “스킬”이 새로운 기본 단위가 될 수 있다고 본다.
Browse.sh의 장기 비전은 더 똑똑한 모델만 기다리는 것이 아니라, 에이전트가 배운 것을 축적하고 공유하는 기억 계층을 만드는 데 있다.

🧩 주요 포인트

Browse.sh는 “브라우저 에이전트가 매번 처음부터 사이트를 탐색하는 문제”를 해결하려는 제품이다.
스킬은 벡터 임베딩이나 스크린샷 기록이 아니라, 사람이 읽을 수 있는 마크다운 플레이북과 필요한 보조 스크립트로 구성된다.
Autobrowse는 실제 작업을 반복 실행하며 더 싸고 빠른 경로로 수렴한 뒤, 그 결과를 지속 가능한 스킬로 만든다.
저자는 웹 자동화의 비용 문제를 단순 토큰 최적화가 아니라 “발견 비용을 반복 지불하는 구조”의 문제로 본다.
Browse.sh는 출시 시점에 마켓플레이스, 음식·외식, 여행, 정부 포털, 개발자 도구, 엔터프라이즈 SaaS 등 100개 스킬을 제공한다고 설명한다.
원문의 핵심 시사점은 브라우저 에이전트의 경쟁력이 즉석 추론뿐 아니라, 사이트별 실행 지식을 어떻게 보존·감사·공유하느냐에 달려 있다는 점이다.

🧠 상세 정리

1. 문제 정의: 브라우저 에이전트는 매번 같은 사이트를 다시 배운다

원문은 현재 브라우저 에이전트가 Claude Code, Cursor, Codex 같은 개발 환경과 AI 제품 전반으로 확산되고 있다고 진단한다. 많은 제품이 “모델이 브라우저를 직접 조작하게 하는” 기능을 제공하지만, 저자가 보기에 공통적인 비효율이 있다. 에이전트가 웹사이트를 열고, 버튼을 찾고, 클릭하고, 응답을 파싱하고, 세션을 닫은 뒤, 다음 실행에서는 그 과정을 다시 처음부터 반복한다는 것이다. 이 문제는 단순히 첫 실행이 오래 걸린다는 수준이 아니다. 같은 웹사이트와 같은 작업을 수십 번, 수백 번 반복해도 이전 실행에서 발견한 구조가 지속 가능한 산출물로 남지 않는다. 저자는 이를 “discovery tax”, 즉 발견 비용이 반복해서 청구되는 구조로 표현한다. 웹 자동화에서 매번 새로 탐색하는 비용이 누적되면 토큰 비용, 실행 시간, 운영 복잡도가 모두 증가한다.

2. Browse.sh의 제안: 웹 탐색 지식을 스킬로 저장한다

Browse.sh는 이 반복 학습 문제를 해결하기 위해 공개 브라우저 스킬 카탈로그를 제공한다. 사용자는 browse.sh에서 특정 사이트나 작업을 검색하고, 필요한 스킬을 미리 확인한 뒤, CLI 명령으로 설치할 수 있다. Browse CLI는 에이전트가 브라우저를 구동하고, 페이지를 가져오고, 웹을 검색하고, 필요한 스킬을 불러오는 도구 역할을 한다. 중요한 점은 Browse.sh가 단순한 자동화 스크립트 저장소가 아니라는 점이다. 저자는 스킬을 “브라우저 워크플로를 안정적으로 반복하기 위한 플레이북”으로 설명한다. 스킬 안에는 정확한 단계, 주의해야 할 함정, API 엔드포인트, CSS 셀렉터, 폴백 전략 등이 담긴다. 즉, 에이전트가 사이트를 탐색하며 발견한 절차적 지식을 다시 사용할 수 있는 형태로 고정하는 것이 핵심이다.

3. 스킬의 형식: 사람이 읽고 에이전트가 실행하는 플레이북

Browse.sh의 스킬은 기본적으로 SKILL.md 파일과 필요한 보조 스크립트로 구성된다. 원문은 이 접근이 벡터 임베딩이나 스크린샷 모음이 아니라 “그냥 plain text”라는 점을 강조한다. 사람이 읽을 수 있고, 에이전트가 그대로 실행할 수 있는 형태라는 것이다. 예를 들어 Craigslist 스킬을 로드한 에이전트는 검색 페이지가 JavaScript로 렌더링된다는 사실이나, sapi.craigslist.org에 숨겨진 JSON API가 있다는 점을 다시 30턴 동안 탐색할 필요가 없다. 해당 지식이 스킬에 이미 들어 있기 때문에 에이전트는 그 내용을 읽고 곧바로 실행 경로를 따라갈 수 있다. 여기서 기존 방식과의 차이는 분명하다. 일반 에이전트 루프는 현재 화면을 보고 즉석에서 판단하지만, Browse.sh 방식은 과거에 검증된 사이트별 실행 지식을 먼저 불러온다.

4. 왜 중요한가: 추론보다 기억이 비용 구조를 바꾼다

저자는 브라우저 에이전트를 프로덕션에 배포해본 팀이라면 이 문제를 익숙하게 느낄 것이라고 말한다. 첫 실행에서는 에이전트가 사이트를 돌아다니며 결국 작업을 완료하는 모습이 흥미롭게 보일 수 있다. 그러나 두 번째, 백 번째 실행에서도 거의 같은 탐색을 반복한다면 비용 그래프는 계속 상승하고, 팀원에게 “이 작업은 이렇게 한다”고 전달할 수 있는 명확한 산출물은 남지 않는다. 원문에서 제시된 Craigslist 벤치마크는 이 주장을 뒷받침하는 사례다. 일반 에이전트 루프가 listing 검색을 수행할 때 실행당 약 0.22달러가 들었고, 네 번의 Autobrowse 반복 이후 생성된 Browse.sh 스킬은 같은 작업을 약 0.12달러에 수행했다고 설명한다. 저자는 이 약 45% 비용 감소가 더 나은 “기억”에서 나온다고 본다. 에이전트가 숨겨진 엔드포인트, 배열 디코딩 방식, 지리적 범위 우회 등을 매번 다시 발견하지 않고, 가장 짧고 안정적인 경로를 재사용하기 때문이다.

5. Autobrowse: 실제 작업을 반복해 스킬로 수렴시키는 시스템

Browse.sh의 각 스킬은 Autobrowse를 통해 만들어진다고 설명된다. 사용자가 실제 사이트에서 실제 작업을 주면, 에이전트가 작업을 끝까지 실행하고, 자신의 실행 흔적을 분석하고, 전략을 반복적으로 개선한다. 이 과정은 우연히 한 번 성공하는 수준이 아니라, 워크플로가 안정적으로 수렴할 때까지 이어진다. 이후 그 결과가 지속 가능한 스킬로 작성된다. 이 구조는 기존의 수작업 Playwright 스크립트 작성과도 차이가 있다. 원문은 고객들이 에이전트가 이미 해결한 워크플로를 다시 사람이 Playwright 스크립트로 작성하는 장면을 봤다고 말한다. Browse.sh의 접근은 에이전트가 실제로 학습한 사이트별 지식을 스킬 형태로 보존해, 사람과 다른 에이전트가 함께 재사용할 수 있도록 하는 것이다. 다만 원문은 Autobrowse가 모든 사이트에서 항상 성공한다는 식의 보편적 검증 주장을 하지는 않는다.

6. 스킬이 새로운 기본 단위가 된다는 주장

저자는 업계가 이미 “스킬”이라는 방향으로 수렴하고 있다고 본다. Claude Code가 스킬을 제공하고, OpenAI Codex도 이를 지원하며, AgentSkills 표준이 관심을 얻고 있다는 점을 언급한다. 주요 에이전트 프레임워크들이 특정 작업 수행 방법을 담은 마크다운 파일을 로드하는 형태를 추가하고 있다는 것이다. 그중에서도 브라우저 스킬은 자연스러운 다음 단계로 제시된다. 웹은 사용자 에이전트에 따라 다르게 렌더링되고, JavaScript 뒤에 콘텐츠를 숨기며, 문서화되지 않은 엔드포인트를 사용하고, CAPTCHA를 띄우고, 어느 날 갑자기 플로우를 바꿀 수 있다. 일반 에이전트는 이런 문제를 그때그때 처리할 수 있지만, 세션이 끝나면 배운 내용을 잊는다. Browse.sh는 바로 이 학습 결과를 다음 에이전트, 다음 팀원, 다음 고객이 다시 활용할 수 있는 형태로 붙잡아두려 한다.

7. 적용 대상과 전략적 의미

Browse.sh는 AI 엔지니어, 제품팀, 플랫폼팀, Claude Code·Cursor·Codex 사용자를 주요 대상으로 제시한다. AI 엔지니어에게는 QA, 데이터 추출, 폼 작성, 모니터링 같은 웹 자동화 워크플로에 사용할 수 있는 재사용 지식을 제공한다. 제품팀에게는 블랙박스식 에이전트 실행 대신 결정론적이고 감사 가능한 플레이북을 제공한다. 플랫폼팀에게는 에이전트 플릿 전체의 토큰 비용과 지연 시간을 줄이는 수단이 될 수 있다. 전략적으로 보면 Browse.sh의 thesis는 “모델이 더 좋아지면 브라우저 에이전트가 저절로 해결된다”는 관점에 대한 반론이다. 저자는 모델이 좋아지는 흐름을 부정하지 않는다. 다만 완벽한 모델이라도 특정 사이트를 처음 방문하면 그 사이트의 가장 빠른 경로를 발견해야 하며, 배운 것을 저장할 장소가 없다면 매번 새 출발이 된다고 본다. 따라서 브라우저 에이전트의 진짜 해법은 더 나은 추론만이 아니라, 사람이 감사할 수 있고 에이전트가 실행할 수 있는 기억의 축적이라는 주장이다.

🧾 핵심 주장 / 시사점

원문의 핵심 thesis는 브라우저 에이전트의 병목이 지능 부족이 아니라 “사이트별 실행 지식을 저장하지 못하는 기억 부족”이라는 점이다.
Browse.sh는 웹사이트 탐색 지식을 마크다운 기반 스킬로 표준화해, 에이전트 실행 비용과 반복 탐색을 줄이려는 시도다.
기존 브라우저 자동화가 즉석 탐색 또는 사람이 작성한 스크립트에 의존했다면, Browse.sh는 에이전트가 발견한 경로를 감사 가능한 플레이북으로 남기는 방식을 제안한다.
원문 기반 추론으로는, 브라우저 에이전트 시장에서 앞으로 중요한 차별점이 모델 성능뿐 아니라 스킬 카탈로그의 품질, 최신성, 검증 상태가 될 가능성이 있다.
다만 사이트 변경, CAPTCHA, 접근 제한, 비공식 API 의존성 같은 요소는 스킬의 장기 안정성과 유지보수 비용을 계속 시험할 수 있다.

✅ 액션 아이템

Browse.sh에서 현재 제공되는 100개 브라우저 스킬의 카테고리, verified 상태, 대상 사이트 구성을 확인한다.
Browse CLI를 설치한 뒤, Craigslist나 GitHub처럼 원문에 언급된 스킬을 하나 선택해 SKILL.md 구조와 보조 스크립트 포함 여부를 검토한다.
Autobrowse가 생성한 스킬이 어떤 기준으로 “graduated” 상태가 되는지, 반복 횟수·검증 방식·실패 처리 기준을 확인한다.
내부 웹 자동화 작업 중 반복 탐색 비용이 큰 워크플로를 골라 Browse.sh 스킬 방식으로 문서화할 수 있는지 평가한다.