I am Switching to Hermes Agent
Quick Summary
Hermes Agent는 상호작용 이력을 보존하고 자율 스킬을 생성·개선하는 학습형 아키텍처 로, 기존 stateless 에이전트 프레임워크와 근본적으로 다른 방향을 제시한다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 4컷 인포그래픽

💡 한 줄 결론
Hermes Agent는 상호작용 이력을 보존하고 자율 스킬을 생성·개선하는 학습형 아키텍처로, 기존 stateless 에이전트 프레임워크와 근본적으로 다른 방향을 제시한다.
📌 핵심 요점
- Stateless 한계와 학습형 아키텍처 — 기존 대부분의 에이전트는 요청-응답 후 상태를 버리지만, Hermes는 모든 대화·작업·궤적(trajectory)을 로컬에 저장하고 전문 검색으로 과거 경험을 재활용한다.
- 자율 스킬 생성 루프 — 복잡한 다단계 작업(Stripe→HubSpot→Slack 리포트 등)을 완료하면 전체 과정을 분석해 재사용 가능한 스킬로 패키징·테스트·저장하며, 이후 유사 요청 시 즉시 실행한다.
- 다중 백엔드와 저비용 운영 — 로컬, Docker, SSH(VPS), Singularity, Daytona, Modal(서버리스) 등 6종 환경을 지원하며, Modal 기준 24시간 상시 운영 시 월 약 $5 수준이다.
- OpenClaw와의 전략적 차별화 — OpenClaw가 24개 플랫폼 통합·13,000개 커뮤니티 스킬의 생태계 중심이라면, Hermes는 자율 학습·궤적 캡처·RL 훈련 파이프라인을 코어에 통합한 "지식의 복리" 베팅이다.
- 현실적 한계 존재 — Windows 미지원(WSL2 필수), LLM 생성 스킬의 불안정성, 에이전트 무한 루프 현상, 다중 스텝 순수 속도는 오케스트레이션 특화 프레임워크에 열세다.
🧩 배경과 문제 정의
- AI 에이전트 시장은 1995년 웹 브라우저 전쟁처럼 수많은 프레임워크가 난립하고 있으나, 에이전트가 갖춰야 할 핵심 기능에 대한 합의는 아직 없다.
- 기존 대부분의 프레임워크는 상태 비저장(stateless) 방식으로 동작해, 같은 질문을 나중에 다시 해도 매번 처음부터 시작한다.
- Hermes Agent는 "에이전트가 사용자와의 상호작용에서 학습하고, 시간이 지날수록 더 유용해진다"는 전제 아래 근본적으로 다른 아키텍처를 채택했다.
- 이 영상은 Hermes의 설치, 학습 메커니즘, 배포 옵션, 실제 작동 원리를 실습 관점에서 상세히 분해한다.
🕒 시간순 섹션별 상세정리
1. AI 에이전트 시장의 현주소와 Hermes의 차별성 [00:00]
- 기존 에이전트 프레임워크 대부분은 요청-응답 직후 상태를 초기화하는 stateless 구조다. 맥락이 유지되지 않아 반복 작업이 잦고, 사용자의 누적 경험은 반영되지 않는다.
- Hermes는 모든 상호작용 이력을 보존하고 이를 학습에 활용하는 구조로, 근본적으로 다른 아키텍처 방향을 제시한다.
2. Hermes Agent 프레임워크 개요와 커뮤니티 현황 [01:15]
- Nous Research가 개발한 오픈소스 자가 개선형(self-improving) AI 에이전트 프레임워크다. 현재 v0.6.0으로 프로덕션 준비 단계에 있다.
- GitHub 스타 약 19,000개, 기여자 200명 이상의 활성 커뮤니티가 뒷받침하고 있다.
3. 세 가지 핵심 기능: 도구·게이트웨이·학습 시스템 [01:44]
- 40개 이상의 통합 도구를 제공한다: 웹 검색, 터미널, 파일 시스템, 브라우저 자동화, 코드 실행, 이미지 생성, TTS, 비전 등을 단일 환경에서 호출 가능하다.
- 메시징 게이트웨이로 터미널, Telegram, Discord, Slack, WhatsApp, Signal, 이메일을 하나의 프로세스에서 연결해 채널 간 전환 없이 동일 에이전트와 소통할 수 있다.
4. 학습 시스템의 실제 동작: 대화 저장과 전문 검색 [02:56]
- 모든 대화·작업·질문 기록을 로컬 폴더에 영속 저장한다. 외부 서버 의존 없이 로컬에서 관리된다.
- 전문 검색(full-text search)으로 자신의 과거 이력을 검색해 관련 정보를 즉시 찾아 요약할 수 있다. 동일 질문의 재발생 시 이전 맥락을 자동 참조한다.
5. 스킬 자동 생성과 재사용 메커니즘 [03:30]
- 복잡한 작업(예: Stripe·HubSpot 데이터 연계, 주간 요약 발송)을 요청하면 첫 실행은 약 20단계의 다중 API 호출로 진행된다.
- 실행 완료 후 전체 과정을 분석해 "스킬"로 패키징한다. 재사용 가능한 함수로 변환, 자동 테스트 후 로컬 파일 시스템에 저장해 이후 동일 작업을 단건 호출로 수행한다.
6. 사용자 패턴 추적과 선호도 학습 [04:16]
- 사용자의 선호도, 작업 스타일, 중요하게 여기는 기준을 패턴으로 지속 추적한다.
- 모호한 질문에도 축적된 사용자 맥락을 활용해 정확한 의도 파악이 가능하다.
7. 다양한 배포 환경과 비용 구조 [05:08]
- 로컬 터미널, Docker, SSH(VPS), Singularity(HPC 클러스터), Daytona(클라우드 개발), Modal(서버리스)까지 6가지 실행 환경을 지원한다.
- Modal은 에이전트 대기 시 과금이 0원이며, 메시지 수신 시 자동으로 인스턴스를 깨워 실행하는 하이버네이션 구조로 비용 효율성이 높다.
8. 학습 루프의 기계적 작동 원리: 궤적 기록과 스킬 생성 [07:06]
- 사용자가 복잡한 작업(예: Stripe 수익 → HubSpot 파이프라인 교차 분석 → Python 차트 생성 → Slack 리포트 발송)을 요청하면, Hermes가 40개 이상의 도구를 체인으로 연결해 실행한다.
- 첫 실행은 약 15~20단계에 수 분이 소요될 수 있다.
9. 스킬 학습 메커니즘과 커스텀 스킬의 가치 [10:02]
- Hermes의 스킬은 사전 녹화된 매크로가 아니라 실행 시마다 학습하며 코드 내부에 상주하는 살아있는 객체다.
- 40개 이상의 번들 스킬이 기본 제공되지만, 진정한 차별점은 사용자가 직접 구축하는 커스텀 스킬에 있다.
10. Windows 미지원과 엔터프라이즈 현실 [10:48]
- Windows는 최적화 수준이 아니라 아예 작동하지 않아 WSL2가 필수 전제조건이다.
- 실험적 Windows 지원이 진행 중이며 경로 처리·PTY 관련 PR이 계속 유입되고 있으나, README 상으로는 여전히 미지원이다.
11. 학습 루프의 현실적 한계 [11:19]
- 학습 루프는 이론상 우아하지만, 실제로는 매우 복잡한 작업에 대해서만 스킬을 생성한다.
- 생성된 스킬은 LLM 산출물이므로 동작을 보장하지 않으며, 실행 실패 시 오히려 시간 낭비로 이어질 수 있다.
12. 로컬 실행 시 보안 우려 [11:57]
- Docker나 Modal이 아닌 로컬 백엔드에서 실행하면 에이전트가 터미널에 직접 접근하며, 사용자 권한으로 실행된다.
- 위험 명령어 검사가 내장되어 있고 강화 PR이 진행 중이지만, 프로덕션에서는 컨테이너를 보안 경계로 삼으라는 것이 공식 문서의 권고다.
13. 에이전트 무한 루프와 속도 트레이드오프 [12:32]
- 에이전트가 메시지를 무시하고 루프에 빠지는 현상이 여전히 발생한다.
- v0.4.0 체인지로그에도 다수의 "stuck agent loop" 수정 항목이 포함되어 있으나, 다른 형태로 지속 재발하고 있다.
14. OpenClaw의 등장과 아키텍처 차이 [13:46]
- Peter Steinberger가 2025년 주말 사이드 프로젝트로 시작한 OpenClaw는 4개월 만에 GitHub 스타 30만 개를 돌파했고, React가 10년 걸린 기록을 60일 만에 경신했다.
- Jensen Huang은 이를 "아마도 소프트웨어 역사상 가장 중요한 릴리스"라고 평가했다.
15. 학습 vs 플랫폼: 근본적으로 다른 베팅 [15:01]
- OpenClaw의 스킬은 인간이 관리하며, 에이전트가 오늘 잘한 일을 내일 더 빨리 하는 방식으로 자동 학습하지 않는다.
- 메모리 시스템은 플러그인 방식으로, LanceDB 벡터 검색·lossless Claw 대화 저장 등이 있으나 각각 개별 설치·구성이 필요하다.
16. OpenClaw 마이그레이션 도구와 전략적 의도 [18:06]
- Hermes는
hermes-claw-migrate단일 명령으로 soul.md, 메모리, 스킬, API 키, 메시징 설정 전체를 OpenClaw에서 가져올 수 있다. - 이는 사용자에게 이직이 아닌 병행을 제안하는 Nous의 전략적 선택이다. "OpenClaw도 유지하고 Hermes를 함께 시도해보라"는 입장이다.
- 비즈니스 운영·다채널 고객 대면·방대한 커뮤니티 생태계가 필요하면 OpenClaw가, 시간이 지날수록 지식이 복리로 쌓이는 에이전트와 자체 모델 훈련 데이터 추출이 필요하면 Hermes가 적합하다.
17. 설치 과정 시작 [19:12]
- Hermes 설치는 몇 분 안에 끝나는 간단한 과정이다.
- GitHub README의 curl 명령 한 줄로 설치 스크립트가 실행되며, Python, Node.js, ripgrep 등 필수 의존성을 자동으로 설치한다.
- 시스템 환경(Linux, Ubuntu 등)을 자동 감지해 필요한 패키지 업데이트까지 진행한다.
18. 자동 의존성 설치와 설치 마법사 진입 [20:02]
- 설치 프로그램이 Python, Node, Ripgrep, FFmpeg 등 필수 도구를 자동 감지하고 누락된 항목을 직접 설치한다.
- 사용자 수동 개입 없이 전체 설치 과정의 약 60%가 이 단계에서 완료된다.
19. 프로바이더 인증과 TTS 설정 [20:28]
- ChatGPT, Anthropic 등 기존 구독 플랜의 인증 정보를 그대로 사용하므로 별도 가입이나 추가 비용이 없다.
- Anthropic 선택 시 브라우저 로그인 → 인증 코드 발급 → 터미널 입력의 흐름으로 인증이 간단히 완료된다.
20. 실행 환경 및 고급 설정 구성 [21:17]
- 터미널 백엔드를 Docker, 로컬, Modal, SSH 중에서 선택할 수 있어 다양한 배포 환경에 대응한다.
- PTY 지원, 진행 표시줄, 텍스트 압축, 활동 모드 등 세부 옵션을 마법사 단계별로 개별 설정한다.
21. 채널 연동과 스킬 활성화 [21:55]
- Telegram 연동은 BotFather에서 봇을 생성한 뒤 API 토큰을 터미널에 입력하는 것만으로 즉시 완료된다.
- 웹 검색·스크래핑, 브라우저 자동화, 터미널 제어 등의 스킬을 스페이스바로 선택해 한 번에 활성화할 수 있다.
22. Hermes 실행과 터미널 인터페이스 탐색 [23:00]
- 셸 재시작 후
Hermes명령어 한 줄로 에이전트 환경이 즉시 실행된다. /명령어로 new, reset, background, provider, prompt 등 주요 명령을 바로 확인할 수 있다.
23. 통합 도구와 VPS 배포 [24:17]
- Obsidian, Claude Code, Codex, Open Code, Nano PDF, Linear, Notion, PowerPoint, Google Workspace 등 다양한 통합 도구가 기본 제공된다.
- 각 도구의 연동 방식(CLI 또는 MCP)은 명확히 구분되지 않으나, 자연어로 PDF 편집·프레젠테이션 작성 등이 가능하다.
24. 에이전트 아키텍처 철학과 마무리 [26:15]
- 이제 핵심 질문은 "에이전트를 써야 하는가"가 아니라 "어떤 에이전트를 만들어야 하는가"로 바뀌었다.
- Hermes는 "학습하는 에이전트"라는 단일 방향에 집중했으며, 대부분의 기존 프레임워크는 아직 이 구조를 구현하지 못한다고 평가한다.
🧾 결론
- Hermes는 "에이전트가 시간이 지날수록 더 유용해진다"는 전제를 아키텍처 수준에서 구현한 몇 안 되는 프레임워크로, 학습 루프·궤적 보존·자율 스킬 생성이 설계 철학의 핵심이다.
- OpenClaw 마이그레이션 도구(
hermes-claw-migrate)를 제공해 기존 사용자의 진입 장벽을 낮추고, 병행 사용을 유도하는 전략적 접근을 취하고 있다. - 그러나 v0.6.0 기준 Windows 미지원, 스킬 안정성, 무한 루프 문제 등은 프로덕션 도입 전 반드시 평가해야 할 리스크며, 속도 최우선 워크로드에는 Crew AI·LangGraph 등이 여전히 적합하다.
- 19,000 GitHub 스타·200명 이상 기여자·MIT 라이선스라는 커뮤니티 기반은 성장 가능성을 시사하지만, 에이전트 프레임워크 시장 전반이 아직 초기 단계임을 감안해야 한다.
📈 투자·시사 포인트
- 학습형 에이전트의 차별화 가치: 동일한 작업을 반복할수록 궤적이 쌓이고 스킬이 개선되는 구조는, 장기 사용자에게 기하급수적 효율增益을 제공할 수 있다. 이는 SaaS 관점에서 전환 비용(switching cost)과 사용자 잔존(retention)에 직결된다.
- 에이전트 프레임워크 시장의 승자독식 가능성: 1995년 웹 브라우저 전쟁에 비유된 현 상황에서, 학습·기억 구조를 코어에 통합한 프레임워크가 플랫폼 생태계 중심 접근보다 장기적으로 우위를 점할 가능성을 주시필요가 있다.
- 인프라 비용 민감도: Modal 서버리스 기준 월 $5는 VPS 상시 운영 대비 상당한 절감이며, 에이전트를 다수 운영하는 조직에게 인프라 비용 구조는 채택 여부의 핵심 변수다.
- 보안·컴플라이언스 리스크: 로컬 실행 시 터미널 접근 권한, 위험 명령어 검증의 한계, 컨테이너 보안 경계 권고 등은 엔터프라이즈 도입 시 반드시 해결해야 할 전제 조건이다.
- OpenClaw 대비 생태계 격차: 13,000개 커뮤니티 스킬·200만 MAU를 보유한 OpenClaw의 네트워크 효과는 단기적으로 따라잡기 어려우며, Hermes의 스킬 공유 플랫폼(agent-skills.io) 생태계 성숙도가 관건이다.
⚠️ 불확실하거나 확인이 필요한 부분
- Hermes의 GitHub 스타 약 19,000개, 기여자 200명 이상, MIT 라이선스라는 수치는 영상 촬영 시점 기준이며, 현재는 변동되었을 가능성이 높다. 실제 저장소 메트릭은 직접 확인이 필요하다.
- "Jensen Huang이 OpenClaw를 '소프트웨어 역사상 가장 중요한 릴리스'라고 평가했다"는 발언의 출처와 맥락이 불명확하다. 공식 연설·인터뷰인지, 2차 인용인지 확인이 필요하다.
- "OpenClaw가 4개월 만에 30만 스타, React의 10년 기록을 60일 만에 경신했다"는 수치는 검증이 필요하다. GitHub 스타 증가 속도와 React의 누적 스타 획득 타임라인은 직접 비교하기 어려운 지표다.
✅ 액션 아이템
- Hermes GitHub 저장소에서 실제 스타 수·기여자 수·라이선스·현재 버전을 직접 확인하고 영상 내 수치와 비교한다.
- Windows 지원 현황을 README와 open PR에서 재확인하여, WSL2 외 네이티브 지원 진척도를 파악한다.
- Hermes 학습 루프가 생성한 스킬의 실제 코드 품질과 재실행 성공률을 독립 벤치마크나 커뮤니티 사례에서 조사한다.
-
hermes-claw-migrate명령의 실제 동작 범위(어떤 파일이 마이그레이션되는지, 누락되는 항목은 없는지)를 공식 문서에서 확인한다.
❓ 열린 질문
- Hermes의 자율 스킬 생성이 LLM 기반인 이상, 생성된 스킬의 신뢰성을 어떻게 보증할 것인가? 테스트 자동 생성·샌드박스 검증 같은 안전장치가 있는가?
- "에이전트가 무한 루프에 빠지는" 현상이 v0.6.0에서 여전히 재발한다면, 학습 루프가 복잡해질수록 이 문제가 악화되지 않는가? 복구·타임아웃 메커니즘의 설계 방향은 무엇인가?
- OpenClaw와 Hermes의 병행 사용이 전략적으로 제안되고 있으나, 두 시스템의 학습 데이터·메모리·스킬이 양방향 동기화되는 구조인지, 아니면 일회성 마이그레이션에 그치는 것인지 불명확하다.