How Hermes Agent Solves Skill Drift and Context Rot as a Self-Improving Agent

🖼️ 인포그래픽

How Hermes Agent Solves Skill Drift and Context Rot as a Self-Improving Agent 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 요약

Hermes Curator는 자기 개선형 에이전트가 만든 스킬이 무한히 쌓여 컨텍스트와 추론 품질을 망가뜨리는 문제를 사용량 추적, 자동 비활성화, 보조 모델 리뷰, 핀 고정으로 관리하는 스킬 정리 시스템이다.

📌 핵심 요약

자기 개선형 에이전트는 작업 중 스킬을 계속 저장하지만, 오래되거나 중복된 스킬까지 계속 남으면 스킬 카탈로그가 노이즈가 된다.
Hermes Curator는 agent-created skill을 대상으로 사용 빈도와 마지막 사용 시점을 추적하고, 오래 쓰이지 않은 스킬을 active → stale → archived 상태로 이동시킨다.
삭제가 아니라 보관 방식이며, archived skill은 명령으로 다시 복구할 수 있다는 점이 핵심 안전장치다.
별도 저비용 보조 모델이 주기적으로 스킬 폴더를 검토해 중복, drift, 병합·패치·아카이브 후보를 제안하거나 처리한다.
pinned skill은 자동 demotion과 리뷰 모델의 대상에서 제외되어, 사용자가 의존하는 핵심 스킬을 보호한다.
원문은 memory와 skill을 구분하며, mem0는 “무엇을 아는가”를, Hermes Curator는 “어떻게 일하는가”를 관리하는 층으로 설명한다.

🧩 주요 포인트

스킬이 계속 쌓이면 에이전트는 새 문제를 푸는 대신 과거에 만든 스킬들을 반복적으로 읽게 된다.
Hermes Curator는 사용량 기반 demotion과 archive로 스킬 카탈로그의 크기와 노이즈를 줄인다.
보조 모델 리뷰는 중복 스킬 병합, drift 패치, 아카이브 후보 판단을 담당한다.
pin 기능은 중요한 스킬이 자동 정리나 에이전트 편집으로 훼손되는 것을 막는다.
memory와 skill은 서로 다른 종류의 장기 상태이며, 각각 별도 관리 로직이 필요하다는 것이 원문의 핵심 관점이다.
원문은 장기 실행 에이전트에서 self-pruning과 context management가 선택이 아니라 필수 인프라가 될 것이라고 주장한다.

🧠 상세 정리

1. 왜 스킬 카탈로그가 병목이 되는가

원문이 지적하는 첫 번째 병목은 자기 개선형 에이전트가 만든 스킬이 계속 누적된다는 점이다. 에이전트가 하루에 하나씩만 새 스킬을 저장해도 한 달이면 30개, 1년이면 365개가 된다. 문제는 이 스킬들이 모두 고유하지 않다는 데 있다. 비슷한 버그 수정법, 비슷한 API 호출법, 비슷한 작업 절차가 서로를 모른 채 여러 번 만들어질 수 있다.

이렇게 커진 스킬 폴더는 단순한 저장 공간 문제가 아니라 컨텍스트 품질 문제로 이어진다. 에이전트가 매 프롬프트마다 더 많은 스킬을 읽게 되면 토큰 비용이 증가하고, 여러 개의 유사한 스킬이 같은 요청에 동시에 매칭되면서 어떤 스킬을 선택해야 할지 신호가 흐려진다. 원문은 이 상태를 에이전트가 “느려지고 멍청해지는” 방향으로 설명한다.

2. Hermes Curator의 기본 메커니즘

Hermes Curator는 에이전트가 직접 만들었거나 사용자가 손으로 작성한 스킬을 대상으로 하는 백그라운드 유지관리 시스템이다. Hermes에 기본 포함된 스킬이나 hub에서 설치한 스킬은 건드리지 않는다고 설명된다. 즉, 정리 대상은 주로 self-improvement loop에서 생성된 스킬이다.

Curator의 기본 동작은 네 가지로 요약된다. 사용 여부를 관찰하고, 오래 쓰이지 않은 스킬을 demote하고, 보조 모델로 리뷰하며, pinned skill을 보호한다. 원문 표현으로는 watch, demote, review, respect pins가 사용자에게 보이는 전체 동작이다.

3. active → stale → archived 상태 전환

Curator는 각 스킬의 마지막 사용 시점을 확인한다. 원문 기준으로 30일 동안 사용되지 않은 스킬은 stale로 표시된다. stale 상태의 스킬은 여전히 사용할 수 있지만, 시스템상 의심 대상으로 표시된 상태다. 이후 60일이 더 지나 총 90일 동안 사용되지 않으면 해당 스킬은 live folder에서 archive folder로 이동한다.

중요한 점은 삭제가 아니라 이동이라는 것이다. 원문은 “Nothing is ever deleted”라고 설명하며, archived skill은 하나의 명령으로 되살릴 수 있다고 말한다. 이 설계는 자동 정리의 위험을 줄이면서도 live catalog의 노이즈를 낮추려는 절충으로 볼 수 있다.

4. 보조 모델 리뷰와 비용 구조

Curator의 두 번째 축은 별도 모델을 이용한 주기적 리뷰다. 에이전트가 적어도 두 시간 이상 idle 상태이고, 대략 일주일에 한 번 정도 조건이 맞으면 background review pass가 실행된다. 이 리뷰 모델은 스킬 폴더를 읽고 어떤 스킬이 겹치는지, 어떤 스킬이 drift되었는지, 병합·패치·아카이브가 필요한지를 판단한다.

원문은 이 모델을 메인 채팅 모델이 아닌 auxiliary slot에서 실행할 수 있다고 설명한다. 따라서 Gemini Flash 같은 저렴한 모델을 housekeeping에 사용할 수 있고, 메인 모델 비용을 들이지 않아도 된다. 이는 스킬 정리 작업을 에이전트의 실시간 작업과 분리하고, 운영 비용도 낮추려는 구조다.

5. pin 기능과 안전장치

Curator에는 세 가지 주요 guardrail이 제시된다. 첫째, Curator는 agent-created skill이나 사용자가 직접 작성한 스킬만 대상으로 삼는다. 둘째, 사용자는 어떤 스킬이든 pin할 수 있다. 셋째, 모든 counter와 timestamp는 skills folder 안의 sidecar file에 저장되어 사용자가 읽고 감사할 수 있다.

특히 pin 기능은 핵심 안전장치다. pinned skill은 자동 demotion clock과 review model 모두에게 보이지 않는다. 원문은 심지어 에이전트의 자체 편집 도구도 pinned skill을 수정하지 못한다고 설명한다. 사용자가 의존하는 스킬이 자동 정리나 drift patch 과정에서 바뀌지 않도록 막는 계약인 셈이다.

6. memory와 skill은 다른 층이다

원문은 Curator를 단순한 memory management로 보는 것을 경계한다. memory는 에이전트가 “무엇을 아는가”에 가깝다. 사용자, 프로젝트, 도메인, 과거 대화와 결정, 참조 정보가 여기에 포함된다. 원문에서 mem0는 이 장기 기억 계층을 관리하는 시스템으로 소개된다.

반면 skill은 에이전트가 “어떻게 일하는가”에 해당한다. 항공권을 예약하는 방법, 파일을 리팩터링하는 방법, 특정 API를 조회하는 방법처럼 절차적 지식을 담은 how-to 파일이다. 원문은 memory consolidation이 에이전트가 아는 것을 관리하고, Hermes Curator가 에이전트가 일하는 방식을 관리한다고 구분한다.

7. 장기 실행 에이전트의 시장·시스템 구조

원문은 현대적 에이전트 런타임이 더 이상 “모델과 프롬프트”만으로 구성되지 않는다고 설명한다. tool registry, memory layer, long-context window, KV cache eviction, prompt cache, orchestrator, permissioning, background job 등이 붙으면서 에이전트 주변의 인프라가 점점 커진다는 관점이다.

이 구조에서 Hermes Curator는 procedural memory, 즉 skills folder를 관리하는 층으로 자리 잡는다. 원문은 에이전트가 working memory, semantic memory, episodic memory, procedural memory를 동시에 관리하게 되며, 각각 다른 속도로 decay되고 다른 정리 방식이 필요하다고 주장한다. 따라서 자기 개선형 에이전트에는 self-pruning system과 context management가 함께 필요하다는 결론으로 이어진다.

🧾 핵심 주장 / 시사점

자기 개선형 에이전트가 스킬을 계속 저장한다면, 정리되지 않은 스킬 카탈로그는 비용과 추론 품질 양쪽에서 병목이 된다.
Hermes Curator의 핵심은 삭제가 아니라 사용량 기반 상태 전환과 아카이브를 통해 live context의 노이즈를 줄이는 것이다.
보조 모델 리뷰는 스킬 중복과 drift를 관리하는 별도 housekeeping layer로 제시된다.
memory와 skill은 모두 장기 상태이지만, 하나는 사실·맥락이고 다른 하나는 절차·작업 방식이므로 같은 관리 방식으로 다루기 어렵다.
원문은 장기 실행 에이전트에서 스킬 정리 계층이 선택 기능이 아니라 필수 인프라가 될 수 있다고 본다.

✅ 액션 아이템

Hermes Curator의 active → stale → archived 기본 주기와 config.yaml의 curator: 설정 항목을 확인한다.
hermes curator status로 least-recently-used skill 목록과 마지막 실행 시점을 점검한다.
유지가 필요한 핵심 스킬은 다음 curator run 전에 hermes curator pin으로 보호한다.
mem0 기반 memory layer와 Hermes Curator 기반 skill layer를 구분해 운영 문서에 정리한다.