YouTube샘 호트만 : AI 엔지니어의 시선·2026년 5월 31일·0

AI 활용 수준을 바꾸는, Hermes 에이전트 입문 전 개념 & 시스템 해부하기

Quick Summary

Hermes 에이전트 입문의 핵심은 더 똑똑한 AI를 고르는 문제가 아니라, 기억·스킬·도구·채널을 연결해 AI 활용 수준을 세션 단위에서 누적형 작업 시스템으로 바꾸는 것이다.

영상 보기

클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.

원본 열기

🖼️ 인포그래픽

AI 활용 수준을 바꾸는, Hermes 에이전트 입문 전 개념 & 시스템 해부하기 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

AI 활용 수준을 바꾸는, Hermes 에이전트 입문 전 개념 & 시스템 해부하기 내용을 설명하는 본문 이미지

💡 한 줄 결론

Hermes 에이전트 입문의 핵심은 더 똑똑한 AI를 고르는 문제가 아니라, 기억·스킬·도구·채널을 연결해 AI 활용 수준을 세션 단위에서 누적형 작업 시스템으로 바꾸는 것이다.

📌 핵심 요점

  1. 대화형 AI의 가장 큰 한계는 지능 부족보다 세션이 끊길 때 프로젝트 맥락, 사용자 선호, 작업 방식이 함께 사라지는 구조에 있다.
  2. Hermes는 두뇌, 손발, 해마, 업무 매뉴얼을 갖춘 에이전트로 설명되며, 단순히 답하는 챗봇보다 기억하고 실행하며 반복 작업을 이어가는 방향을 지향한다.
  3. Hermes의 구조는 모델을 고르는 config, 인격을 담는 soul.md, 기억을 담는 memory.md와 user.md, 절차를 축적하는 skill.md, 실행 도구, 채널, cron으로 나뉜다.
  4. 핵심 차별점은 한 번 성공한 작업 순서와 검증 방법을 스킬 매뉴얼로 남겨, 다음 비슷한 작업에서 출발점을 높이는 누적형 자기 개선 구조다.
  5. 다만 스킬이 많아질수록 과적합과 혼선이 생길 수 있으므로, 매뉴얼을 계층화하고 필요하면 프로필을 나눠 업무 습관이 섞이지 않게 관리해야 한다.

🧩 배경과 문제 정의

  • 이 영상은 Hermes를 설치하거나 실습하기 전에, 왜 에이전트형 AI가 필요한지와 Hermes를 구성하는 핵심 개념을 먼저 정리한다.
  • 문제의 출발점은 대화형 AI가 세션을 닫는 순간 프로젝트 맥락, 사용자 선호, 작업 방식, 말투를 잊어버리기 쉽다는 점이다.
  • 사용자가 매번 처음부터 자신과 프로젝트를 다시 설명해야 한다면, 병목은 모델의 지능 부족이 아니라 기억의 부재에 가까워진다.
  • Hermes는 단순히 답변을 잘하는 챗봇이 아니라, 두뇌, 손발, 해마, 업무 매뉴얼, 채널, 알람을 갖춘 지속형 에이전트 구조를 지향한다.
  • 핵심은 모델을 더 똑똑하게 만드는 것만이 아니라, 사용자의 일하는 방식과 반복 작업의 절차를 기억하고 다음 작업의 출발점을 높이는 데 있다.
  • 따라서 Hermes를 이해하려면 두뇌를 맡는 모델 설정, 인격을 담는 soul.md, 현장 수칙을 담는 AGENTS.md, 장기 기억을 맡는 memory.md와 user.md, 절차 기억을 쌓는 skill.md의 역할을 구분해야 한다.
  • 검증 필요: 제공된 section-detail에는 19:33 이후 구체 타임라인이 포함되어 있지 않으므로, 영상 후반 10~15%의 실제 발언 내용은 원본 transcript로 추가 확인이 필요하다.

🕒 시간순 섹션별 상세정리

  1. 세션이 끊기면 AI 활용이 태초 마을로 돌아가는 문제
  • 사용자가 프로젝트 맥락, 싫어하는 방식, 말투까지 한 시간 동안 알려줘도 세션을 닫고 다시 열면 같은 AI가 처음 만난 것처럼 반응한다 [00:46]
  • AI는 빠르게 똑똑해지지만 사용자는 매일 처음부터 자신을 다시 소개해야 하고, 실제 병목은 지능보다 어제의 말을 오늘 기억하지 못하는 구조에 있다 [01:01]
  1. 챗봇과 에이전트의 차이는 두뇌만 있느냐, 손발과 해마까지 있느냐에 있다
  • ChatGPT나 Claude 같은 대화형 AI는 안내데스크 직원처럼 질문에 답하지만, 대화창을 닫으면 맥락을 잊고 스스로 도구를 집어 들거나 일을 끝까지 처리하지 못한다 [01:49]
  • 에이전트에는 판단하고 계획하는 두뇌, 실행하는 손발, 경험을 저장하는 해마가 필요하며, 챗봇은 주로 두뇌만 가진 상태라 직접 일을 맡기기 어렵다 [02:17]
  1. Hermes의 전체 구조는 두뇌, 인격, 기억, 매뉴얼, 도구, 채널, 알람으로 나뉜다
  • 두뇌는 어떤 AI 모델을 쓸지 정하는 자리이고, 그 설정은 config 파일에 적히며 모델 선택과 실행 환경의 기준점이 된다 [03:17]
  • 인격은 soul.md에 들어가고, 기억은 memory.md와 user.md 두 수첩에 나뉘며, 업무 매뉴얼은 성공한 일머리를 쌓는 skill.md로 분리된다 [03:24]
  1. 두뇌는 고정 부품이 아니라 config로 갈아끼우는 선택지다
  • 한 회사 모델에 머리가 용접된 직원은 더 좋은 모델이 나와도 바꾸기 어렵고, 가격 인상이나 모델 종료 같은 외부 변화에 끌려다니는 리스크가 생긴다 [04:25]
  • Hermes의 두뇌는 Claude, OpenAI, Google 모델, OpenRouter 같은 중계소 모델로 교체할 수 있고, 기억과 경험은 몸에 남긴 채 머리만 바꿀 수 있다 [04:40]
  1. soul.md와 AGENTS.md는 인격과 현장 수칙을 분리한다
  • 같은 모델을 쓰더라도 어떤 AI는 사용자와 결이 맞고 어떤 AI는 산만하게 느껴지는데, 지능만으로는 그 AI가 누구인지와 어떻게 행동할지가 정해지지 않는다 [05:45]
  • soul.md는 Hermes가 켜질 때 시스템 프롬프트의 첫 자리에 들어가며, 누구인지·말투·금지 행동·애매한 상황의 행동 원칙 같은 기본 인격을 담는다 [06:03]
  1. memory.md, user.md, 과거 대화 검색, Honcho가 세션 단절과 정체 문제를 줄인다
  • Hermes의 기억은 서버 깊은 곳의 불투명한 저장소가 아니라 memory.md와 user.md라는 텍스트 파일 두 개에 담기며, 사용자는 직접 열어 읽고 틀린 내용을 고칠 수 있다 [08:21]
  • memory.md는 작업 환경과 프로젝트 사실을 담고, user.md는 사용자 정보와 선호·말투를 담으며, 제한된 길이 때문에 중요한 선호와 규칙은 남기고 사소한 정보는 버리는 큐레이션이 필요해진다 [08:40]
  1. 스킬은 절차 기억을 매뉴얼로 축적한다
  • 헤르메스의 기억은 사실과 선호를 담는 수첩형 기억, 그리고 일을 어떤 순서로 처리하는지 담는 절차형 기억으로 나뉘며, 두 번째 기억이 스킬에 해당한다 [12:01]
  • 복잡한 일을 성공시킨 뒤에는 순서, 막힐 뻔한 지점, 검증 방법을 스킬닷m 매뉴얼로 남겨 같은 유형의 작업에서 다시 활용한다 [12:38]
  1. 기억과 스킬은 반복될수록 복리 구조를 만든다
  • 스킬 매뉴얼은 평소에는 접혀 있다가 비슷한 일이 들어올 때만 펼쳐지므로, 매뉴얼이 많이 쌓여도 매번 모든 정보를 들고 일하지 않는다 [13:36]
  • 성공한 방법은 스킬 매뉴얼로, 기억해야 할 사실은 수첩으로 남으면서 두 종류의 기억이 맞물려 다음 작업의 출발점을 높인다 [13:46]
  1. 에이전트 육아와 자기 개선의 가치
  • 헤르메스에서 중요한 일은 완성된 천재 AI를 사오는 것이 아니라, 사용자의 일하는 방식과 암묵지를 매뉴얼과 수첩에 옮겨 담아 맞춤형 직원을 키우는 것이다 [14:27]
  • 사용자의 손때가 묻은 직원은 반복 사용을 통해 특정 사용자에게 더 잘 맞게 되며, 이 과정은 에이전트 육아에 가깝다 [14:53]
  1. 스킬 과적합과 프로필 분리의 필요성
  • 스킬은 성공한 풀이를 굳히는 구조이기 때문에 특정 상황에만 맞는 절차가 다른 작업에 끼어들면 도움이 아니라 방해가 되는 과적합이 생긴다 [15:51]
  • 매뉴얼 관리는 큰 원칙을 위에 두고 구체적 절차를 아래에 두는 계층화, 상세 문서 분리, 필요할 때만 참조하는 구조로 이뤄져야 한다 [16:10]
  1. 헤르메스는 코딩 에이전트를 대체하지 않고 위임한다
  • 헤르메스의 손발은 터미널 명령, 파일 읽기와 쓰기, 웹 검색 같은 도구로 구성되며, 그중 특별한 손은 다른 전문가에게 일을 넘기는 위임이다 [16:48]
  • 클로드 코드와 코덱스는 큰 코드베이스에 깊이 들어가 구현과 테스트를 담당하는 전문 개발자에 가깝고, 헤르메스는 그들에게 일을 나눠주는 매니저 역할에 가깝다 [17:20]
  1. 서버, 채널, 크론이 지속형 직원 구조를 완성한다
  • 헤르메스는 노트북에 묶이지 않고 작은 서버에서 24시간 돌거나 필요할 때만 깨어나는 방식으로 운용될 수 있으며, 노트북이 꺼져도 기억은 서버에 남는다 [19:11]
  • 게이트웨이는 슬랙, 디스코드, 텔레그램, 이메일 등 여러 채널을 하나의 몸에 연결하고, 어느 문으로 들어와도 같은 직원과 같은 기억이 계속된다 [19:33]
  • 검증 필요: 입력으로 제공된 section-detail에는 이 이후의 구체 발언과 결론부 타임스탬프가 없으므로, 영상 전체 길이 기준 후반 10~15%와 마지막 마무리 논지는 원본 transcript 확인 후 보강해야 한다 [19:48]
  1. 채널과 크론은 입·귀와 출근 시간을 만든다
  • 새 앱을 깔 필요 없이 이미 쓰던 메신저에서 말을 걸고, 텔레그램으로 일을 던진 뒤 슬랙으로 결과를 받을 수 있다 [20:06]
  • 채널은 일을 시키는 입구이자 결과를 보고받는 출구이며, 음성 메모나 단톡방 호출까지 받을 수 있는 입과 귀가 된다 [20:30]
  • 크론을 걸면 정해진 시각에 스스로 깨어나 경쟁 채널 표를 만들고 슬랙으로 보고한 뒤 잠든다 [20:50]
  • 스스로 끝낸 일을 텔레그램이나 슬랙으로 보고하고, 매일 할 일을 헤르메스 칸반보드에 자동 등록하는 식으로 확장된다 [21:08]
  1. 설치는 다음으로 넘기고 핵심 질문을 바꾼다
  • 실제 설치에는 서버 선택, 출입증 같은 키, 운영체제별 설치 경로처럼 낯선 용어가 많아 오늘 영상에서는 큰 그림을 우선 남긴다 [21:35]
  • 한 문장으로 헤르메스는 갈아 끼우는 두뇌, 소울닷 MD의 인격, 잊지 않는 기억, 스스로 두꺼워지는 매뉴얼이 한 몸으로 맞물려 도는 직원이다 [21:48]
  • 그 몸은 슬랙이나 텔레그램 어디서나 부를 수 있고, 부르지 않아도 정해진 시각에 스스로 출근한다 [21:55]
  • 결론은 어떤 AI가 더 똑똑한지가 아니라 어떤 AI가 내 어제를 이어서 작업하는가이며, 다음 영상에서는 윈도우와 맥 등 다양한 환경에서 설치하는 내용을 다룬다 [22:29]

🧾 결론

  • 이 영상은 Hermes를 설치 튜토리얼로 바로 들어가기 전에, 왜 이런 에이전트 구조가 필요한지 이해시키는 개념 해부에 가깝다.
  • 핵심 메시지는 “AI가 얼마나 똑똑한가”보다 “내 어제의 맥락과 작업 방식을 오늘도 이어받는가”가 실제 활용 수준을 좌우한다는 점이다.
  • Hermes는 모델 자체에 모든 가치를 두기보다, 모델을 교체할 수 있는 두뇌로 보고 기억·스킬·도구·채널을 한 몸처럼 연결하는 구조를 강조한다.
  • memory.md와 user.md는 사실과 선호를 담는 수첩 역할을 하고, skill.md는 반복 업무의 절차 기억을 쌓는 매뉴얼 역할을 하며, 두 축이 함께 누적될 때 복리 효과가 생긴다.
  • 영상 내 설명 기준으로는 Hermes의 강점이 “완성된 천재 AI”가 아니라 사용자의 일하는 방식에 맞춰 길러지는 맞춤형 직원이라는 관점에 있다.

📈 투자·시사 포인트

  • 개인이나 팀이 AI 도입에 투자할 때 단순히 최신 모델을 고르는 것만으로는 한계가 있고, 기억·작업 규칙·반복 절차를 어떻게 축적할지가 더 중요한 기준이 될 수 있다.
  • 반복 업무가 많은 사용자일수록 Hermes식 구조의 가치는 커질 수 있다. 같은 지시를 매번 반복하지 않고, 성공한 절차를 스킬로 남겨 다음 작업의 비용을 줄일 수 있기 때문이다.
  • 모델 교체 가능성은 특정 AI 제공사에 종속되는 리스크를 줄이는 시사점이 있다. 영상에서는 기억과 경험은 유지한 채 두뇌 역할의 모델만 바꿀 수 있다는 점을 강조한다.
  • 다만 실제 도입 판단에는 설치 난이도, 유지보수 부담, 보안, 비용, 모델별 품질 차이, 스킬 관리 부담이 별도로 검증되어야 한다.
  • 특히 스킬이 누적될수록 생산성이 올라갈 수 있지만, 잘못된 절차가 굳어지거나 특정 업무 습관이 다른 업무에 끼어드는 과적합 위험도 함께 관리해야 한다.

⚠️ 불확실하거나 확인이 필요한 부분

  • Hermes가 Claude, OpenAI, Google, OpenRouter 모델을 교체해 사용할 수 있다는 설명은 영상 내 주장에 기반한다. 실제 지원 모델 목록, 설정 키 이름, provider별 제약은 설치 문서나 현재 버전 기준으로 확인이 필요하다.
  • API 키가 config가 아니라 별도 보관 파일에 저장된다는 설명이 나오지만, 입력 내용만으로는 정확한 파일명·경로·권한 설정 방식까지 확정할 수 없다.
  • Honcho가 사용자의 암묵적 선호와 일하는 방식을 추론해 모델링한다는 설명은 영상에 포함되어 있으나, 어떤 데이터가 저장되고 어떻게 분리·삭제·검토되는지는 별도 확인이 필요하다.
  • 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
  • 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
  • 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

  • Hermes를 도입하기 전에 두뇌, 도구, 기억, 스킬, 채널, 크론의 역할을 분리해서 이해한다.
  • 개인 선호와 말투는 user.md, 프로젝트·환경 사실은 memory.md, 기본 인격과 행동 원칙은 soul.md에 넣는 식으로 기억의 종류를 나눈다.
  • 프로젝트별 현장 규칙은 AGENTS.md 또는 기존 CLAUDE.md처럼 작업 공간 단위 문서로 분리해, 인격 설정과 프로젝트 규칙이 섞이지 않게 한다.
  • 반복 업무를 한 번 성공시킨 뒤에는 순서, 막힌 지점, 검증 방법을 스킬 매뉴얼로 남겨 다음 작업의 출발점을 높인다.

❓ 열린 질문

  • Hermes의 기억 파일과 Honcho 모델링 정보는 사용자가 어느 수준까지 직접 열람·수정·삭제할 수 있는가?
  • 스킬이 자동으로 두꺼워질 때, 잘못된 절차나 일시적인 우회 방법이 장기 매뉴얼로 굳어지는 것을 어떻게 막을 수 있는가?
  • 여러 프로필을 나눠 운영할 때 공통 기억과 업무별 기억은 어디까지 공유하고 어디서부터 격리하는 것이 적절한가?

관련 문서

공통 태그와 주제 흐름을 기준으로 같이 보면 좋은 문서를 이어서 제안합니다.