The Hermes Setup That Makes Your AI Agent 10x More Powerful
Quick Summary
Hermes Setup의 핵심은 AI Agent를 단순 채팅 도구가 아니라, 클라우드에서 항상 켜져 있고 메모리·스킬·채널·스케줄 작업을 연결하는 실행형 업무 파트너로 만드는 데 있다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
Hermes Setup의 핵심은 AI Agent를 단순 채팅 도구가 아니라, 클라우드에서 항상 켜져 있고 메모리·스킬·채널·스케줄 작업을 연결하는 실행형 업무 파트너로 만드는 데 있다.
📌 핵심 요점
- Hermes는 직접 에이전트를 처음부터 만드는 부담과 패키지형 에이전트의 제한 사이에서, 상시 운영과 높은 구성 자유도를 제공하는 오픈소스 프레임워크로 소개된다.
- 영상은 개인 노트북보다 클라우드 VPS가 상시 실행, 모니터링, 예약 작업에 더 적합하다고 설명하며, Hostinger VPS와 Docker 기반 배포 흐름을 예시로 든다.
- Hermes는 웹 대시보드, 터미널 접근, 모델 연결, GPT 5.5 via Codex 설정,
soul.md기반 지속적 성격 설정을 통해 에이전트를 개인화된 작업 환경으로 구성한다. - 장기 기억, 세션 연속성, skill 생성 기능은 반복 설명 비용을 줄이고, 자주 쓰는 프롬프트나 업무 흐름을 재사용 가능한 작업 단위로 바꾼다.
- Telegram, gateway, cron job, profile, MCP, config.yaml, Kanban board는 Hermes를 단순 대화창이 아니라 외부 채널과 자동화 작업을 연결하는 운영 시스템으로 확장한다.
🧩 배경과 문제 정의
- AI 에이전트를 개인이나 비즈니스에 적용하려면 단순한 챗봇을 넘어, 상시 실행되며 일정에 따라 작업하고 도구와 메모리를 활용할 수 있는 환경이 필요하다.
- 처음부터 직접 구축하는 방식은 부담이 크고, Claude Code·Codex 같은 “agent in a box” 방식은 시작하기 쉽지만 구성의 자유도에는 한계가 있다.
- Hermes는 클라우드에서 상시 운영되는 오픈소스 에이전트 프레임워크로, 모델 연결·웹 대시보드·스킬·지속적인 성격 설정을 포함한 실사용 환경을 지향한다.
- 핵심 문제는 에이전트를 어디에 띄우고, 어떻게 안전하게 격리하며, 어떤 모델과 성격·도구 구성을 연결해 실제 업무 파트너로 만들 것인가다.
🕒 시간순 섹션별 상세정리
1. 에이전트 구축 방식의 선택지와 Hermes의 위치
- AI 에이전트 구축 방식은 처음부터 직접 만드는 방법, Claude Code·Claude Co-work·Codex 같은 패키지형 에이전트를 쓰는 방법, 항상 켜져 있는 오픈소스 구성형 프레임워크를 쓰는 방법으로 나뉜다 [00:19]
- 패키지형 에이전트는 시작과 실행이 쉽지만, 큰 일정 기반 작업이나 복잡한 개인 맞춤 운영에서는 구성 자유도가 제한된다 [00:30]
2. 상시 운영 환경과 클라우드 배포의 필요성
- 상시 작동해야 하는 에이전트는 잠들거나 이동 중인 개인 노트북 위에서 안정적으로 운영되기 어렵고, 전원이 꺼지면 모니터링과 예약 작업도 멈춘다 [01:28]
- Mac mini 같은 로컬 장비도 가능하지만, 설정 변경 후 에이전트가 죽으면 직접 물리적으로 접근해 재부팅해야 하는 문제가 생길 수 있다 [01:49]
3. Hostinger VPS와 Docker로 Hermes 실행 환경 만들기
- Hostinger의 KVM 2 플랜은 Hermes 에이전트를 실행하기에 충분한 메모리·스토리지·RAM을 제공하는 VPS 선택지로 드러난다 [03:03]
- 장기 운영을 고려하면 24개월 플랜이 비용 면에서 유리하며, VPS가 준비되면 Docker Manager에서 서버를 관리하고 Hermes 설치 단계로 넘어간다 [03:42]
4. VPS 운영의 실용성과 Hermes 웹 대시보드
- 클라우드 VPS는 사무실 정전, 로컬 장비 접근 불가, 물리적 케이블 문제 같은 운영 리스크를 줄이고, 물리 인프라 관리를 호스팅 업체에 맡기게 해준다 [05:03]
- 배포 후에는 대시보드에서 “open”을 눌러 터미널에 접근할 수 있어, 별도 SSH 애플리케이션이나 키 설정 없이도 에이전트와 상호작용할 수 있다 [05:26]
5. 모델 연결과 GPT 5.5 설정
- 에이전트는 메모리, 모델 접근, 하나 이상의 도구로 구성되며, Hermes는 이 핵심 구성 요소 일부를 기본적으로 포함한다 [06:45]
- 모델과 하네스의 조합이 중요하며, 여기서 하네스는 ChatGPT 웹챗이나 Codex처럼 모델을 실제로 실행하고 활용하는 환경을 뜻한다 [07:02]
6. soul.md와 지속적 성격 설정
- Hermes의 soul.md는 에이전트의 지속적 성격과 정체성을 정의하는 파일로, Hermes를 단순한 챗봇이 아니라 사용자와 함께 일하는 신뢰할 수 있는 사고 파트너로 만든다 [09:25]
- 모르는 설정이나 개념은 Hermes에게 직접 물어볼 수 있으며, Hermes는 자체 문서와 내장 스킬을 활용해 soul.md 같은 내부 기능의 의미를 찾아낸다 [09:44]
7. 세션을 넘어 이어지는 기억이 반복 설명 비용을 줄인다
- Hermes는 여러 세션을 목록화하고 과거 대화 전체를 다시 참조할 수 있어, Claude Code나 Claude Co-work와는 다른 장기 기억 흐름을 만든다 [12:29]
- 다음 날 soul.md와 personalities의 차이를 다시 다루더라도 이전 논의를 이어받기 때문에, 사용자는 같은 배경을 반복해서 설명할 필요가 줄어든다 [13:00]
8. Hermes의 self-improving 성격은 memory와 skill 생성에서 나온다
- Hermes의 자기 개선성은 장기 기억을 통해 사용자에게 점점 맞춰지는 점과, 필요할 때 자체적으로 skill을 작성하는 점에서 드러난다 [13:35]
- 기본 동작에서는 작업마다 skill을 만들려는 경향이 있어, 그대로 두면 불필요한 skill이 늘어나고 skill 파일도 과도하게 비대해질 수 있다 [13:54]
9. 외부 skill은 그대로 설치하기보다 검토와 재작성 방식이 안전하다
- Hermes에는 기본 skill들이 있고 hub에서 새 skill을 추가할 수도 있지만, 공개 skill 생태계에는 신뢰 가능한 자료와 위험한 skill이 함께 섞여 있다 [14:28]
- skill 내부에는 악성 코드나 공격 요소가 포함될 수 있으므로, 임의의 skill을 바로 설치하는 방식은 Hermes agent 환경에 직접적인 보안 리스크를 만든다 [14:58]
10. social media copy skill은 반복 프롬프트를 재사용 가능한 작업 단위로 바꾼다
- “이런 방식의 social media copy skill을 만들어 달라”는 요청만으로 Hermes는 skill authoring skill을 호출하고, GitHub 콘텐츠를 가져와 자체 skill 작성 흐름을 시작한다 [16:03]
- skill은 잘 작동하는 프롬프트를 저장해 언제든 다시 호출하는 구조에 가깝고, social media content용 skill은 목표, 청중, brand voice, platform specifics, content pillars, hook formulas 같은 요소를 담는다 [16:49]
11. web UI와 Telegram 연결은 agent 접근 채널을 확장한다
- Hermes는 terminal에서도 실행되지만, 개발자가 아니라면 terminal에서 설정하고 대화하는 과정이 불편할 수 있으며, web UI dashboard는 model 선택 같은 설정을 더 쉽게 처리한다 [18:43]
- 더 중요한 목표는 agent와 언제 어디서나 소통하는 것이며, Slack, Discord, open-source messaging platform, Telegram 같은 채널은 그 접근 경로가 된다 [19:29]
12. gateway와 cron job이 메시징 채널을 자동 실행 작업으로 연결한다
- save and restart는 gateway를 재시작하는 단계이며, gateway는 agent와 외부 세계 사이에서 Slack, Discord, web UI, terminal, Telegram, custom applications, APIs를 연결하는 중간 계층이다 [23:29]
- gateway 실행 후 Telegram에서 home channel이 없다는 메시지가 나오고, home channel을 설정하면 cron job 결과와 cross-platform message를 받을 기본 수신 위치가 생긴다 [23:44]
13. 프로필은 기능별 AI 동료 인스턴스로 나뉜다
- 기본 프로필은 최고운영자나 chief of staff처럼 상위 조정 역할을 맡고, YouTube·소셜미디어·이메일·비즈니스 코치 같은 기능별 프로필은 별도 인스턴스로 붙는다 [24:00]
- YouTube 전략 프로필은 Paddy Galloway를 모델로 삼아 제목, 썸네일, 훅, 영상 콘셉트를 만드는 전문 에이전트로 설정된다 [25:00]
14. MCP와 플러그인은 외부 도구 접근을 확장하지만 권한 관리가 중요하다
- MCP는 모델 컨텍스트 프로토콜로, AI 에이전트끼리 또는 에이전트와 외부 서비스가 예측 가능한 방식으로 소통하게 만드는 계층이다 [27:01]
- MCP는 API 위의 표준화된 접근층처럼 작동하며, Google Docs·Notion·Asana·GitHub 같은 서비스나 다른 AI 에이전트를 호출하는 데 쓰인다 [27:19]
15. config.yaml은 세부 설정을 직접 조정하는 실제 저장소다
- config 화면은 에이전트 최적화의 세부 항목이 모인 곳이며, 채팅 중 이상 동작이 생기면 수동으로 설정을 조정해야 할 수 있다 [29:07]
- 에이전트 설정은 폴더 안의 config.yaml 텍스트 파일에 저장되며, 화면의 구성값과 터미널의 파일 구조는 같은 설정을 가리킨다 [29:37]
16. Kanban board는 에이전트 작업을 추적 가능한 업무 흐름으로 바꾼다
- “내일 Hermes에 관한 Twitter용 소셜 포스트를 Kanban board에 넣어 달라”는 요청은 social media copy skill을 호출하고, 생성된 작업은 보드에 표시된다 [29:57]
- Kanban board는 Trello처럼 할 일을 정리하는 공간이며, to do·scheduled·ready·in progress 같은 상태를 통해 에이전트 작업을 요청에서 실행 흐름으로 추적하게 한다 [30:15]
🧾 결론
- 이 영상의 핵심 메시지는 “강력한 AI 에이전트”가 모델 하나만으로 만들어지는 것이 아니라, 실행 환경·메모리·권한·도구·접근 채널이 함께 설계되어야 한다는 점이다.
- Hermes는 클라우드 VPS 위에서 항상 켜진 상태로 동작하고, 웹 UI와 Telegram 같은 채널을 통해 사용자가 필요할 때 접근할 수 있는 에이전트 운영 구조를 제시한다.
soul.md, memory, skill, profile은 에이전트를 사용자에게 맞춰 누적적으로 조정하는 장치이며, 반복 업무를 점점 더 적은 설명으로 처리하게 만드는 기반이다.- 다만 외부 skill, MCP, API 키, 권한 부여는 보안 리스크가 있으므로, 영상에서도 무작정 설치하기보다 내용을 검토하고 필요한 범위만 연결하는 접근이 강조된다.
- 최종적으로 Hermes는 “0에서 1” 수준의 설치 튜토리얼을 넘어, 일정 작업·소셜 콘텐츠 작성·메시징 연동·업무 보드 관리까지 이어지는 실사용형 에이전트 운영 방식으로 제시된다.
📈 투자·시사 포인트
- AI 에이전트 경쟁의 초점은 단순 모델 성능에서, 모델을 실제 업무에 붙이는 하네스·대시보드·메모리·권한 관리·자동화 인프라로 확장되고 있다.
- 클라우드 VPS, 컨테이너, 원클릭 배포, 웹 대시보드처럼 비개발자도 상시 실행 에이전트를 운영하게 해주는 인프라와 관리 도구의 중요성이 커질 수 있다.
- skill과 MCP는 에이전트의 활용 범위를 크게 넓히지만, 동시에 악성 코드·과도한 권한·외부 서비스 접근 같은 보안 이슈를 동반하므로 신뢰성과 검토 체계가 핵심 변수가 된다.
- Telegram, Slack, Discord 같은 메시징 채널과 cron 기반 자동 작업은 에이전트를 “앱 안의 기능”이 아니라 사용자의 일상 업무 흐름에 들어오는 상시 인터페이스로 바꾼다.
- 기업이나 개인이 에이전트를 도입할 때는 모델 선택보다 먼저, 어디에 띄울지, 어떤 데이터를 기억하게 할지, 어떤 도구를 허용할지, 실패 시 어떻게 통제할지를 설계하는 역량이 중요해진다.
⚠️ 불확실하거나 확인이 필요한 부분
- Hostinger KVM 2 플랜이 Hermes 운영에 충분하다는 설명은 영상 내 사례 기준이며, 실제 필요 사양은 에이전트 수, 연결할 모델, cron 작업 빈도, 메시징 채널, MCP·플러그인 사용량에 따라 달라질 수 있다.
- “Hermes가 현재 가장 강력한 선택지”라는 평가는 발표자의 판단으로 보이며, 다른 오픈소스 에이전트 프레임워크와의 객관적 비교 자료는 별도로 확인이 필요하다.
- GPT 5.5 via Codex 연결, ChatGPT 월 20달러 플랜 사용 가능 여부, OAuth 흐름은 계정 상태와 서비스 정책에 따라 달라질 수 있으므로 실제 설정 전 최신 문서 확인이 필요하다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- Hermes를 사용할 목적을 먼저 정리한다: 단순 채팅, 일정 기반 자동화, 업무 브리핑, 콘텐츠 제작, 외부 도구 연동 중 무엇이 핵심인지 구분한다.
- 상시 실행이 필요한 경우 로컬 노트북 대신 VPS와 Docker 기반 배포를 검토하되, 방화벽·접근 권한·비밀번호·API 키 보관 방식을 먼저 정한다.
- 모델 연결 전 사용 가능한 계정, Codex 인증 가능 여부, 기본 모델 선택지를 확인하고 Hermes 대시보드에서 설정 흐름을 점검한다.
-
soul.md에는 말투·성격·협업 방식 같은 장기 선호를 넣고, 프로젝트별 명령어·경로·포트·운영 규칙은 별도 지침 파일로 분리한다.
❓ 열린 질문
- 실제 운영 환경에서 Hermes 하나를 안정적으로 돌리려면 최소 VPS 사양과 권장 사양은 어느 정도인가?
- GPT 5.5 via Codex 외에 Hermes와 궁합이 좋은 모델 조합은 무엇이며, 비용·속도·품질 차이는 어느 정도인가?
soul.md, personality, profile, memory, skill의 경계를 실제 팀 운영에서는 어떤 기준으로 나누는 것이 가장 안전한가?