YouTubeTonbi''s AI Garage·2026년 6월 9일·

The Complete Guide to the Hermes Agent Desktop App

Quick Summary

Hermes Agent Desktop App은 기존 Hermes 런타임을 그대로 유지하면서 세션·스킬·메시징·원격 제어·비용 관리를 한 화면에 묶는 데스크톱 컨트롤 룸이다.

영상 보기

클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.

원본 열기

🖼️ 인포그래픽

The Complete Guide to the Hermes Agent Desktop App 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

The Complete Guide to the Hermes Agent Desktop App 내용을 설명하는 본문 이미지

💡 한 줄 결론

Hermes Agent Desktop App은 기존 Hermes 런타임을 그대로 유지하면서 세션·스킬·메시징·원격 제어·비용 관리를 한 화면에 묶는 데스크톱 컨트롤 룸이다.

📌 핵심 요점

  1. Hermes Agent 데스크톱 앱은 별도 에이전트가 아니라 CLI·TUI와 같은 Hermes 런타임을 조작하는 프런트엔드이며, 기존 세션·메모리·스킬·설정이 이어진다.
  2. 세션과 워크스페이스를 분리해 작업 단위별로 컨텍스트를 관리하면, 긴 단일 대화에 모든 내용을 쌓는 방식보다 토큰 사용량과 비용을 줄일 수 있다.
  3. 앱은 스킬, 도구, 크론, 메시징, 파일 탐색기, 미리보기, 터미널, 상태 패널을 통합해 에이전트 실행 과정과 산출물을 한 화면에서 추적하게 한다.
  4. 프로필은 모델·스킬·메모리를 분리한 독립 에이전트 환경이고, 서브에이전트는 같은 에이전트의 복사본으로 단일 작업 안의 병렬 처리를 돕는다.
  5. 같은 Wi-Fi나 Tailscale·New Portal OAuth 기반 VPS 구성을 통해 노트북에서 원격 Hermes 인스턴스를 제어할 수 있으며, 실제 상태와 실행은 백엔드 머신에 남는다.

🧩 배경과 문제 정의

  • Hermes Agent 데스크톱 앱은 터미널이나 CLI 조작 없이도 기존 Hermes Agent의 세션, 메모리, 스킬, 설정을 다룰 수 있게 해 접근 장벽을 낮춘다.
  • 이 앱은 별도의 에이전트가 아니라 기존 Hermes 런타임을 제어하는 프런트엔드이므로, 터미널·TUI·Telegram에서 사용하던 상태와 작업 흐름을 그대로 이어갈 수 있다.
  • 핵심 가치는 단순한 채팅 UI가 아니라 세션, 워크스페이스, 스킬, 도구 호출, 크론, 파일 미리보기, 설정, 원격 접속을 한 화면에서 다루는 “에이전트 컨트롤 룸”에 있다.
  • 긴 단일 대화에 모든 작업을 쌓으면 컨텍스트와 비용이 커지기 때문에, 세션 분리·프로필 분리·서브에이전트 병렬화로 작업 단위를 관리중요하다.
  • 후반부의 핵심 문제는 Hermes를 “내 PC 안에서만 쓰는 도구”에 머물게 하지 않고, 노트북·VPS·Windows 환경에서 같은 에이전트를 안전하게 원격 제어하는 운영 방식으로 확장하는 데 있다.

🕒 시간순 섹션별 상세정리

1. 데스크톱 앱의 의미와 전체 가이드 범위

  • Hermes Agent 데스크톱 앱은 작은 릴리스처럼 보이지만, 터미널이나 CLI에 익숙하지 않은 사용자도 에이전트의 핵심 기능을 다룰 수 있게 하는 진입점이다 [00:31]
  • 이 앱은 단순한 장난감이 아니라 기존 Hermes Agent의 스킬과 기능을 그대로 제공해, 더 많은 사용자가 에이전트를 활용할 수 있게 한다 [00:46]

2. 기존 Hermes 런타임을 조작하는 프런트엔드 구조

  • 데스크톱 앱은 별도의 에이전트가 아니라, CLI와 TUI가 사용하는 동일한 Hermes 런타임을 구동하는 프런트엔드다 [02:03]
  • 세션, 메모리, 스킬, 설정은 기존 Hermes 환경과 이어지며, 앱은 같은 에이전트를 다른 창에서 조작하는 구조에 가깝다 [02:18]

3. 설치 흐름과 실행 옵션

  • 설치는 새로 다운로드해 진행하거나, 기존 Hermes 설치 환경에서 Hermes desktop을 실행하는 방식으로 시작할 수 있다 [02:41]
  • 설치 과정에서는 의존성 설치, 데스크톱 앱 빌드, PATH 추가 등 실행에 필요한 준비 작업이 진행된다 [02:56]

4. 세션·워크스페이스·메시징 관리

  • 왼쪽 사이드바의 세션 목록은 대화를 시간순으로 보여 주며, 최근 대화가 위쪽에 배치된다 [04:48]
  • 자주 쓰는 세션은 고정해 빠르게 다시 접근할 수 있고, 여러 작업을 한 화면에서 구분해 관리할 수 있다 [05:03]

5. 스킬·크론·프리뷰·상태 패널

  • 스킬과 도구 영역은 웹 대시보드처럼 사용 가능한 스킬과 실행 도구를 한눈에 보여 준다 [07:02]
  • 사용자는 필요한 스킬을 활성화하거나 비활성화할 수 있고, 키가 필요한 항목도 함께 확인할 수 있다 [07:17]

6. 작업 실행 가시성과 세션 분리의 비용 효과

  • 메인 채팅은 TUI의 Hermes chat처럼 사용할 수 있으며, 리서치 작업을 요청하면 에이전트가 어떤 스킬을 살피는지 단계별로 확인할 수 있다 [10:10]
  • 웹 검색, 도구 호출, Python 스크립트 실행 과정이 드러나기 때문에 에이전트가 실제로 무엇을 수행하는지 추적할 수 있다 [10:25]

7. 동시 작업 상태와 승인 대기 흐름

  • 슬라이드 생성과 Hyperframes 셰이더 효과 조사 작업이 동시에 진행되는 장면으로 Hermes의 멀티태스킹 흐름을 보여 준다 [12:00]
  • 파란색 애니메이션은 작업 진행 중 상태를, 노란색 표시는 사용자 승인이 필요한 대기 상태를 구분한다 [12:15]

8. 프롬프트 크기와 세션 데이터베이스 최적화

  • Hermes prompt size 명령은 새 세션 시작 전부터 로드되는 시스템 프롬프트, 스킬 인덱스, 메모리, 도구 스키마, 사용자 프로필의 전체 크기를 보여 준다 [13:44]
  • 이를 통해 에이전트가 매 세션 시작 시 어떤 기본 정보를 포함하고 출발하는지 확인할 수 있다 [13:59]

9. 프로필과 서브에이전트의 역할 차이

  • 서브에이전트는 현재 에이전트의 복사본에 가까워 동일한 스킬, 메모리, 도구를 공유한다 [15:14]
  • 따라서 하나의 작업 안에서 병렬 처리가 필요할 때 서브에이전트를 활용하는 방식이 적합하다 [15:29]

10. X 검색 전용 프로필과 기본 프로필 전환

  • 새로 만든 xbot 프로필은 초기에는 세션이 없지만, 모델을 Grok으로 설정해 X 기반 작업을 별도 환경에서 실행할 수 있다 [16:41]
  • 트윗 요약처럼 특정 플랫폼에 맞춘 작업은 전용 프로필로 분리해 처리할 수 있다 [16:56]

11. 서브에이전트 병렬 작업과 진행 상황 추적

  • Cosmos 3와 Locate Anything 관련 GitHub 저장소를 대상으로 복합 리서치 작업을 나누어 진행한다 [17:57]
  • 도구·모델 웹 검색, 컴퓨터 적용 가능성 분석, 전체 보고서 작성이 각각 서브에이전트 작업으로 분리된다 [18:12]

12. 파일 탐색기, 미리보기, 터미널, 설정 통합

  • 사이드바의 파일 탐색기는 현재 세션의 작업 디렉터리를 기준으로 열린다 [20:11]
  • 세션을 전환하면 Hermes 프로젝트 폴더에서 Windows unpacked 폴더처럼 작업 디렉터리도 함께 바뀐다 [20:26]

13. 설정 패널에서 작업공간·안전·메모리·서브에이전트 조정

  • 설정에서는 product 모드와 technical 모드를 전환할 수 있다 [24:01]
  • workspace의 working directory는 현재 세션이 기준으로 삼는 작업 루트로 쓰인다 [24:16]

14. provider·API key·MCP·음성 입력 설정

  • provider 설정에서는 현재 연결된 provider 상태를 확인할 수 있다 [25:32]
  • OpenAI OAuth, Grok, Anthropic extra usage, New Portal 등의 선택지는 frontier model 접근과 API 사용 방식에 연결된다 [25:47]

15. remote control은 노트북을 백엔드 에이전트의 창으로 바꾼다

  • remote control은 Hermes Desktop이 단순한 chat window를 넘어 agent control surface로 쓰일 수 있음을 보여 준다 [27:05]
  • 이 원격 조작 기능은 데스크톱 앱의 핵심 전환점으로 드러난다 [27:20]

16. 로컬 Wi-Fi 구성은 dashboard 실행과 IP:port 접속으로 연결된다

  • 같은 Wi-Fi 안에서는 먼저 username과 password를 설정한다 [28:17]
  • 32자의 무작위 숫자·문자 secret을 생성해 로컬 접속용 인증 정보를 만든다 [28:32]

17. 노트북에서 같은 agent session이 그대로 실행된다

  • remote gateway를 입력하면 New Portal sign-in popup이 열린다 [30:00]
  • 앞서 설정한 username과 password로 인증하면 laptop이 PC의 같은 agent session에 연결된다 [30:15]

18. VPS 구성은 Tailscale IP와 New Portal OAuth로 안전한 원격 접속을 만든다

  • main agent가 VPS에서 실행 중이고 Telegram도 이미 연결된 상태라면 외부 접근을 고려한 인증 경계가 필요하다 [31:53]
  • local network용 password 대신 New Portal OAuth를 사용해 외부 접속에 맞는 인증 흐름을 구성한다 [32:08]

19. Windows Desktop에서 VPS remote gateway에 연결하는 흐름

  • WSL에는 Hermes가 설치되어 있었지만 Windows 쪽에는 별도 설치가 필요했다 [36:01]
  • 같은 계정으로 연결해야 remote gateway 인증과 세션 접근이 계속된다 [36:16]

20. 장애 대응과 재설치 범위, Desktop app의 의미

  • Tailscale은 양쪽 머신에서 모두 실행되어야 한다 [37:36]
  • 연결 거부가 발생하면 Tailscale status를 확인하고 SSH로 접속해 재시작하면서 장애 범위를 좁힌다 [37:51]

🧾 결론

  • 이 영상의 핵심은 Hermes Agent Desktop App이 “채팅 UI”가 아니라 기존 Hermes 환경 전체를 제어하는 데스크톱 운영 화면이라는 점이다.
  • 터미널이나 CLI에 익숙하지 않은 사용자도 세션, 스킬, 메시징, 크론, 파일, 설정, 원격 접속을 시각적으로 다룰 수 있어 Hermes 사용의 진입 장벽이 낮아진다.
  • 세션 분리, 프롬프트 크기 확인, 세션 데이터베이스 최적화는 단순 정리 기능이 아니라 비용·성능·작업 안정성과 직접 연결된다.
  • 원격 제어 기능은 데스크톱 앱의 의미를 크게 확장한다. 노트북은 실행 환경이 아니라 백엔드 Hermes agent를 들여다보고 조작하는 창이 된다.
  • 검증이 필요한 내용은 일부 기능의 실제 안정성, 베타 단계에서의 업데이트 변화, 각 운영체제·네트워크 환경별 설치 및 원격 접속 재현성이다.

📈 투자·시사 포인트

  • AI 에이전트 활용이 늘어날수록 모델 성능뿐 아니라 세션 관리, 비용 가시화, 승인 흐름, 원격 제어 같은 운영 UI의 중요성이 커질 수 있다.
  • Hermes Agent Desktop App은 고급 사용자의 CLI 기능을 일반 사용자에게 열어 주는 방향이므로, 에이전트 도구의 대중화에서 “사용자 경험”이 핵심 병목이 될 가능성을 보여준다.
  • 프로필과 서브에이전트 구분은 다양한 모델과 작업 환경을 목적별로 나누는 흐름을 보여 주며, 사용자는 하나의 범용 대화창보다 역할별 에이전트 구성을 선호할 수 있다.
  • 비용 관점에서는 세션 분리, 프롬프트 크기 점검, 데이터베이스 최적화가 실제 운영비와 체감 성능에 영향을 줄 수 있어 장기 사용자의 관리 기능 수요가 중요해진다.
  • 원격 접속과 메시징 연동은 에이전트를 특정 PC 안의 도구가 아니라 여러 기기와 채널에서 접근하는 지속형 작업 환경으로 확장할 가능성을 시사한다.

⚠️ 불확실하거나 확인이 필요한 부분

  • Hermes Agent 데스크톱 앱은 영상 기준으로 “베타에 가까운 초기 단계”라고 설명되므로, 실제 설치 전에는 현재 버전의 UI, 명령어 옵션, 설정 항목이 영상과 같은지 확인이 필요하다.
  • Hermes desktop, skip build, force build, build only, no open host, 포트 설정 등 실행 옵션은 영상에서 소개되지만, 운영체제·설치 방식·현재 Hermes 버전에 따라 실제 명령어 표기나 동작이 달라질 수 있다.
  • “GPT 5.5”, “Grok 4.3”, “NemoChan 3 Ultra”, “Cosmos 3”, “Locate Anything” 등은 영상 속 데모와 예시 맥락에서 언급된 내용이므로, 각 모델·프로젝트의 실제 제공 상태나 사양은 별도 검증이 필요하다.
  • 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
  • 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
  • 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

  • Hermes Desktop 설치 전, 현재 Hermes Agent 버전과 데스크톱 앱 설치·빌드 옵션이 영상 내용과 일치하는지 확인한다.
  • 작업 종류별로 세션과 워크스페이스를 분리해 긴 단일 스레드에 컨텍스트가 누적되지 않도록 운영한다.
  • Hermes prompt size로 기본 프롬프트, 스킬 인덱스, 메모리, 도구 스키마 크기를 점검하고 불필요한 스킬이나 설정을 정리한다.
  • 장기간 사용 중인 환경에서는 세션 검색 성능 저하 여부를 확인하고, 필요하면 Hermes sessions optimize 계열의 최적화 절차를 검토한다.

❓ 열린 질문

  • 현재 사용자가 설치하려는 환경은 Windows, WSL, macOS, Linux 중 어디이며, 영상의 설치 흐름이 그 환경에 그대로 적용되는가?
  • 로컬 Wi-Fi 접속에서는 username/password 방식이 충분한지, 아니면 New Portal OAuth까지 적용하는 것이 더 적절한지 어떤 기준으로 결정해야 하는가?
  • 세션 분리로 비용이 3배나 4배까지 줄어들 수 있다는 설명은 어떤 실제 사용량 패턴에서 가장 크게 체감되는가?

관련 문서

공통 태그와 주제 흐름을 기준으로 같이 보면 좋은 문서를 이어서 제안합니다.