Hermes Agent just WON (Hermes desktop app)
Quick Summary
Hermes Agent와 Hermes 데스크톱 앱의 핵심은 CLI·Telegram 중심의 복잡한 에이전트 사용을 세션, 아티팩트, 스킬, 크론, 프로필, 설정이 통합된 개인 운영 인터페이스로 바꾸는 데 있다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
Hermes Agent와 Hermes 데스크톱 앱의 핵심은 CLI·Telegram 중심의 복잡한 에이전트 사용을 세션, 아티팩트, 스킬, 크론, 프로필, 설정이 통합된 개인 운영 인터페이스로 바꾸는 데 있다.
📌 핵심 요점
- Hermes 데스크톱 앱은 CLI, Telegram, Discord처럼 흩어진 사용 흐름을 한 화면으로 모아, 세션별 작업 맥락을 유지하고 다시 돌아오기 쉽게 만든다.
- 세션 고정과 아티팩트 기능은 반복 작업, 링크, 파일, 이미지, PDF, 전사 파일처럼 채팅 속에서 사라지기 쉬운 자료를 장기적으로 관리하는 데 유리하다.
- 스킬과 툴셋 관리는 기능 확장뿐 아니라 토큰 비용과도 연결된다. 쓰지 않는 스킬을 꺼두면 불필요한 컨텍스트 사용을 줄일 수 있다는 점이 강조된다.
- 크론 UI는 반복 작업이 실제로 설정되어 있는지 확인하고, 원하는 요일·시간에 자동화를 지정하거나 원치 않는 작업을 일시정지하는 데 도움을 준다.
- 프로필, 모델, 메모리, API 키 설정은 여러 역할의 에이전트를 나누어 운영하고, 모델 변경 안정성, 기억 압축, 보안 관리를 데스크톱 안에서 처리하게 해준다.
🧩 배경과 문제 정의
- AI 에이전트를 CLI, Telegram, Discord 같은 채널로 다루는 방식은 개발자에게는 익숙할 수 있지만, 일반 사용자에게는 설정과 운영 부담이 크다.
- 세션, 스레드, 파일, 반복 작업, 메시징 설정, 스킬 관리가 여러 인터페이스로 흩어지면 작업 맥락을 유지하기 어렵고, 에이전트가 실제로 무엇을 하고 있는지 확인하기도 어려워진다.
- Hermes 데스크톱 앱은 세션, 아티팩트, 메시징, 스킬, 크론, 프로필, 설정을 하나의 화면 흐름 안에 묶어 에이전트 사용의 진입 장벽을 낮추려는 시도로 소개된다.
- 핵심 변화는 에이전트를 단순 채팅창이 아니라 작업별 기억, 파일, 자동화, 도구 설정까지 함께 관리하는 개인 운영 인터페이스로 본다는 점이다.
- 특히 비개발자나 여러 역할의 에이전트를 동시에 쓰는 사용자에게는 CLI보다 데스크톱 경험이 더 자연스럽고, 작업 맥락 유지와 보안 설정을 눈으로 확인할 수 있는 구조가 중요해진다.
🕒 시간순 섹션별 상세정리
1. 데스크톱 앱이 CLI·Telegram 중심 사용 방식을 대체한다
- Hermes 데스크톱 앱은 AI 에이전트와 상호작용하는 방식의 중심으로 제시되며, 발표자는 Telegram, CLI, Open Claw보다 더 나은 경험이라고 강하게 평가한다 [00:48]
- CLI는 Claude Code, Codex, Hermes, Open Claw 같은 도구를 다루는 현재의 유행에 가깝고, 평균 사용자는 명령줄보다 데스크톱 앱 형태의 경험을 원한다는 문제의식이 드러난다 [01:03]
- 발표자는 Hermes 데스크톱 앱이 일반 사용자에게 더 접근하기 쉬운 형태이며, 에이전트 사용이 개발자 전용 환경에서 벗어나는 계기가 될 수 있다고 본다 [01:18]
2. 세션 고정과 아티팩트가 작업 맥락과 자료를 보존한다
- 크론 작업이 실행될 때마다 새 세션이 생기면 목록이 쉽게 복잡해질 수 있으므로, 자주 쓰는 핵심 스레드를 고정해두는 방식이 중요하게 다뤄진다 [02:28]
- 세션을 고정하면 반복적으로 확인해야 하는 작업이나 장기적으로 이어지는 대화 맥락을 빠르게 찾을 수 있어, 에이전트 사용 흐름이 덜 흩어진다 [02:43]
- 인터페이스는 Telegram이나 Discord보다 덜 복잡하고, 단순하고 정돈된 화면을 통해 데스크톱에서 세션 중심으로 에이전트를 다루기 쉽게 만든다 [02:54]
- 아티팩트와 세션 중심 구조는 대화만 남기는 것이 아니라 작업 중 생성된 자료와 맥락을 함께 보존하는 방향으로 드러난다 [03:09]
3. 메시징·스킬·툴셋 관리가 토큰 비용과 기능 이해를 좌우한다
- 메시징 설정은 CLI 명령어 대신 서비스 선택, 가이드 확인, 봇 토큰 입력 같은 흐름으로 처리되며, 터미널 설정에 익숙하지 않은 사용자도 연결을 구성할 수 있다 [04:22]
- Telegram이나 Discord 같은 외부 메시징 채널을 연결하는 과정이 데스크톱 화면에서 안내되기 때문에, 사용자는 설정 상태를 더 직관적으로 확인할 수 있다 [04:37]
- 기본으로 켜진 스킬이 많으면 컨텍스트와 토큰, 비용을 소모하므로 iMessage, Find My, Apple Reminders처럼 쓰지 않는 스킬은 꺼두는 편이 유리하다고 드러난다 [04:43]
- 스킬 관리 화면은 에이전트가 어떤 기능을 사용할 수 있는지 보여주는 동시에, 불필요한 기능을 줄여 비용과 복잡도를 관리하는 지점으로 작동한다 [04:58]
4. 크론 화면이 반복 작업 실패와 검증 문제를 줄인다
- Hermes 에이전트 사용자가 반복 작업을 한 번만 수행하고 이후 실행되지 않는 문제를 겪는다면, 원인은 크론 작업 설정이 제대로 되지 않은 데 있을 수 있다고 드러난다 [06:12]
- 반복 작업은 지시만 했다고 자동으로 계속 실행되는 것이 아니라, 크론 형태로 실제 등록되어 있는지 확인하는 과정이 중요하다 [06:27]
- Telegram이나 Discord에서는 크론이 제대로 설정됐는지 확인하기 어렵지만, 데스크톱 UI에서는 원하는 크론 작업이 존재하는지 직접 검증할 수 있다 [06:32]
- 크론 화면은 자동화가 실제로 등록되어 있는지, 반복 실행될 조건이 마련되어 있는지 확인하게 해 반복 작업 실패 가능성을 줄이는 역할을 한다 [06:47]
5. 프로필은 서로 다른 역할·도구·기억을 가진 별도 에이전트를 만든다
- 프로필 화면에는 여러 Hermes 에이전트가 모이며, 각각은 DGX Spark, Mac mini, Mac Studio 등 서로 다른 기기와 역할에서 동작할 수 있는 것으로 묶인다 [07:27]
- 프로필은 단순한 화면 전환이 아니라, 서로 다른 작업 환경과 책임을 가진 에이전트를 나눠 관리하는 구조로 드러난다 [07:42]
- 새 Hermes 에이전트는 서로 다른 역할, 도구, 책임이 필요할 때 만드는 것이 적합하며, 단순 병렬 작업을 위한 메인 에이전트의 복사본인 sub-agent와 구분된다 [08:04]
- 이 구분은 여러 일을 동시에 시키는 것과, 아예 다른 기억·도구·권한을 가진 에이전트를 운영하는 것이 다르다는 점을 보여준다 [08:19]
6. 모델·메모리·API 키 설정이 안정성, 성능, 보안을 좌우한다
- 설정 화면의 모델 드롭다운은 모델 변경 과정에서 전체 설정이 깨지는 문제를 줄이고, 사용자가 원하는 모델을 빠르게 선택할 수 있게 한다 [08:59]
- 모델 선택이 UI 안에 들어오면서 사용자는 CLI 설정 파일을 직접 수정하지 않고도 에이전트의 성능과 비용 구조에 영향을 주는 선택을 할 수 있다 [09:14]
- 외형 설정에는 여러 테마가 있으며, 기본 라이트 테마처럼 사용자가 선호하는 시각 환경을 선택해 장시간 데스크톱 사용 경험을 조정할 수 있다 [09:15]
- 메모리와 API 키 같은 설정은 에이전트가 어떤 정보를 유지하고 어떤 외부 서비스에 접근할 수 있는지를 좌우하므로, 데스크톱 앱 안에서 명확히 관리되어야 하는 영역으로 다뤄진다 [09:30]
7. 스크립트와 썸네일 생성 요청으로 드러난 데스크톱 앱의 작업 흐름
- 발표자는 현재 시청 중인 영상에 필요한 스크립트와 썸네일 생성을 요청하며, ChatGPT 이미지 모델을 활용한 유튜브 영상 제작 작업을 Hermes 데스크톱 앱 안에서 시작한다 [12:00]
- 이 예시는 Hermes 데스크톱 앱이 설정 화면에 머무는 도구가 아니라, 실제 콘텐츠 제작 작업을 지시하고 결과물을 받아보는 작업 공간으로 쓰일 수 있음을 보여준다 [12:15]
- 데스크톱 앱에서는 도구 실행 상태가 애니메이션으로 보이고, 여러 스킬이 실제 작업 중 사용되며, Hermes의 self-improving 특성 때문에 스킬 개선 과정도 확인할 수 있다 [12:21]
- 영상 후반부에서는 Hermes 데스크톱 앱이 단순한 채팅 UI를 넘어, 스크립트 작성과 썸네일 생성처럼 여러 도구가 결합된 제작 흐름을 한 화면에서 실행·관찰하는 인터페이스라는 점이 결론처럼 중요하다 [12:36]
🧾 결론
- 영상은 Hermes 데스크톱 앱을 단순한 채팅 앱이 아니라, AI 에이전트의 세션·자료·자동화·도구·보안을 관리하는 통합 작업 환경으로 평가한다.
- 발표자의 핵심 주장은 평균 사용자가 장기적으로 CLI보다 데스크톱 또는 모바일 앱에 가까운 인터페이스를 선호할 가능성이 크다는 것이다.
- Hermes 데스크톱 앱은 특히 여러 세션을 오가거나, 반복 작업을 설정하거나, 콘텐츠 제작처럼 파일과 도구가 함께 필요한 작업에서 강점을 보인다.
- 다만 썸네일 생성 결과가 완벽하지 않았다는 언급처럼, 산출물 품질 자체보다는 여러 스킬과 도구가 한 흐름 안에서 실행되고 추적된다는 점이 더 큰 가치로 제시된다.
📈 투자·시사 포인트
- AI 에이전트 시장의 경쟁축은 모델 성능만이 아니라, 사용자가 작업을 이해하고 통제할 수 있는 인터페이스와 운영 경험으로 이동하고 있다.
- CLI 중심 도구는 개발자와 고급 사용자에게 강하지만, 대중 확산을 위해서는 세션 관리, 파일 보존, 설정, 자동화 검증을 쉽게 보여주는 데스크톱 UI가 중요해질 수 있다.
- 에이전트가 반복 작업과 개인 자료 관리를 맡게 될수록 크론, 아티팩트, 프로필, 권한, API 키 관리 같은 운영 기능이 제품 차별화 요소가 된다.
- 여러 역할별 에이전트를 프로필로 나누는 흐름은 개인 사용자뿐 아니라 콘텐츠 제작, 투자 리서치, 비즈니스 운영처럼 업무 단위가 분리된 환경에서 활용성이 커질 수 있다.
- 검증 필요: 영상은 Hermes 데스크톱 앱의 사용 경험과 가능성을 긍정적으로 평가하지만, 실제 안정성, 보안 수준, 장기 비용, 대규모 반복 작업 성능은 별도 사용 데이터나 공식 문서로 확인필요가 있다.
⚠️ 불확실하거나 확인이 필요한 부분
- Hermes 데스크톱 앱이 “Telegram·CLI·Open Claw보다 더 낫다”는 평가는 영상 진행자의 사용 경험에 기반한 주장으로 보이며, 모든 사용자 환경에서 동일하게 적용된다고 단정하기는 어렵습니다.
- “평균 사용자는 CLI보다 데스크톱 경험을 원한다”는 방향성은 설득력 있는 관찰이지만, 영상 안에서는 별도 사용자 조사나 정량 데이터가 제시된 것으로 보이지 않습니다.
- 메모리 압축 임계값을 0.5로 낮추면 잊어버리는 문제가 줄어들 가능성이 있다는 설명은 설정 전략으로 제안되지만, 실제 성능 개선 여부는 사용량·모델·메모리 구조에 따라 검증이 필요하다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- Hermes 데스크톱 앱에서 세션 목록, 고정 기능, 폴더 정리 기능을 확인하고 반복적으로 쓰는 작업별 세션 구조를 설계한다.
- 아티팩트 화면에 링크, 파일, 이미지, PDF, 전사 파일 등이 어떻게 누적되는지 확인하고 기존 북마크·자료 관리 방식과 비교한다.
- 기본 활성화된 스킬 목록을 점검하고, 사용하지 않는 iMessage, Find My, Apple Reminders류 스킬은 비활성화해 컨텍스트·토큰 낭비를 줄인다.
- 크론 화면에서 현재 등록된 반복 작업이 실제로 존재하는지 확인하고, 필요 없는 작업은 일시정지하거나 삭제한다.
❓ 열린 질문
- Hermes 데스크톱 앱은 현재 어떤 운영체제와 기기 환경에서 안정적으로 사용할 수 있으며, 영상에 나온 기능들이 모든 환경에서 동일하게 제공되는가?
- 세션·아티팩트·스킬·크론 데이터는 로컬에 저장되는지, 동기화되거나 외부 서버로 전송되는지 보안 구조를 어떻게 확인할 수 있는가?
- 메모리 압축 임계값을 낮추는 설정이 실제로 기억 손실을 줄이는지, 장기 사용 시 어떤 기준으로 최적값을 정해야 하는가?