Building AI Agent Operating Systems with Claude... | YouTube 요약

🖼️ 인포그래픽

Building AI Agent Operating Systems with Claude... 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 결론

Building AI Agent Operating Systems with Claude의 핵심은 단일 모델을 기다리기보다 Claude, Hermes, 로컬 모델, 무료 API, SEO·메모리 도구를 하나의 Agent OS 안에 묶어 교체 가능하고 반복 실행 가능한 작업 시스템을 만드는 것이다.

📌 핵심 요점

Agent OS는 Claude, Hermes, 로컬 모델, OpenRouter 무료 모델, Ollama·LM Studio, Obsidian 메모리, Open SEO 같은 도구를 한 작업공간에 통합하려는 운영 체계로 설명된다.
Claude의 “service was busy” 문제와 사용 한도, API 비용, 프런티어 모델 접근 제한 때문에 로컬 모델과 무료 API 모델을 대체 실행 경로로 확보하는 것이 중요하게 다뤄진다.
Quifos 9B, ONIF, Ornith 같은 로컬 모델은 무료·비공개 실행과 실험 가능성이 장점이지만, 영상에서는 아직 프런티어 클라우드 모델 수준의 안정성과 품질에는 못 미친다고 평가한다.
Hermes Mixture of Agents와 Goldie Bench는 여러 모델을 council처럼 조합하고 실제 산출물 중심으로 비교하려는 시도이며, 단일 모델보다 시스템 설계가 더 큰 성능 레버리지가 될 수 있다는 메시지를 전달한다.
Open SEO, 리드 생성, 콘텐츠 생성, Obsidian 메모리, 음성 입력, Paperclip식 에이전트 조직화까지 연결되면서 Agent OS는 단순 챗봇 묶음이 아니라 SEO·콘텐츠·자동화·지식관리 허브로 제시된다.

🧩 배경과 문제 정의

이 영상은 로컬 모델, 무료 API 모델, Hermes 기반 에이전트 환경, Open SEO, Obsidian 메모리, 벤치마크 시스템을 하나의 Agent OS 안에 통합하는 과정을 다룬다.
핵심 문제는 Claude 같은 프런티어 모델에만 의존하면 사용량 제한, 서비스 혼잡, 비용, 벤더 종속, 데이터 프라이버시 문제가 생긴다는 점이다.
이를 해결하기 위해 Quifos 9B, ONIF, Ornith, Ollama, LM Studio, OpenRouter, Nous Portal 같은 로컬·무료 모델 경로를 Agent OS에 연결하려 한다.
Goldie Bench는 모델 성능을 감각이 아니라 실제 과제와 결과물로 비교하기 위한 기준으로 쓰이며, 로컬 모델과 프런티어 모델은 별도 리더보드로 분리해야 한다.
Hermes Mixture of Agents와 council engine은 여러 모델의 답변을 결합해 단일 모델보다 나은 결과를 만들려는 시도이며, 새 프런티어 모델 출시를 기다리는 대신 현재 접근 가능한 모델들을 조합하는 전략을 보여준다.
Agent OS의 목표는 SEO, 리드 생성, 콘텐츠 제작, 음성 제어, 메모리, 로컬 엔진, 커뮤니티 지원을 한 작업공간에 묶어 비기술 사용자도 반복 가능한 자동화 시스템을 운영하게 만드는 것이다.

🕒 시간순 섹션별 상세정리

1. 라이브 작업 범위와 Agent OS 통합 방향

초반 작업 범위는 Quifos 9B 로컬 모델 설치·테스트, ONIF 추가 작업, Hermes mixture of experts 테스트, DeepSeek DSpark 확인, Open SEO 검토로 잡힌다 [00:58]
여러 모델과 앱을 단발성 실험이 아니라 Agent OS 안에 계속 통합하는 흐름으로 다루며, 커뮤니티 Q&A도 같은 빌드 과정에 포함된다 [01:27]

2. 로컬 엔진 설정과 Goldie Bench 테스트 준비

새 모델은 로컬 엔진에 설치된 뒤 실제 실행 테스트까지 이어져야 하며, 성능 저하가 생기지 않는지가 초기 확인 포인트가 된다 [01:57]
Goldie Bench에는 일반 테스트뿐 아니라 Hermes mixture of experts 조합을 사용한 벤치마크가 추가되며, 어떤 모델을 쓰는지 명확히 기록해야 한다 [03:22]

3. Open SEO와 Claude 혼잡 문제

Open SEO는 SEO 섹션 안에 별도 탭으로 들어가며, 기존 도구 묶음과 분리된 작업 공간을 갖는다 [04:44]
Open SEO 설정에는 API 키 확보가 필요하고, 도구 연결이 끝나면 별도 가이드까지 남겨야 하는 운영 작업으로 계속된다 [05:05]

4. 로컬 모델 전용 벤치마크 섹션 구성

Goldie Bench 안에는 로컬 모델만 다루는 별도 섹션이 필요하며, Quifos·ONIF·North Mini Code처럼 이미 테스트한 모델들이 한곳에 모여야 한다 [07:57]
ONIF는 백그라운드에서 실행되며 벤치마크를 계속 돌리는 대상으로 들어가고, 로컬 모델 비교는 단순 목록이 아니라 실제 테스트 흐름과 연결된다 [08:17]

5. Hermes용 무료 모델과 OpenRouter 대안

Hermes에서는 무료 모델 선택지가 여러 개 있으며, Nous Portal에는 Step 3.7 Flash와 Neatron 3 Ultra 같은 무료 모델이 포함된다 [10:02]
무료 모델은 계속 추가되는 구조라서 단일 제공자에 고정하기보다 사용 가능한 엔드포인트를 주기적으로 확인하는 방식이 유리하다 [10:24]

6. 로컬 실행 옵션과 코딩 플랜 기반 선택지

로컬 실행은 LM Studio나 Ollama를 통해 가능하며, North Code와 Gemma 4 같은 에이전틱 모델용 무료 옵션도 후보가 된다 [11:07]
성능이 좋은 장비에서는 Qwen 3.6 같은 모델도 로컬로 사용할 수 있지만, 실제 가능 여부는 하드웨어 구성에 좌우된다 [11:29]

7. Hermes 무료 모델 접근과 가이드 구성

Hermes에서는 무료 모델을 쓰는 여러 선택지가 있으며, 구독 기반 접근이나 OAuth 로그인 같은 방식도 선택지에 포함된다 [12:00]
무료 모델 사용법은 별도 가이드로 만들 만한 수요가 있고, Hermes에서 사용할 수 있는 무료 모델과 접근 방식을 한곳에 모으는 방향이 잡힌다 [12:44]

8. 음성 입력 기반 작업 환경과 Hermes 선호 이유

질문의 핵심은 말하면서 동시에 많은 작업을 처리하는 방식이며, 걷는 트레드밀과 Whisper Flow를 결합한 작업 환경이 생산성을 만든다 [14:28]
Whisper Flow를 통해 AI에게 빠르게 말하고 필요한 내용을 입력 형태로 전환할 수 있으며, 실제 작업의 상당 부분은 AI가 처리한다 [14:36]

9. 클라우드 모델 중심 운영과 로컬 모델의 한계

대부분의 작업에서는 클라우드 기반 모델을 선호하며, 로컬 모델만으로는 같은 수준의 결과를 안정적으로 얻기 어렵다 [19:48]
로컬 모델은 Agent OS 안에서 사용할 수 있는 시스템이 마련돼 있지만, 프런티어 모델 수준에는 아직 못 미치며 대략 1년 정도 뒤처진 느낌이 있다 [20:00]

10. Obsidian vault와 에이전트 메모리 시스템

Obsidian vault는 작업 환경 안에서 실제로 연결된 저장소이며, 에이전트가 참조하는 메모리 공간 역할을 한다 [21:09]
이 vault는 단순 파일 저장소가 아니라 second brain에 가까운 구조로, 지식과 작업 맥락을 축적하는 기반이 된다 [21:15]

11. 동시 실행 모델 선택과 성능 병목 관리

여러 모델이나 작업을 한꺼번에 모두 실행하는 방식은 권장되지 않으며, 백그라운드에서는 North Mini 정도를 제한적으로 활용할 수 있다 [21:47]
동시에 Quos를 사용하고 있기 때문에 추가 모델 실행이 전체 시스템을 느리게 만들지 않도록 관리해야 한다 [21:57]

12. 스킬 업데이트와 산출물 품질 기준

인용문 정렬이 계속 어긋나고 있으며, 전날 이미 중앙 정렬을 항상 적용하도록 스킬을 업데이트하라는 지시가 있었지만 아직 반영되지 않았다 [24:03]
가이드 페이지는 더 시각적이고 아름다워야 하며, 매번 chatty hero image를 넣도록 스킬과 API 사용 기준을 업데이트해야 한다 [24:24]

13. Agent OS 배포 목적과 로컬 테스트 기준

Agent OS는 AI Profit Boardroom 멤버에게 무료로 제공되는 구성물이며, 멤버들이 실제 기능을 확인하고 도움을 받게 하는 목적이 크다 [26:45]
벤치마크가 로컬 기준이라면 API가 아니라 로컬 실행만 사용해야 평가 결과가 오염되지 않는다 [27:19]

14. Agent OS를 만드는 두 가지 경로

개인 Agent OS를 만들려면 원하는 구조를 Claude나 Hermes 안에 구체적으로 적고, 그 지시를 바탕으로 직접 구축을 시작할 수 있다 [28:21]
다른 선택지는 AI Profit Boardroom에서 이미 만들어진 Agent OS 설정을 받는 것이며, 기능이 포함된 구성물을 멤버에게 제공하는 방식이다 [28:34]

15. Obsidian 메모리 사용 여부 점검

Obsidian을 Claude와 함께 설치했지만 제대로 쓰이는지 확신이 없다면, 실제로 업데이트되고 있는지와 마지막 업데이트 시점을 먼저 확인해야 한다 [29:13]
Claude에 메모리를 사용하고 있는지 직접 물어보고, Obsidian 그래프와 저장된 기억이 최신 상태인지 확인하면 정상 작동 여부를 빠르게 판단할 수 있다 [29:27]

16. 멘토링, 설치형 Agent OS, 사용자 사례

멘토링이 필요하면 AI Profit Boardroom 안에서 직접 메시지를 보낼 수 있고, 커뮤니티에는 매일 질문 답변과 튜토리얼 접근권이 포함된다 [29:51]
Agent OS는 사전 구성된 상태로 제공되며, zip 파일을 에이전트와 함께 설치하면 바로 사용할 수 있는 전체 설정으로 동작한다 [30:12]

17. Hermes 리드 생성 도구와 GPT 5.6 접근성

Hermes 안에는 SaaS처럼 보이는 리드 생성 도구가 있으며, 대시보드에서 연락한 리드를 관리하고 원하는 리드 유형을 직접 입력할 수 있다 [33:53]
링크 빌딩에 관심 있는 SEO 에이전시처럼 조건을 넣고 find and enrich를 실행하면 연락처가 포함된 리드 목록이 생성되고 자동으로 보강된다 [34:19]

18. 벤치마크와 데이터 품질 검토

벤치마크 진행 상황을 확인하면서 이후 워크플로우와 예시를 함께 다룰 흐름으로 넘어간다 [36:08]
일부 도구의 데이터 품질은 다른 도구보다 떨어질 수 있으며, 최종 판단은 직접 테스트를 통해 확인해야 한다 [37:09]

19. 기본 CRM에서 사용자 맞춤형 Agent OS로 확장

현재 구성은 매우 기본적인 CRM 수준이지만, 필요한 기능을 더 붙이거나 원하는 방식으로 바꾸는 출발점이 된다 [38:08]
Claude나 다른 에이전트에게 기능 추가, 변경, 조정을 지시하면 Agent OS 내부의 여러 부분을 사용 목적에 맞게 재구성할 수 있다 [38:21]

20. 테스트 증거, 모델 비교, 비용·한도 관리

42개 테스트를 모두 수행해야 하며, mixture of agents가 실제 설정 안에서 사용됐다는 증거도 함께 남아야 한다 [40:02]
가이드에는 Claude 4.8과의 비교가 포함돼야 하며, Fusion 같은 다른 모델과 성능을 견줘볼 수 있어야 한다 [40:26]

21. 애니메이션 워크플로우와 시각적 예시 보강

가이드에는 애니메이션 워크플로우가 빠져 있으며, 도구 자체를 상단에 배치해야 사용자가 결과물을 즉시 확인할 수 있다 [42:12]
애니메이션 워크플로우와 다이어그램은 Agent OS 작동 방식을 이해시키는 중요한 요소라서, 이후 작업에서도 빠지지 않도록 스킬에 반영해야 한다 [42:27]

22. CTA와 가이드 내 결과물 쇼케이스 개선

CTA는 너무 짧고 기본적인 수준에 머물러 있으며, Agent OS로 얻는 구성과 가치를 더 길고 구체적으로 안내해야 한다 [45:13]
페이지 안에는 두 개의 CTA가 들어가야 하며, 가격 부담이 크지 않다는 점과 제공되는 내용을 함께 드러내야 한다 [45:20]

23. Hermes·Claude·Codex 조합과 공개 도구 조건

Hermes는 Codex보다 선호되는 선택지로 평가되며, Claude와 Hermes를 비교하면 Claude가 더 우선순위에 놓인다 [46:29]
Codex를 Hermes에 직접 연결하면 두 도구의 장점을 함께 활용할 수 있고, Agent OS 내부에서 Codex와 Hermes를 동시에 쓰는 구성도 가능하다 [46:43]

24. Claude 사용 한도와 라이브 Q&A 전환

Claude 사용 한도에 자주 걸린다는 문제가 나오지만, 사용량과 작업 방식에 따라 체감 차이가 크고 일부 환경에서는 큰 문제가 되지 않는다 [50:44]
본격적인 온보딩 Q&A로 넘어갈 흐름이 잡히며, 이후 논점은 개별 도구 선택과 에이전트 운영 방식으로 이동한다 [51:00]

25. Hermes mixture of agents 페이지 구성 점검

Hermes mixture of agents 결과물이 확인되고, 단순 showcase 형태보다 Hermes workspace처럼 전체를 더 쉽게 미리 보고 파악할 수 있는 레이아웃이 필요해진다 [51:58]
builds 페이지의 showcase 구성보다 workspace형 배치가 preview와 전체 구조 확인에 유리하다는 요구가 붙는다 [52:21]

26. Goldie Bench 레이아웃과 비교 페이지·리더보드 정비

Goldie Bench의 Hermes mixture of agents 페이지는 다른 페이지들과 같은 레이아웃을 맞춰야 하며, 비교 페이지와 관련 구성도 함께 정리되어야 한다 [53:48]
현재까지 진행된 작업을 바탕으로 리더보드 업데이트까지 이어져야 하므로, 페이지 디자인과 벤치마크 데이터 표시가 한 흐름 안에서 연결된다 [53:57]

27. CTA 진행 상황과 로컬 모델 리더보드 분리

CTA 작업의 진행 위치가 확인 대상이 되며, 페이지 완성도는 레이아웃뿐 아니라 사용자 행동 유도 요소까지 포함한다 [56:39]
Orif 같은 로컬 모델을 일반 리더보드에 넣으면 Frontier 모델과 직접 비교되어 공정성이 떨어진다 [57:06]

28. Claude 선호와 Agent OS 선택 이유

Claude와 Hermes 중 하나를 고른다면 Claude를 선택할 만큼 Claude의 성능 가치가 크게 평가된다 [57:40]
Hermes workspace와 Hermes desktop 대신 Agent OS를 선택하는 편이 낫고, 이유는 더 많은 커스터마이징과 더 강한 확장성이다 [57:54]

29. 단일 모델 의존을 피하는 운영 방식

핵심은 모든 요소가 내장된 시스템을 갖추고, 하나의 에이전트나 하나의 모델에 의존하지 않는 구조를 만드는 것이다 [58:39]
여러 모델 사이를 전환할 수 있는 운영 방식이 2026년에 AI를 쓰는 더 영리한 방식으로 자리 잡는다 [58:47]

30. Agent OS의 통합 기능과 에이전트 조합

Agent OS는 Paperclip AI 에이전트 그룹 채팅과 아이디어-구현 파이프라인을 결합해 앱, 웹사이트, 도구, 랜딩페이지 제작을 단일 클릭 워크플로로 묶는다 [1:00:05]
신규 기능은 Hermes의 이메일·리드 생성, Hermes Oracle의 최신 뉴스 수집, Jarvis 음성 제어, Studio 생성 영역처럼 Agent OS 안에서 실행 가능한 작업 범위를 넓힌다 [1:00:21]

31. 커스텀 에이전트 요청과 커뮤니티 기반 확장

커스텀 에이전트 수요는 agent requests 스레드에 모이고, 사용자는 필요한 에이전트 요청을 제한 없이 올릴 수 있다 [1:04:28]
이미 존재하는 에이전트는 기존 빌드로 연결되고, 없는 에이전트는 새 구축 대상으로 넘어가면서 반복 수요와 신규 자동화 요청이 같은 채널에서 처리된다 [1:04:40]

32. SEO pack과 API·CLI 교체 가능성

SEO pack은 Open SEO를 포함해 키워드 리서치, 랭크 트래킹, SEO 자동화를 한 영역에 묶고, 콘텐츠 발행까지 연결하는 성장용 자동화 모듈이다 [1:05:15]
Hermes가 필수 조건은 아니며, 설정 단계에서 원하는 API나 CLI를 지정하면 Claude CLI 같은 대체 실행 환경도 SEO 섹션에 붙일 수 있다 [1:05:34]

33. Obsidian 메모리 연결과 콘텐츠 개인화

Hermes와 Obsidian이 모두 로컬에 있을 때 Obsidian 로컬 디렉터리와 공식 문서 경로를 Hermes에 넘기면 메모리 연결을 자동화할 수 있다 [1:06:58]
매번 Hermes 사용 시 Obsidian memory를 업데이트하거나 하루 한 번 메모리를 통합해 daily log로 저장하는 운영 방식이 가능하다 [1:07:21]

34. 로컬 모델과 Agent OS 실행 엔진 교체

Agent kanban과 local engine 영역은 로컬 시스템을 Agent OS에 붙이는 구조이며, Quifos 같은 새 로컬 모델도 AI 에이전트 실행에 사용할 수 있다 [1:08:32]
원하는 로컬 모델의 상세 정보를 Agent OS 구축 에이전트에 넘기면 기본 모델을 특정 모델로 바꾸거나, 새 모델 설치 때마다 기본값을 최신 버전으로 바꿀 수 있다 [1:08:54]

35. Claude Code 계열 설정과 커스터마이징 원칙

Free Claude Code와 OmniRoute 조합은 직접 사용 경험이 아니라 예시 GitHub 확인 수준이며, Claude Code 안에서 원하는 모델을 쓰는 방법은 여러 갈래로 열려 있다 [1:09:39]
현재 기본 방식은 free Claude Code GitHub를 쓰는 쪽이지만, 선호하는 GitHub setup이 있으면 Agent OS 안에 꽂아 넣고 기존 구성을 대체할 수 있다 [1:10:01]

36. OMI와 Obsidian 기반 자동 메모리 시스템

OMI는 하루 동안 대화와 작업 내용을 계속 관찰해 daily memories를 만들고, 최근 작업인 Goldie Bench와 AI 모델 리더보드 관련 내용까지 Obsidian에 들어갈 맥락으로 축적한다 [1:12:35]
생성된 메모리는 Obsidian으로 쉽게 동기화되며, 약 3,000개의 memory가 HNOS에 연결되어 개인의 second brain을 매일 자동 업데이트하고 정리하는 구조를 만든다 [1:13:03]

37. Claude Projects로 팀용 작업 컨텍스트를 묶는 방식

Claude Projects는 개인 작업 정리뿐 아니라 팀원에게 자동화 프로젝트 접근 권한을 주는 방식으로 쓰일 수 있고, 팀 단위 운영에서는 이 구조가 더 적합하다 [1:15:39]
이메일 작성 프로젝트에는 이전 대화, custom memory, custom instructions, 선호 이메일 예시가 함께 들어가 팀원이 같은 스타일의 이메일을 자동으로 만들 수 있다 [1:16:16]

38. OpenClaw에서 Hermes로 옮긴 이유와 안정성 차이

OpenClaw는 반복적으로 깨지는 문제가 있었고, 도구 자체를 고치는 데 시간이 많이 들어가면서 실제 빌드와 운영에 쓰는 시간이 줄어드는 리스크가 생겼다 [1:17:58]
Hermes는 업데이트가 더 매끄럽게 작동하고, 새 기능이 안정적으로 추가되면서 OpenClaw보다 작업 환경으로 쓰기 좋은 선택지가 된다 [1:18:15]

39. Mixture of Agents와 여러 모델 협업 빌드

Hermes Mixture of Agents는 여러 모델이 함께 작업하는 구조이며, OpenRouter를 통해 패널 형태로 모델들을 묶고 하나의 요청을 함께 처리할 수 있다 [1:18:30]
여러 에이전트 조합은 전체 OS나 러닝 게임 같은 복잡한 산출물을 만들었고, 구성과 실행 과정도 비교적 간단하다 [1:18:43]

40. Ollama·GLM 5.2·Claude Code 연결 점검

Ollama와 GLM 5.2를 Claude Code와 함께 쓰려는 설정 문제가 나오고, 실제 동작 여부를 터미널 명령으로 바로 확인하는 방식이 선택된다 [1:20:09]
Ollama가 실행 중이면 llama launch claude model GLM 5.2 cloud 형태의 명령으로 Claude 모델 연결을 시도할 수 있고, 해당 환경에서는 정상 작동한다 [1:20:32]

41. Agent OS의 커뮤니티 지원과 통합 도구 구성

Agent OS와 커뮤니티 질문 답변 흐름은 마무리 단계에 들어가며, AI Profit Boardroom에서는 질문을 올리고 매일 튜토리얼 형태의 답변과 지원을 받을 수 있다 [1:22:37]
커뮤니티 규모는 약 3,800명이며, 구성원들은 거의 24시간 도움을 주고받을 수 있어 개인이 막힌 설정이나 빌드 문제를 혼자 해결하지 않아도 된다 [1:22:58]

42. Agent OS 안에 여러 AI 기능과 최신 도구가 통합된다

Hermes Oracle은 최신 뉴스를 매일 24시간 주기로 자동 갱신하고, 사용자는 Agent OS 안에서 최신 정보를 계속 받아볼 수 있다 [1:24:06]
Studio는 영상·이미지·음성 생성을 처리하고, outreach 시스템은 리드 생성과 이메일 작업을 담당해 콘텐츠 제작과 영업 자동화가 같은 공간에 묶인다 [1:24:14]

43. 교육·커뮤니티·비용 장벽을 낮추는 운영 구조

classroom에서는 Agent OS 접근 권한과 설치 파일을 받을 수 있고, 매일 업데이트되는 영상 튜토리얼과 유용한 신규 도구 가이드가 제공된다 [1:25:18]
community에는 실시간 접속자가 있고, 질문 답변과 도움 요청이 가능한 구조라서 설치나 활용 중 막히는 지점을 혼자 해결하지 않아도 된다 [1:25:35]

44. 벤치마크는 모델 성능 비교의 기준으로 쓰인다

벤치마크는 모델이 실제로 좋은지 확인하기 위한 테스트 방식이고, 여러 모델을 같은 기준으로 비교해 성능 순위를 매기는 데 쓰인다 [1:27:13]
모델별 테스트 결과를 보고 어떤 모델이 가장 잘 수행하는지 판단하므로, 벤치마크 1위는 감각적 평가가 아니라 비교 테스트 결과에 기반한다 [1:27:21]

45. Open SEO로 키워드 조사와 순위 추적을 자동화한다

Open SEO는 무료 오픈소스 프로젝트이고, Agent OS의 SEO 섹션에 연결되어 자체 SEO 도구처럼 사용할 수 있다 [1:29:40]
키워드 조사에서는 Hermes agent 같은 검색어를 넣고 국가, 결과 수, 자동 관련 제안, 아이디어 유형을 바꿔 검색할 수 있어 조사 조건을 직접 제어할 수 있다 [1:29:58]

46. 도메인·경쟁사 분석과 AI 워크플로 연결

domain overview에서는 특정 도메인을 입력해 트래픽, 순위, 검색량, 점수 기준으로 분석하고, 경쟁사가 어떤 키워드와 페이지에서 트래픽을 얻는지 확인할 수 있다 [1:31:39]
분석 결과에는 경쟁사 순위 키워드, 트래픽이 들어오는 페이지, 키워드 포지션, 트래픽 볼륨, 전체 점수가 포함되어 자사와 경쟁사 SEO 상태를 비교할 수 있다 [1:31:53]

47. SEO 데이터에서 콘텐츠 생성·배포까지 계속된다

Open SEO GitHub 프로젝트에는 link prospecting, competitor analysis, keyword clustering, keyword research, SEO coach, SEO project setup이 포함되어 단순 키워드 프롬프트보다 완성형 SaaS 도구에 가깝다 [1:33:16]
API 키를 연결하면 여러 웹사이트나 클라이언트별 프로젝트를 관리할 수 있고, Agent OS에 이미 연결된 SEO 워크플로와 바로 계속된다 [1:33:55]

48. SEO 시스템화와 리드 생성 활용

SEO를 시스템화할수록 순위 개선에 유리해지고, Agent OS 안의 13단계 SEO 품질관리 스킬이 자동화 결과를 단계별로 점검한다 [1:36:00]
Open SEO 기반 시스템을 웹사이트에 연결하면 가입자를 위한 무료 감사 도구를 만들 수 있고, 이 도구가 리드 생성·트래픽 확보·사이트 구축의 출발점이 된다 [1:36:36]

49. Open SEO와 Agent OS 통합 구조

Open SEO는 무료 오픈소스 셀프호스팅 SEO 리서치 도구이며, Agent OS 안에서 별도 탭으로 연결돼 키워드 조사·순위 추적·백링크 설정을 다룬다 [1:37:02]
월 구독형 SEO 도구의 제한과 낮은 커스터마이징 문제가 줄어들고, DataForSEO API를 붙여 필요한 만큼 데이터 사용 방식을 바꿀 수 있다 [1:37:20]

50. 키워드·경쟁사·AI 검색 노출 분석

키워드 리서치 도구는 SEO에서 쉬운 승리 지점을 찾고, SERP 자동화는 구글 첫 페이지의 기존 상위 콘텐츠를 확인한 뒤 더 나은 콘텐츠 구조를 역설계한다 [1:37:50]
도메인 뷰에 경쟁 사이트를 넣으면 상대가 순위를 얻는 키워드와 아직 확보하지 못한 기회를 비교할 수 있고, 어떤 도메인이든 패널에서 분석을 시작할 수 있다 [1:38:08]

51. MCP와 SEO 파이프라인 자동화

Prompt Explorer와 MCP 서버를 통해 Claude나 Hermes가 Open SEO 데이터를 자동으로 가져올 수 있고, 에이전트가 해당 데이터를 바탕으로 SEO 작업을 직접 자동화한다 [1:38:52]
Open SEO 데이터는 맞춤 SEO 파이프라인으로 들어가고, 그 결과물이 여러 웹사이트에 배포되는 구조로 확장된다 [1:39:10]

52. 전체 Agent OS 구성과 커뮤니티 지원

Open SEO는 전체 Agent OS의 한 탭이며, 전체 구성에는 SEO 파이프라인, 로컬 Hermes 엔진, SEO 에이전트 팀, Claude 워크스페이스, CLI 연결, 무료 로컬 모델이 포함된다 [111:08] [1:51:23]
AI mastermind와 memory galaxy를 통해 여러 에이전트가 비즈니스 맥락을 공유하고, SEO 콘텐츠 작성 시 메모리의 맥락을 끌어와 더 고유한 답변과 콘텐츠를 만든다 [111:23] [1:51:28]

53. 무료 모델 활용 방식의 범위 설정

Hermes에서 직접 쓸 수 있는 무료 모델을 중심으로 네 가지 사용 방식을 비교하며, 각 방식의 사용법과 효율적인 활용 방법이 핵심 기준이 된다 [112:23] [1:51:33]
Step 3.7 Flash와 Nimatron 같은 모델이 Hermes Agent에서 무료로 제공된 사례가 있으며, 무료 플랜에서도 선택 가능한 모델 목록을 확인할 수 있다 [113:27] [1:53:37]

54. OpenRouter를 통한 무료 모델 연결

Hermes에서 Hermes model을 다시 실행해 OpenRouter provider로 전환하고 API key를 입력하면, OpenRouter 모델 목록을 선택할 수 있다 [115:10] [1:55:10]
OpenRouter는 custom model name 입력을 지원하므로, 기본 목록에 없는 무료 모델도 직접 지정해 Hermes에 연결할 수 있다 [115:25] [1:55:25]

55. profile 분리로 무료 API와 모델 운영 정리

Nous Portal과 OpenRouter를 포함한 여러 무료 접근법을 조합하면 Hermes 사용 비용을 거의 들이지 않는 운영 방식이 가능해진다 [115:51] [1:55:51]
Agent OS 안에서 API별로 separate profile을 만들면, 각 모델과 provider의 API key를 독립적으로 관리할 수 있다 [117:53] [1:56:55]

56. Ollama로 로컬 모델을 Hermes에 연결

로컬 모델을 Hermes에 붙이는 첫 번째 방식은 Ollama를 설치한 뒤 원하는 모델 페이지에서 실행 명령을 가져오는 절차다 [118:45] [1:58:00]
Orif 모델을 예로 들면, Ollama가 설치·업데이트된 상태에서 모델 실행 명령을 복사해 터미널에서 pull 또는 run하면 로컬 모델 준비가 끝난다 [119:00] [1:59:04]

57. LM Studio로 로컬 실행 가능성 판단

로컬 모델 연결의 다른 선택지는 LM Studio provider이며, LM Studio는 무료로 다운로드해 모델 관리에 사용할 수 있다 [120:16] [2:00:16]
LM Studio는 사용자의 로컬 환경에 맞는 모델을 확인하게 해주며, 너무 큰 모델과 실제 실행 가능한 모델을 구분하는 grade를 제공한다 [150:53] [2:01:13]

58. 로컬 모델과 프로필로 비용과 토큰 사용량 줄이기

로컬 모델은 현재 장비에서 너무 큰 모델을 피하고, 스크롤하며 실행 가능한 모델을 고르면 Hermes에서 무료 실행 환경으로 연결할 수 있다 [151:23] [2:02:17]
Hermes의 모델 설정에서 LM Studio나 Ollama로 모델을 바꾸면 로컬 모델을 Hermes Agent와 연결하는 흐름이 완성된다 [151:38] [2:03:21]

59. 무료 사용 경로는 OpenRouter, 로컬 모델, 기존 구독 OAuth로 나뉜다

Agent OS 안에 여러 프로필을 정리해두면 만든 프로필을 한눈에 보고, 상황에 따라 빠르게 전환하며 재사용할 수 있다 [152:38] [2:05:44]
무료 모델 경로는 Nous Portal, OpenRouter, 로컬 모델로 나뉘며, 접근 난이도 기준으로는 OpenRouter가 가장 쉽고 그다음이 로컬 모델, Nous Portal 순서에 가깝다 [152:53] [2:05:59]

60. 토큰 절감 구성은 비용, 프라이버시, 벤더 종속 문제를 낮춘다

Headroom은 Codex 같은 모델 사용 시 토큰 사용량을 줄이는 수단으로 언급되며, Blank slate와 함께 쓰면 도구가 많은 에이전트보다 가벼운 실행 환경을 만들 수 있다 [153:53] [2:06:14]
기존 방식에서는 API 비용, 모델 선택 부담, 특정 벤더 종속, 개인 데이터의 외부 클라우드 전송 문제가 동시에 발생한다 [154:08] [2:08:38]

61. Agent OS는 Hermes 기능과 커뮤니티형 운영 지원을 묶는다

Agent OS에는 Hermes와 여러 에이전트가 이미 연결되어 있어, 무료 옵션을 일일이 수동으로 구성하지 않아도 되는 패키지형 환경을 목표로 한다 [155:08] [2:08:43]
구성에는 Hermes, 로컬 엔진, 주 4회 코칭콜, 3,800명 규모의 멤버십이 포함되며, Hermes용 커스텀 기능도 함께 들어간다 [155:23] [2:08:58]

62. Paperclip은 다중 에이전트 팀을 조직처럼 운영하려는 문제에서 출발한다

질문이 있으면 바로 물어볼 수 있는 지원 맥락이 열려 있고, 이후 주제는 Hermes 무료 사용에서 Paperclip 기반 에이전트 조직 운영으로 이동한다 [156:38] [2:12:20]
일반적인 AI 에이전트 사용은 채팅 안에서 대화하거나 무언가를 빌드하게 하는 수준에 머물며, 여러 에이전트가 함께 일하는 구조와 작업 조직화가 부족하다 [156:53] [2:12:35]

63. 경쟁 시스템과의 차이는 조직도와 proactive inbox에 있다

다른 페이지들도 비슷한 기능을 하는지에 대한 질문이 나오지만, 비교 기준은 에이전트가 조직도처럼 배치되어 함께 일하는지 여부로 좁혀진다 [158:08] [2:13:01]
유사 시스템과의 차이는 AI 에이전트들이 조직 구조 안에서 함께 움직이는 org chart와, 에이전트가 사용자에게 먼저 inbox로 연락하는 proactive 구조에 있다 [158:23] [2:13:16]

64. Hermes council engine과 mixture of agents 구조

Hermes mixture of agents는 여러 agent가 함께 작업한 뒤 아이디어를 융합해 더 나은 출력을 만드는 방식이며, 접근 가능한 모델 조합으로 지능 수준을 높이려는 문제의식에서 출발한다 [158:53] [2:16:18]
Hermes council engine은 프런티어 모델 패널과 chair 모델로 구성되고, 42개 과제 기반 Goldie Bench에서 전체 2위에 올라 대부분의 단일 모델보다 높은 순위를 기록한다 [159:08] [2:16:33]

65. 탭 기반 구현과 chair aggregator의 역할

Agent OS 내부의 새 탭에서 Opus 4.8과 GPT 5.5 같은 여러 provider 모델을 함께 선택하고, 하나의 질문에 대해 각 모델이 동시에 비공개 답변을 생성한다 [159:38] [2:19:19]
chair 모델은 두 답변을 읽고 판단한 뒤 하나의 최종 답변으로 합치며, 목표는 개별 답변보다 더 나은 단일 출력을 만드는 것이다 [159:53] [2:19:24]

66. Goldie Bench와 실제 결과물 중심의 성능 검증

Goldie Bench는 연구실의 추상 벤치마크보다 실제 프롬프트 결과물을 직접 비교하려는 목적에서 만들어졌고, 사용자는 생성된 답변과 결과물을 직접 확인해 판단할 수 있다 [160:23] [2:19:27]
Hermes mixture of agents는 leaderboard에서 Fusion 바로 아래 2위를 차지하며, 이 순위는 예시 프롬프트와 생성 결과를 통해 검증 가능한 형태로 공개된다 [160:38] [2:21:05]

67. Fusion 및 Opus 4.8과의 시각·게임 출력 비교

Fusion과 Hermes의 Dragon Realm 결과는 모두 높은 품질을 보이며, Hermes 쪽이 2D에 가깝지만 일부 장면에서는 더 보기 좋은 결과로 느껴질 정도의 경쟁력을 가진다 [161:08] [2:21:36]
Opus 4.8과 Hermes mixture of agents를 비교하면, Hermes의 Neon City 결과는 더 자유롭게 움직일 수 있고 덜 선형적인 느낌을 준다 [161:23] [2:23:08]

68. 새 모델 대기보다 시스템 조합이 더 큰 레버리지

Fable 5와 GPT 5.6은 아직 비교가 제한적이지만, 현재 leaderboard 상단에서는 Fusion과 mixture of agents가 가장 높은 품질의 출력 생성 방식으로 자리한다 [162:08] [2:24:29]
핵심은 새 모델을 기다리는 것이 아니라 시스템을 만드는 것이며, 오늘 접근 가능한 모델들의 조합만으로도 다른 모델들을 앞서는 결과가 나온다 [162:23] [2:24:49]

69. Agent OS 작업공간과 교체 가능한 모델 엔진

Agent OS의 mixture 설정은 terminal보다 작업공간 기반 사용성이 높고, 생성물 확인·모델 전환·panel 실행을 한 화면 안에서 처리할 수 있다 [177:25] [2:25:53]
Fusion이나 Sakana Fugu 같은 대안도 비슷한 방식으로 채팅, 결과물 확인, side-by-side 비교, 작업공간 운영이 가능하지만 Hermes mixture of agents보다 성능이 낮은 사례도 있다 [177:40] [2:26:56]

70. 에이전트 운영체제 구성과 저비용 실행

에이전트 운영체제에는 Hermes, Claude, OpenClaw, 공유 메모리 대시보드, mixture 탭, 모델 council, Fusion·Sakana 패널이 함께 묶인다 [211:06] [2:28:02]
주간 코칭, 일일 튜토리얼, 30일 로드맵, 토큰 최적화 튜토리얼이 포함되며, 저렴하거나 무료에 가까운 모델로도 운영할 수 있는 비용 구조가 중요해진다 [211:21] [2:29:06]

71. 단일 모델 추격의 한계와 모델 council의 장점

단일 모델을 고르고 다음 출시를 기다리는 방식은 모델 성능 천장, gated frontier model 접근 제한, 비싼 API 비용 때문에 계속 뒤처질 위험이 있다 [211:36] [2:32:09]
여러 모델을 virtual council로 섞으면 현재 공개된 모델만으로 단일 모델보다 나은 결과를 만들 수 있고, 더 싸거나 더 좋은 모델이 나오면 구성 요소를 바꿔 끼울 수 있다 [211:51] [2:32:14]

72. 복잡성 우려와 프런티어 모델 대기 전략의 리스크

모델을 쌓는 방식이 실험실용으로만 보일 수 있지만, 한 화면에서 입력하고 한 번에 실행하는 구조는 여러 챗봇 탭을 따로 여는 방식보다 단순하다 [212:21] [2:32:19]
GPT 5.16이나 Fable 5 같은 다음 세대 모델은 출시일이 확정되지 않았고, 앞으로 최신 프런티어 기술이 대중에게 바로 공개되지 않을 가능성도 있다 [212:36] [2:32:34]

73. 비전문가 접근성과 실사용 증거

비기술 사용자도 에이전트 운영체제를 사용할 수 있다는 근거로 191페이지 분량의 성과와 testimonial이 제시되며, 튜토리얼과 커뮤니티 사례가 진입 장벽을 낮춘다 [213:06] [2:34:28]
Hermes Mixture of Agents의 성능은 Goldie Bench, Opus와의 side-by-side 비교, Fusion과의 비교를 통해 검증 가능한 증거로 다뤄진다 [213:21] [2:34:43]

74. 업무 자동화 사례와 Agent OS 활용 방식

영상 자동화 시스템은 아바타 삽입, 리서치, 스크립트 작성, 보이스오버 생성, 조립까지 처리하며, 프런티어 모델 없이도 대부분의 사용자보다 나은 산출물을 만든다 [213:51] [2:36:37]
SEO 배포 시스템은 Google Search Console이나 OpenSEO 기반 키워드 리서치, 콘텐츠 생성, 웹사이트 배포를 자동화하며, 좋은 모델보다 좋은 시스템이 더 직접적인 성과 요인이 된다 [214:06] [2:36:52]

75. 커뮤니티 안내와 종료 후 실시간 반응

Claude 웹디자인 등 새 튜토리얼, 주간 코칭콜, 지역 사용자 네트워킹이 커뮤니티 안에 포함되며, Agent OS 학습과 운영을 지속하는 지원 구조가 중요하다 [214:36] [2:40:44]
본문 발표가 끝난 뒤에는 감사 인사와 긍정적 댓글 고정이 이어지고, 실시간 반응을 유지하는 짧은 상호작용이 남는다 [214:51] [2:40:49]

76. 짧은 호출과 반복음으로 시작되는 전환 구간

hey가 간헐적으로 반복되며, 논증형 문장이나 기술 개념 없이 청각적 리듬이 먼저 형성된다 [215:36] [2:40:54]
같은 호출이 다시 등장하지만 구체적인 주체, 사건, 변화는 드러나지 않고 분위기 조성에 가까운 발화만 계속된다 [215:51] [2:41:58]

77. Heat 반복과 종교적 감탄이 섞이는 구간

Heat가 세 차례 반복되며, 특정 기술적 맥락보다 강도 높은 감정·에너지 표현이 중심이 된다 [216:06] [2:43:03]
Hallelujah가 단독으로 등장하면서 앞선 반복 발화와 결합해 축하나 고양감에 가까운 정서를 만든다 [216:21] [2:44:07]

78. 추락 이미지와 짧은 호응음의 반복

Falling과 Fall이 연속으로 나오며, 방향성이나 상황 변화의 이미지는 생기지만 무엇이 하락하는지는 자막상 특정되지 않는다 [216:36] [2:45:12]
다시 hey가 반복되면서 앞선 추락 표현은 구체적 사건으로 확장되지 않고 리듬성 발화로 흡수된다 [216:51] [2:46:16]

79. 감각 표현과 혼란 이미지가 겹치는 중반부

Heat가 다시 반복되며, 이 구간 전체의 핵심 단어처럼 열기·강도·흥분의 분위기를 유지한다 [217:06] [2:47:20]
I feel 이후 다시 Heat가 이어져 개인적 감각 표현과 반복 단어가 결합하지만, 감정의 원인이나 대상은 확인되지 않는다 [217:21] [2:48:33]

80. 불·좋은 소식·추종 표현으로 이어지는 후반 전개

Fire가 단독으로 나오며, 앞선 Heat 반복과 연결되어 강한 에너지나 고조된 분위기가 유지된다 [217:51] [2:51:27]
Good news가 등장하지만 어떤 소식인지, 누구에게 영향을 주는지, 왜 좋은지는 자막 안에서 설명되지 않는다 [218:06] [2:51:33]

81. 마지막 반복과 감정 확인 질문

Heat가 다시 반복되며, 초반부터 이어진 열기와 반복 구호가 마지막부까지 유지된다 [218:36] [2:51:38]
Are you happy?라는 질문이 끝부분에 나오며, 정보 전달보다 청중의 감정 상태를 직접 확인하는 마무리성 발화로 전환된다 [218:51] [2:51:53]

82. Agent OS에 연결할 실행 환경 선택

Agent OS 설정은 만들려는 기능에 따라 달라지며, 기존에 보유한 CLI를 그대로 쓰거나 무료 API를 연결하는 선택지가 가능하다 [219:21] [2:55:45]
Claude를 Agent OS 안에서 쓰려면 Cord에 Claude CLI를 Agent OS 내부에 설정하도록 맡기는 방식이 가능하며, 별도 모델 연결보다 기존 도구 체인을 활용하는 흐름이다 [219:36] [2:55:50]

83. 기능별 API 의존성과 단순화 원칙

기능에 따라 필요한 API가 달라지며, Hermes Jarvis 같은 실시간 음성·대화형 기능은 ChatGPT realtime API를 사용하는 사례가 된다 [220:06] [2:57:38]
문제가 계속되면 여러 구성을 동시에 붙이기보다 하나의 선택지로 단순화하는 편이 낫고, 설정 복잡도를 줄이는 것이 우선이다 [220:21] [2:57:53]

84. 설치 오류 대응과 커뮤니티 공유 흐름

설정 중 오류가 생기면 스크린샷을 보내 점검받거나, 해당 구성을 만든 에이전트에게 다시 질문하는 방식으로 문제를 좁힐 수 있다 [220:36] [2:58:04]
스크린샷과 프롬프트를 커뮤니티 안에 공유하면, 개별 설정 사례가 다른 사용자에게도 재사용 가능한 참고 자료가 된다 [220:51] [2:59:08]

85. 로컬 Agent OS 작업 세션의 맥락 전환

South Africa와 India에서 접속한 참여자가 합류하고, Claude를 활용한 로컬 에이전트 작업이 세션의 중심 맥락으로 잡힌다 [221:36] [3:00:13]
로컬 에이전트로 cool stuff를 만들고 있다는 흐름이 이어지며, 이후 모델 테스트와 Agent OS 통합 시연으로 전환될 준비가 된다 [221:51] [3:01:17]

86. Quifos 9B의 기본 성격과 설치 방식

Quifos 9B는 Ollama에서 사용할 수 있는 새 로컬 모델이며, 여러 모델 목록 중 하나로 확인되고 100만 토큰 컨텍스트 윈도우를 가진다 [222:21] [3:02:21]
모델은 Claude 스타일의 창의적 추론을 목표로 하며, Qwen 3.5 9B 기반 위에서 작동하는 로컬 추론 모델로 자리 잡는다 [222:36] [3:03:26]

87. 로컬 실행의 장점과 초기 앱 생성 결과

Quifos 9B는 개인 Mac에서 실행되는 무료 Claude 스타일 AI에 가깝고, 클라우드 호출·토큰 비용·컴퓨터 밖으로 나가는 데이터가 없다는 점이 핵심 장점이다 [223:21] [3:03:41]
Opus 4.8급 성능으로 단정하기는 어렵지만, 로컬에서 실제 창작물을 만들 수 있다는 점은 개인 환경의 생산성과 프라이버시를 동시에 높인다 [223:36] [3:03:56]

88. 디자인 품질·앱 테스트·다른 로컬 모델과의 비교

일부 결과물은 glitch가 있었지만 랜딩 페이지 디자인은 예상보다 준수했고, 계산기처럼 실제로 작동하는 앱도 생성됐다 [224:21] [3:06:39]
약 여섯 개 앱을 Ollama 기반으로 테스트했고, 터미널에서도 실행 흐름을 확인할 수 있어 모델의 생성 결과가 단순 텍스트를 넘어 실행물로 계속된다 [224:36] [3:07:43]

89. Quifos 9B의 구조적 구성과 Agentic 작업 적합성

Quifos 9B는 open Qwen 3.5 9B 기반 위에 네 가지 의도적 구성 요소를 쌓은 구조이며, 작은 모델이 더 큰 모델처럼 쓰고 추론하도록 설계된 점이 핵심이다 [225:36] [3:08:49]
약 5GB 수준의 로컬 모델은 노트북에서 돌릴 수 있을 만큼 작고, 그 크기 대비 추론과 글쓰기 능력을 확보하는 것이 실용성의 핵심 조건이다 [225:51] [3:09:52]

90. 로컬 컨텍스트 창은 명목상 한계와 실제 RAM 제약이 다르다

100만 토큰 컨텍스트는 큰 상한이지만, 실제 요청에서는 더 작은 윈도우로 로드되면 토큰이 부족해질 수 있고 테스트 때도 토큰 윈도우가 매우 작았다 [226:36] [3:10:56]
컨텍스트 길이가 길어질수록 메모리 비용이 커지며, 현실적인 운용은 보유 RAM에 맞는 윈도우를 선택하는 방식이다 [226:51] [3:12:01]

91. Quifos 9B는 무료·비공개 실행이 강점이지만 프런티어급 안정성은 부족하다

Mac Studio 같은 로컬 장비에서도 로컬 모델은 때때로 버거워하며, 프런티어 모델 수준에는 아직 못 미치지만 실험용으로는 점점 개선되고 있다 [227:21] [3:13:13]
장점은 무료 사용, 프라이버시, 크기 대비 속도와 가벼움이며, Claude식 agent 사용에 필요한 native tool/function calling과 빌드 능력을 갖춘다 [227:36] [3:13:37]

92. Quifos 9B는 오프라인 실행과 작은 설치 크기로 로컬 agent 실험에 맞는다

Quifos 9B는 Qwen 3.5 기반 90억 파라미터 Claude식 thinking 모델이며, 요청과 실행 흐름이 Mac 안에서 오프라인으로 머물러 인터넷 없이도 사용할 수 있다 [228:21] [3:14:43]
설치 크기는 5.6GB 수준이고, Gemma 12B의 약 20GB와 비교하면 약 4분의 1 크기라 로컬 설치 부담이 낮다 [228:36] [3:16:18]

93. 로컬 모델이 Agent OS 엔진이 되면 모델 전환과 작업공간 실행이 결합된다

로컬 모델이 터미널 채팅을 넘어 Agent OS 전체의 엔진이 되면, agent들은 무료·비공개 방식으로 기본 실행 모델을 사용할 수 있다 [229:06] [3:17:22]
Agent OS 구성에는 local engine setup, prompts, dashboard, 주 4회 live coaching calls, daily tutorials, token optimization tutorials, 3,800명 규모 builder community가 포함된다 [229:21] [3:17:40]

94. Ornith 1.0은 Ollama와 Hermes에 연결되는 자기학습 로컬 코딩 모델이다

Ornith 1.0은 새로운 self-learning local model이며, 벤치마크 예시에서는 Opus 4.7과 비교되고 주요 벤치마크에서 강한 점수를 보인다 [230:06] [3:21:15]
Agent OS 안에서는 모델을 언제든 바꿀 수 있고, Hermes에는 Ornith용 별도 profile을 구성해 함께 실행할 수 있다 [230:21] [3:21:30]

95. Ornith의 자기개선 구조는 scaffold 자체를 학습 대상으로 둔다

Ornith는 task 해결 능력과 solution을 이끄는 scaffold를 함께 학습하는 self-improving training framework를 사용한다 [231:21] [3:22:18]
하나의 task에 대해 여러 solution을 rollout하고, 완료 이후 다음 사용을 위해 self-learn과 개선 흐름을 만든다 [231:36] [3:22:33]

96. 벤치마크와 자기 강화 학습 구조

O 모델은 Terminal Bench 2.1, n 1.0, Claude Code, SWE-bench Verified 등에서 Qwen 3.7 Max와 비교해도 높은 점수를 보이며, 로컬 모델과 대형 모델의 격차를 벤치마크로 줄인다 [232:36] [3:24:37]
성능의 핵심은 모델이 자기 지시문을 직접 쓰는 구조이며, 9B처럼 노트북에서 돌릴 수 있는 규모도 더 큰 모델보다 좋은 점수를 낼 수 있다 [232:51] [3:24:53]

97. 로컬 실행과 리더보드 기반 비교

설치는 Ollama와 한 번의 프롬프트 명령으로 다운로드하는 수준에 가깝고, 로컬 환경에서도 실행 속도가 크게 문제되지 않는 흐름으로 다뤄진다 [233:51] [3:25:57]
로컬 리더보드는 주어진 작업별 결과를 모델 크기, 실행 주체, 라이선스, 작업 수, 과제별 점수로 나눠 비교하며, 프런티어 모델과 별도 표로 분리해 공정성을 확보한다 [234:06] [3:27:02]

98. Agent OS 통합과 로컬 에이전트 운영

로컬 Hermes 엔진은 오프라인 에이전트로 동작하며, Hermes 안에서 로컬 전환 후 무료 오프라인 실행이 가능하다 [234:51] [3:28:06]
Agent Kanban에서는 ONIF 같은 로컬 모델 팀을 칸반 보드 안에서 함께 일하게 만들고, Paperclip에서도 비슷한 오케스트레이션 흐름을 구성할 수 있다 [235:06] [3:29:10]

99. 커뮤니티 제공 시스템과 마무리

AI Profit Boardroom에는 로컬 엔진, Hermes 세팅, Agent OS, Mission Control, 로컬 AI 에이전트 팀을 조율하는 칸반 보드가 포함된다 [236:06] [3:30:45]
커뮤니티에서는 질문을 올리고 직접 답변을 받을 수 있으며, classroom에는 초보자용 입문부터 전문가 과정, 매일 업데이트되는 고급 학습 콘텐츠가 들어간다 [236:21] [3:31:19]

🧾 결론

이 영상의 중심 주장은 “최고 모델 하나”보다 “교체 가능한 여러 모델과 도구를 묶은 Agent OS”가 더 실용적이라는 것이다.
Claude는 여전히 선호도가 높은 핵심 모델로 언급되지만, 혼잡·한도·비용 문제가 있기 때문에 Hermes, OpenRouter, 로컬 모델, 기존 구독 OAuth 같은 우회 경로를 함께 준비해야 한다.
로컬 모델은 프라이버시, 무료 실행, 반복 테스트 측면에서 매력적이지만, 영상 안에서도 품질 편차와 하드웨어 제약, 컨텍스트 창의 현실적 한계가 반복해서 언급된다.
Open SEO와 Obsidian 메모리 연결은 Agent OS를 단순 개발 환경이 아니라 검색 트래픽, 콘텐츠 제작, 개인화된 지식 활용까지 확장하는 핵심 구성으로 다뤄진다.
검증 필요: Goldie Bench 순위, Hermes Mixture of Agents의 상대 성능, 각 로컬 모델의 벤치마크 점수와 실제 우수성은 영상 내 주장과 시연에 기반하므로 외부 재현 테스트가 필요하다.

📈 투자·시사 포인트

AI 도구 시장의 경쟁축은 개별 모델 성능뿐 아니라 모델 라우팅, 에이전트 오케스트레이션, 메모리, 워크스페이스, 배포 자동화를 묶는 운영체제형 플랫폼으로 이동하고 있다.
로컬 모델과 무료 API 모델은 비용 절감, 프라이버시, 반복 실행 수요가 큰 사용자층에서 중요한 보완재가 될 수 있지만, 프런티어 모델을 완전히 대체한다기보다 특정 작업에 맞춘 보조 엔진에 가깝다.
SEO 자동화, 리드 생성, 콘텐츠 생성, 아웃리치, 메모리 기반 개인화가 한 시스템에 통합되면 소규모 팀이나 개인 사업자의 운영 효율을 높이는 방향으로 활용 가능성이 있다.
모델 제공자보다 Agent OS, 벤치마크, 워크플로 자동화, 커뮤니티 지원, 템플릿·스킬 생태계를 장악하는 쪽이 사용자 락인과 반복 사용 측면에서 유리할 수 있다.
검증 필요: Open SEO 기반 자동화가 실제 트래픽 증가로 이어지는지, 로컬 모델이 장시간 업무 자동화에서 안정적으로 작동하는지, 커뮤니티 제공 Agent OS가 비기술 사용자에게도 재현 가능한지는 별도 사례와 수치 확인이 필요하다.

⚠️ 불확실하거나 확인이 필요한 부분

로컬 모델 명칭이 구간별로 Quifos, Quos, Quefos처럼 다르게 표기되어 있어 동일 모델을 가리키는지, 자막 인식 오류인지 확인이 필요하다.
ONIF, Ornif, Orif, Ornith가 같은 모델인지 서로 다른 모델인지 불명확하다. 특히 후반부에서는 Ornith 1.0과 ONIF가 혼용되는 듯해 실제 모델명과 역할을 분리해야 한다.
News Portal, Nous Portal, Nimatron, Neatron 등 제공자·모델명으로 보이는 표현이 여러 형태로 등장하므로 실제 서비스명과 모델명을 외부 문서나 화면 캡처 기준으로 검증해야 한다.
자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

로컬 모델 전용 벤치마크 섹션을 Goldie Bench 안에 분리하고, Quifos·ONIF·Ornith 등 모델명을 정확히 정리한다.
각 벤치마크 항목에 사용 모델, 실행 환경, 로컬/API 여부, 테스트 프롬프트, 산출물 링크를 함께 기록한다.
로컬 벤치마크에서는 API 모델을 섞지 않도록 테스트 범위를 명확히 제한한다.
Hermes에서 무료 모델을 쓰는 경로를 Nous/News Portal, OpenRouter, Ollama, LM Studio, 기존 구독 OAuth로 나누어 가이드화한다.

❓ 열린 질문

Quifos, Quos, Quefos는 같은 모델의 자막 변형인가, 아니면 서로 다른 로컬 모델인가?
ONIF, Orif, Ornif, Ornith 1.0은 동일 계열 모델인지, 각각 별도 모델인지 어떻게 구분해야 하는가?
Goldie Bench의 42개 테스트는 어떤 과제들로 구성되어 있고, 각 모델은 동일 조건에서 평가되었는가?