LIVE: Building Agentic Operating Systems with Claude | YouTube 요약

🖼️ 인포그래픽

LIVE: Building Agentic Operating Systems with Claude 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 결론

Building Agentic Operating Systems with Claude의 핵심은 최신 모델 접근권을 기다리는 대신, Claude와 여러 에이전트·메모리·워크플로를 하나의 운영체제처럼 묶어 지속적으로 작업을 굴리는 구조를 만드는 데 있다.

📌 핵심 요점

영상은 GPT 5.6 같은 프런티어 모델이 일부 파트너와 승인 대상에게 먼저 열리는 흐름을 언급하며, 앞으로 최신 모델 접근이 즉시 공개보다 단계적·게이트형 배포에 가까워질 수 있다고 설명한다.
이런 접근 제한 리스크에 대한 대응책으로 단일 모델에 모든 워크플로를 묶지 않고, Claude, Hermes, OpenClaw, GLM, Codex, 로컬 모델 등을 교체 가능한 구성요소로 다루는 Agent OS 구조가 강조된다.
Agent OS의 중심은 공유 메모리다. Obsidian vault, Memory Galaxy, Infinite Context Engine, OMI 같은 도구가 연결되면 여러 에이전트가 같은 맥락을 읽고 쓰며 매번 처음부터 설명하지 않아도 되는 작업 환경을 만든다.
SEO 자동화, WordPress 게시, 뉴스 기반 주제 발굴, 영상 생성, 리드 생성, 로컬 앱 빌드 등 여러 작업이 하나의 대시보드 안에서 연결되며, 영상은 이를 “에이전트 운영체제”의 실사용 사례로 보여준다.
초보자에게는 모든 도구를 동시에 쓰기보다 Claude처럼 배우기 쉬운 도구부터 시작하고, 팀이나 커뮤니티에는 필요한 기능만 남기는 단순화된 Agent OS를 제공하는 방식이 현실적이라고 정리된다.

🧩 배경과 문제 정의

GPT 5.6 접근이 일부 기업 파트너와 승인 대상에게만 먼저 열리면서, 프런티어 AI 모델의 공개 방식이 즉시 공개에서 단계적·관리형 배포로 바뀌고 있다.
Fable 5 중단 이후 고성능 모델 사용이 정부·기관 검토와 연결될 가능성이 커졌고, 일반 사용자가 최신 모델에 곧바로 접근하기 어려워질 리스크가 커졌다.
Hermes, OpenClaw, Claude, Codex, GLM 같은 에이전트·코딩 도구가 동시에 등장하면서 입문자는 무엇을 먼저 배워야 할지 혼란을 겪는다.
영상의 핵심 문제의식은 “최신 모델 하나를 기다리는 방식”보다 “여러 모델을 갈아 끼울 수 있는 에이전트 운영체제와 기억 시스템을 만드는 방식”이 더 지속 가능한가에 있다.

🕒 시간순 섹션별 상세정리

1. GPT 5.6의 제한적 출시와 승인 기반 접근 전환

GPT 5.6은 이미 일부 사용자에게 열렸지만, 전체 공개는 다른 기관의 승인 없이는 어려운 상태로 드러난다 [00:06]
Fable 5가 내려간 뒤 프런티어 모델은 일반 사용자가 쓰기 전 승인 절차를 거치는 방향으로 바뀔 가능성이 커졌다 [00:39]

2. 기업 파트너 테스트와 중순 이후 공개 가능성

GPT 5.6은 OpenAI 엔터프라이즈 파트너 테스트용으로 먼저 제공되는 흐름으로 나온다 [01:37]
더 넓은 공개는 7월 둘째 주 무렵으로 예상되고, 5.6 시리즈에는 max reasoning effort가 추가될 수 있다고 드러난다 [01:48]

3. 에이전트 운영체제 작업과 도구 선택 기준

라이브는 새로운 기능을 에이전트 OS에 코딩해 넣는 작업으로 전환된다 [02:23]
Hermes, OpenClaw, Claude가 모두 헷갈리면 한 번에 하나만 잡고, 가장 매끄러운 Claude부터 시작하는 것이 현실적이라고 조언한다 [05:13]

4. Claude 웹디자인 개선과 예제 사이트 활용

Claude로 웹디자인을 개선하는 튜토리얼과 설정 조정 방식이 나온다 [05:56]
실제 Claude 기반 웹사이트 예시가 괜찮은 품질을 보여주며, 학습자가 참고할 만한 사례로 묶인다 [06:06]

5. Codex 한계와 커뮤니티 기반 문제 해결

Codex는 토큰이 빠르게 소진되고 비슷한 디자인 결과가 반복되는 문제가 있었다고 드러낸다 [08:29]
문제는 직접 메시지나 커뮤니티에 올려 함께 해결할 수 있으며, 도구 선택 기준은 이름값보다 실제 병목이라고 정리한다 [08:50]

6. GLM과 Hermes Jarvis·Oracle을 포함한 통합 개발 환경

Z Code도 선택지지만, 에이전트 OS 안에는 GLM 5.2 기반 CLI가 있어 빌드 작업을 한곳에서 처리할 수 있다고 보여준다 [09:31]
Hermes Jarvis, Oracle 등 여러 기능을 통합 환경에서 확인할 수 있고, 관련 구성은 커뮤니티 보드에서 접근할 수 있다 [11:18]

7. 검색 콘솔 기반 SEO 기회 발굴과 전용 페이지 생성

SEO 섹션에서는 Google Search Console 데이터로 최근 7일 또는 28일 동안 작동한 검색어와 페이지를 확인한다 [12:15]
노출은 많지만 순위가 낮은 키워드는 이미 수요가 확인된 기회이며, 전용 페이지를 만들면 유입을 늘릴 수 있다고 보여준다 [12:28]

8. 실행 규모 조정과 가이드·게시 작업 지시

테스트 대상은 작은 규모가 적합하며, 지나치게 큰 입력은 실행 안정성과 장비 성능에 부담을 준다 [14:10]
15GB를 넘는 작업은 Mac 속도를 떨어뜨릴 수 있으므로 성공 가능성이 낮으면 피하는 편이 안전하다고 드러낸다 [14:12]

9. 시각 자료와 프레임워크 중심의 가이드 구성

가이드에는 스크린샷, 프레임워크별 분해, 실제 예시가 포함되어야 한다고 지시한다 [19:52]
OMI, Obsidian, Agent OS가 연결되고, 모든 에이전트와 CLI가 Obsidian 메모리를 쓰는 구조가 핵심이라고 보여준다 [19:59]

10. 무한 컨텍스트 엔진과 Obsidian 메모리 갤럭시 시각화

Infinite Context Engine 설정 정보를 가이드에 포함해 단순 개념보다 실제 설정 맥락을 보여줘야 한다고 드러낸다 [20:57]
Obsidian Memory Galaxy도 안내 대상이며, 메모리 구조를 시각적으로 이해시키는 구성이 필요하다고 정리한다 [21:12]

11. 커뮤니티 피드백 수집과 작업물 검토

Baba에게 DM, 메시지, 커뮤니티 스크린샷을 보내면 현재 화면에서 함께 검토할 수 있다고 안내한다 [24:30]
문제를 보려면 추상적 요청보다 실제 화면 증거와 커뮤니티 메시지가 필요하다고 보여준다 [24:33]

12. 블로그 탐색성과 크롤링을 위한 구조 개선

블로그 하단에 관련 블로그 링크를 추가하면 사용자가 다음 글로 이동하기 쉬워진다 [27:16]
상단에는 카테고리별 전체 아티클로 돌아가는 빠른 탐색 섹션이 필요하다고 드러낸다 [27:20]

13. 반복 작업을 skill에 반영하는 운영 원칙

같은 링크·내비게이션 개선을 반복하려면 일회성 지시가 아니라 skill 자체를 업데이트해야 한다고 드러낸다 [27:38]
skill 업데이트는 이후 생성되는 글마다 같은 구조 기준을 적용하게 해 누락 가능성을 줄인다 [27:39]

14. SubQ 검토 보류와 테스트 우선순위

SubQ는 보여줄 결과물이 부족하고 벤치마크 외 검증 가능한 증거가 없어 우선순위에서 밀린다 [32:53]
실제 작동 사례 없이 벤치마크만 있으면 리스트 확보 목적처럼 보일 수 있어 신뢰도가 낮다고 평가한다 [33:00]

15. GPT 5.6 접근 제한과 새로운 AI 이용 격차

GPT 5.6은 새 릴리스로 다뤄지지만, 평균 사용자가 최신 AI에 바로 접근하지 못할 수 있다는 우려가 제기된다 [38:46]
AI 성능 자체보다 누가 승인받고 누가 배제되는지가 더 중요한 문제로 이동한다고 보여준다 [39:57]

16. 로컬 실행 환경 점검과 온디바이스 활용 가능성

Onif 상태가 좋아 보이며, 로컬 agent Kanban이 제대로 작동하는지 확인할 필요가 있다고 드러낸다 [41:20]
제한적 클라우드 접근과 별개로 로컬 엔진과 온디바이스 실행 흐름의 중요성이 커진다 [41:29]

17. GPT 5.6의 단계적 출시와 정부 개입

GPT 5.6은 모두를 위한 즉시 출시가 아니라 일부 사용자와 파트너를 먼저 대상으로 하는 릴리스로 드러난다 [42:48]
미국 정부가 OpenAI에 단계적 출시를 요청했고, Fable 5가 사흘 만에 내려간 사건이 배경으로 드러난다 [43:04]

18. 소수 파트너 프리뷰와 고객별 승인 구조

GPT 5.6 롤아웃은 전체 대중이 아니라 소규모 파트너 그룹을 대상으로 시작된다 [43:55]
워싱턴이 프런티어 모델의 넓은 배포 전에 검토 역할을 맡기 시작한 것으로 보도됐다고 보여준다 [44:11]

19. 중국 오픈소스 모델과 미국 제한 모델의 대비

중국에서는 GLM 5.2와 Kimi K 2.7 같은 강력한 모델이 등장했고, GLM 5.2는 오픈 웨이트 기반으로 로컬 실행이 가능하다고 드러낸다 [45:09]
중국 오픈소스 모델은 강해지는 반면, 미국 프런티어 모델은 출시 지연과 접근 제한 쪽으로 이동한다고 대비한다 [45:34]

20. 게이트형 출시 절차와 공개 시점의 불확실성

최첨단 AI 모델을 출시하려는 기업에게 제한적 프리뷰가 새로운 정상 상태가 될 수 있다고 보여준다 [46:06]
GPT 5.6은 소규모 파트너에게만 제한 공개되고, 일반 공개 전 좁은 테스트 그룹을 거치는 사례가 늘어난다 [46:23]

21. 미국 모델 출시가 즉시 공개에서 관리형 대기열로 바뀐다

미국 모델 출시에서 대기열이 생기며, 새 모델을 몇 시간 안에 전 세계가 테스트하던 리듬이 깨진다 [48:01]
GPT 5.6은 주요 미국 모델이 관리형 라인 뒤에서 배포되는 사례로 묶인다 [48:17]

22. 최신 모델을 당일에 쓴다는 전제가 워크플로 리스크가 된다

새 모델을 출시 다음 날 바로 쓸 수 있다는 가정은 더 이상 안전하지 않다고 드러낸다 [49:23]
Fable 5는 내려갔고, GPT 5.6은 고객별 검토가 순조로울 때 7월 중순 더 넓은 공개가 기대되는 상태라고 정리한다 [49:52]

23. 단일 모델 의존 대신 에이전트 운영체제로 접근성 문제를 흡수한다

새 모델 드롭을 기다리는 대신 에이전트 OS에 좋은 모델을 꽂아 넣는 구조가 더 유리하다고 보여준다 [51:05]
Sakana Fugu는 Fable 5 수준의 지능을 목표로 테스트됐고, 최신 모델이 없어도 자동화와 시스템 구축은 계속 가능하다고 드러낸다 [51:33]

24. 기존 방식은 대기열에 묶이고 새 방식은 모델 교체로 지속성을 얻는다

기존 방식은 단일 모델과 출시일, 접근 승인, 지역 활성화, 대기열에 워크플로가 묶인다 [52:53]
새 방식은 에이전트를 시스템 위에 만들고, 접근권이 바뀌면 몇 초 안에 다른 모델로 라우팅한다 [53:19]

25. 진짜 해자는 모델 자체보다 시스템과 운영 능력이다

최신 모델이 모두에게 공개된다는 가정은 틀렸고, 충분히 좋은 모델 위에서 작동하는 시스템이 더 중요하다고 드러낸다 [54:29]
모델은 게이트·철회·가격 변경을 겪지만, 메모리·프롬프트·에이전트·워크플로는 매일 개선될 수 있다 [55:00]

26. 커뮤니티·교육 상품 안내 뒤 토큰 비용과 빌드 개선 피드백이 계속된다

AI Profit Boardroom에는 Memory Galaxy, Sakana Fugu Ultra, Fusion, Codex 통합 등이 포함된다고 보여준다 [57:15]
커뮤니티는 질문 지원, 클래스룸, 마스터클래스, 일일 튜토리얼, 설치 zip, 코칭콜, 지역 멤버 연결을 제공한다고 보여준다 [57:50]

27. 가이드 스킬의 시각 자료 생성 기준 보강

가이드 스킬은 hero image와 본문 중간 이미지를 함께 생성해야 한다고 지시한다 [1:00:00]
Chat Image 2.0과 다이어그램을 활용해 문서형 산출물의 시각 품질을 자동 워크플로 안에서 유지해야 한다 [1:00:07]

28. 기존 Claude 기억의 한계와 Obsidian 기반 기억 갤럭시

Claude의 작업 디렉터리와 내부 메모리만으로는 지난주 작업이나 대화 밖 활동을 충분히 복원하기 어렵다 [1:05:18]
Obsidian과 memory galaxy를 연결하면 날짜별 작업 내역을 끌어와 최근 활동을 더 정확하게 파악할 수 있다 [1:05:53]

29. infinite context engine과 공유 기억 루프

infinite context engine은 memories, goals, daily tasks, OMI, projects, areas를 하나의 기억 구조로 연결한다 [1:07:11]
채팅은 vault를 훈련하고 vault는 다시 에이전트를 훈련하는 순환 구조를 만든다 [1:07:26]

30. blank slate 문제와 마크다운 파일 기반 해법

기억 시스템이 없는 AI 에이전트는 매일 아무것도 기억하지 못하는 비서처럼 작동한다 [1:08:04]
새 채팅이 항상 0에서 시작하면 업무 맥락이 끊기며, infinite context engine은 이 초기화 문제를 줄인다 [1:08:17]

31. OMI와 Obsidian으로 이어지는 무료 기억 파이프라인

OMI, Obsidian, Agent OS는 별도 앱이 아니라 하나의 memory pipeline으로 드러난다 [1:08:58]
OMI는 마이크와 화면을 바탕으로 일상 활동과 중요한 맥락을 기록하고 Obsidian으로 내보낸다 [1:09:09]

32. 모든 에이전트가 같은 vault를 읽는 운영체제 구조

최근 memory, scheduled task, Claude Code 세션 등이 시간 단위와 일 단위로 자동 통합된다고 보여준다 [1:10:29]
agent operating system은 Claude에서 mission control dashboard를 만들고 에이전트를 연결하는 방식으로 구축할 수 있다 [1:10:58]

33. 무한 컨텍스트 엔진의 네 단계와 자기 강화 루프

AI를 매일 다시 훈련시키는 대신 OMI가 사용자의 생각을 기록하고 개인 지식 기반으로 보내는 흐름이 핵심이다 [1:12:01]
PARA 방식으로 노트를 로컬에서 정리하면 에이전트가 사용자, 목표, 프로젝트 맥락을 파악할 수 있다 [1:12:32]

34. 자동 기록 구조가 수동 메모리 관리 부담을 줄인다

일반적인 메모리는 사용자가 입력을 멈추면 개선도 멈추는 단방향 구조라고 지적한다 [1:13:37]
무한 컨텍스트 엔진은 에이전트 대화를 하루 한 파일 형태로 Obsidian에 자동 기록한다 [1:13:44]

35. 메모리 갤럭시는 흩어진 노트를 연결된 지식 지도로 바꾼다

메모리 페이지는 노트를 별처럼 보여주고, 노트 사이의 링크는 관련 주제와 작업 흐름을 잇는다 [1:14:28]
수천 개의 노트가 매일 늘어나며, 최근 사용한 노트는 더 밝게 표시되어 현재 맥락을 빠르게 찾게 한다 [1:14:46]

36. 기존 방식의 한계와 메모리 루프의 실무 효과

메모리가 없으면 사용자는 매 세션마다 자기소개와 업무 맥락을 반복해야 한다 [1:15:52]
ChatGPT나 Claude에 같은 맥락을 반복해서 붙여도 각 도구가 독립적으로 시작해 이전 결정이 충분히 반영되지 않는다 [1:16:07]

37. Agent OS와 커뮤니티 상품은 설정 시간을 줄이는 패키지로 연결된다

30일 로드맵, 비디오 튜토리얼, Agent OS 설정은 AI Profit Boardroom 링크를 통해 제공된다고 보여준다 [1:17:29]
패키지는 Agent OS, 메모리 루프, Memory Galaxy, OMI와 Obsidian 설정 walkthrough를 포함한다 [1:17:52]

38. 무료 로컬 LLM은 선택지가 있지만 성능은 하드웨어 의존적이다

무료 로컬 LLM 추천은 사용 환경에 따라 달라지며 Ornith, Qwen 계열이 후보로 나온다 [1:19:09]
로컬 모델 품질은 아직 들쭉날쭉하며, 좋은 결과는 사용자의 장비와 실행 여건에 크게 의존한다고 평가한다 [1:19:29]

39. AI SEO 시스템과 로컬 모델 실험의 출발점

새 AI SEO 시스템 구축이 시작되고, ONRIF라는 새 로컬 모델을 적용하려는 흐름이 잡힌다 [1:24:06]
ONRIF 적용과 함께 Agent OS 내부 업데이트도 다뤄질 예정이라고 드러낸다 [1:24:14]

40. MLX와 로컬 실행 후보 탐색

MLX는 로컬 모델 실행 생태계의 후보로 다시 확인할 필요가 있는 도구로 나온다 [1:24:46]
짧은 확인 뒤 MLX는 실제 시험해볼 만한 흥미로운 선택지로 받아들여진다 [1:25:01]

41. Agent OS의 다중 에이전트 품질검수 루프

Agent OS 안에는 여러 에이전트가 서로 루프를 돌며 한 에이전트가 다른 에이전트를 검수하는 구조가 들어 있다 [1:26:27]
작업이 끝날 때까지 검수와 수정을 반복하므로 결과 품질은 단일 응답보다 루프 안정성에 좌우된다 [1:26:34]

42. Forward/go의 작업자-심판 분리 구조와 후반 Q&A 공백

forward/go에서는 심판 역할의 API를 바꿀 수 있고, 작업 에이전트와 판단 에이전트를 분리하는 구조가 핵심이다 [1:28:32]
서로 다른 API를 역할별로 조합해 비용, 성능, 판단 품질을 나눠 설계할 수 있다 [1:28:42]

43. 에이전트 OS의 구성과 활용 범위

짧은 음성 이후 흐름은 에이전트 운영체제의 최신 질문을 다루는 Q&A로 전환된다 [1:36:13]
에이전트 OS는 여러 에이전트를 연결해 리드 생성, 아웃리치, 자동화 작업을 수행하는 시스템으로 드러난다 [1:38:41]

44. Codex 구독을 에이전트 OS 안에서 쓰는 여러 경로

첫 질문은 Codex 구독을 에이전트 OS와 함께 사용할 수 있는지에 집중된다 [1:39:24]
에이전트 OS 안에는 Codex 섹션이 있고, 채팅·골드 모드·워크스페이스·이전 세션 저장 기능을 통해 작업을 이어갈 수 있다 [100:30] [1:40:30]

45. Claude Code 플러그인과 모델 중심이 아닌 시스템 중심 전략

Claude Code 안에 Codex 플러그인이 추가되어 Codex를 여러 경로로 쓸 수 있다고 보여준다 [101:15] [1:41:22]
Codex는 Hermes Agent, OpenClaw와 Hermes Agent 2의 이미지 생성, Codex 탭, Claude Code 플러그인으로 연결될 수 있다 [101:30] [1:41:37]

46. 커뮤니티 피드백과 시스템 발전의 상호작용

접근성 높은 AI 교육과 훈련에 대한 긍정적 피드백이 나오며 커뮤니티의 의미가 중요하다 [130:12] [2:10:12]
HOS 같은 시스템은 개인 결과물만이 아니라 피드백과 격려가 누적되며 발전한 결과라고 드러낸다 [130:27] [2:10:27]

47. Qwen Agent World와 실제 빌드 사례의 부족

Qwen 3.6과 Qwen Agent World 비교 질문이 나오고, Agent World 발표에 대한 관심이 나온다 [130:57] [2:10:42]
Agent World는 인상적이지만 사람들이 실제로 무엇을 만들었는지 확인하기 어려워 아직 이론적 가능성에 가깝다고 평가한다 [131:12] [2:10:57]

48. 로컬 LLM 연결 방식과 GLM 5.2의 접근성

Codex는 로컬 모델 연결 문서를 갖고 있으며, config 파일에서 모델과 로컬 환경을 바꿀 수 있다고 보여준다 [131:42] [2:11:12]
Ollama를 쓰면 GLM 5.2를 Claude Code나 Codex에 연결할 수 있고, 일부 설정은 원클릭에 가깝다고 드러낸다 [131:57] [2:11:27]

49. GLM 5.2의 벤치마크 성능과 오픈 모델의 경쟁력

GLM 5.2는 Opus 4.8과 비교될 만큼 높은 성능을 보였고 모델 순위에서도 상위권이라고 언급한다 [132:27] [2:11:42]
Goldiebench는 테스트 결과와 산출물을 공개해 사용자가 모델별 결과를 직접 비교할 수 있게 한다 [132:42] [2:11:57]

50. Agent OS를 팀에 넘길 때 필요한 단순화 전략

개인용 Hermes 설정은 기능이 많아 팀원이 그대로 쓰기에는 과하고 버그나 주의 분산이 생길 수 있다고 드러낸다 [133:27] [2:12:12]
팀 배포용 Agent OS는 실제 워크플로우만 남기고 올바른 사용 범위를 유지하는 방식이 적합하다고 조언한다 [133:42] [2:12:27]

51. 팀용 Agent OS UI를 숨김 설정으로 줄이는 방법

팀에 제공할 Agent OS는 초기 설정에 사용한 에이전트에게 특정 요소 제거를 지시해 단순화할 수 있다 [134:27] [2:12:42]
좌측 상단 설정에서 OpenClaw 같은 특정 영역을 숨기고 저장하면 팀원이 보는 UI가 단순해진다 [134:42] [2:12:57]

52. SaaS 홍보 영상 제작 자동화와 편집 에이전트 활용

SaaS 투어용 30초 사용법 영상은 녹화와 보이스오버 이후 빠르게 조립하는 과정이 병목이라고 드러낸다 [135:12] [2:13:12]
Agent OS 안의 video agent를 쓰면 아바타, B-roll, 스크립트, 리서치를 포함한 영상 조립을 자동화할 수 있다 [135:27] [2:13:27]

53. Ollama 생태계 안에서의 모델 선택과 단일 모델 숙련

Ollama 생태계 안에서만 고르면 선택지가 줄어들고, 단순화를 원할 때 GLM 5.2가 유력한 기본 선택지로 드러난다 [136:12] [2:13:42]
GLM 5.2는 Ollama 안에서 프런티어급에 가장 가까운 모델로 평가되고, Minimax와 Kimi는 그보다 낮은 선택지로 분류된다 [136:27] [2:13:57]

54. Agent OS 업데이트와 기능 선택 설치

Agent OS를 최신 상태로 유지하려면 새 버전 zip 파일 안의 업데이트 자료를 확인해야 한다 [137:12] [2:14:12]
기존 사용자는 필요한 업데이트 파일만 골라 설치할 수 있고, 전체 기능을 한꺼번에 넣을 필요는 없다고 보여준다 [137:27] [2:14:27]

55. 개인 에이전트 기억 관리와 Obsidian 기반 대안

Claude의 remember 스킬 대신 Obsidian vault와 Memory Galaxy를 연결하면 시간 기반 맥락을 더 넓게 회수할 수 있다 [137:57] [2:14:42]
모든 에이전트에 Obsidian vault를 연결하면 단순 내부 기억보다 풍부한 장기 메모리 역할을 한다 [138:12] [2:14:57]

56. 팀용 Hermes 프로필과 공유 브레인 구성

팀 전체 Hermes 설치에서는 여러 프로필과 gateway 인스턴스가 문제가 될 수 있다고 드러낸다 [138:42] [2:15:12]
핵심 목표는 기술 구성을 복잡하게 늘리는 것이 아니라 회사 구성원이 함께 접근하는 공유 브레인을 만드는 것이다 [138:57] [2:15:27]

57. 교육 리소스, 커뮤니티 지원, 설치 난이도

Agent OS 관련 질문은 AI Profit Boardroom 안에서 개인별 답변과 일일 튜토리얼 형태로 지원받을 수 있다 [139:42] [2:15:42]
classroom에는 영상 튜토리얼, 최신 업데이트, 설치용 zip 파일, 새 교육 자료가 모여 있다고 보여준다 [139:57] [2:15:57]

58. 구독·모델·소스 검증·웹 제작 관련 실사용 Q&A

Codex 사용자는 기존 구독으로 Hermes나 Agent OS에 로그인할 수 있고, 별도 API 비용이 반드시 필요한 구조는 아니라고 드러낸다 [140:42] [2:16:12]
Hermes Jarvis에는 특정 모델이 필수는 아니며, 빠른 응답에는 ChatGPT realtime API가 중요한 요소로 잡힌다 [140:57] [2:16:27]

59. 음성 연동, 대체 모델, Windows 환경의 Obsidian 구성

Hermes agent로 voice 기반 vibe coding을 하려면 Miniax 가이드가 후보로 나온다 [141:57] [2:16:42]
음성 연동에는 11 Labs 설정 가이드도 선택지이며, 막히는 부분은 커뮤니티 질문으로 지원받을 수 있다 [142:12] [2:16:57]

60. Obsidian 메모리 구조화와 PARA 방식

Obsidian을 쓰면 Claude나 Hermes가 개인 데이터를 기반으로 마크다운 폴더를 정리하게 할 수 있다고 보여준다 [142:57] [2:17:12]
PARA는 프로젝트와 관련 메모리를 폴더 구조로 묶어 Obsidian 안의 지식 시스템을 구성하는 방식이다 [143:12] [2:17:27]

61. Graphify의 범위와 세컨드 브레인 한계

Graphify는 전체 세컨드 브레인보다 개별 코드베이스 분석에 더 적합해 보인다고 평가한다 [143:42] [2:17:42]
Obsidian 전체처럼 생활·작업·기억을 포괄하는 지식 운영체제로 쓰기에는 범위가 좁다고 드러낸다 [143:57] [2:17:57]

62. Ornif 1.0 9B와 로컬 에이전트 운영체제 연결

Ornif 1.0 9B는 로컬에서 실행되는 모델이며 Qwen 3.5와 비교되는 벤치마크를 보인다고 보여준다 [144:27] [2:18:12]
최신 프런티어 모델급은 아니지만, 로컬 모델 중 성능과 반응성이 좋은 편으로 평가된다 [144:42] [2:18:27]

63. 로컬 앱 빌드 데모와 작업공간 통합

채팅 안에서 habit tracker를 요청하면 Ornif 9B가 로컬에서 사고 과정을 시작하고 무료로 실행된다 [145:12] [2:18:42]
모델은 habit tracker를 계획한 뒤 HTML로 코딩하고, 결과는 작업공간 안에서 미리보기 가능한 형태로 연결된다 [145:27] [2:18:57]

64. 벤치마크와 실제 체감 성능

Ornif 9B는 일부 벤치마크에서 Qwen 3.5를 앞서며, 작은 9B 모델이 더 좋은 결과를 보인 점이 인상적이라고 드러낸다 [145:57] [2:22:16]
Gemma 4 대비 구간별 우위가 있지만 terminal bench에서는 Gemma 4 12B에는 미치지 못한다고 보여준다 [146:12] [2:22:26]

65. 클라우드 API 대비 로컬 모델의 비용·프라이버시 장점

클라우드 방식은 로컬 작업이 외부 서버로 이동하고 API 비용이 발생한다고 지적한다 [146:42] [2:28:25]
로컬 실행은 데이터가 기기를 떠나지 않고, 오프라인이나 비행기 안에서도 작동하며, 추가 사용 비용이 없다고 드러낸다 [146:57] [2:28:40]

66. 로컬 모델 결과물과 agent OS 연결성

방금 만든 앱은 agent OS 안에서 다시 열람할 수 있고, 대화 기록과 생성 결과가 workspace에 남는다 [147:42] [2:28:55]
preview 화면에서 새 모델을 추가하면 habits와 weekly completion 섹션에 반영되고 HTML 다운로드도 가능하다 [147:57] [2:29:10]

67. Ornith 모델 범위와 실제 작동 한계

Ornith는 Hugging Face와 LM Studio에서 접근 가능한 오픈소스 LLM 계열로 묶인다 [148:42] [2:29:25]
9B dense, 31B dense, 35B MoE, 397B 등 다양한 크기가 있어 환경과 성능 요구에 맞춰 선택할 수 있다 [148:57] [2:29:40]

68. 로컬 엔진의 자동 수정 흐름과 클라우드 대비 장점

로컬 엔진은 단일 프롬프트로 앱을 만들고 실행한 뒤 버그를 찾아 자체 수정하는 흐름을 갖는다 [149:42] [2:29:55]
클라우드 방식은 비용, rate limit, 프라이버시, 인터넷 의존성이 있지만 로컬 방식은 데이터가 밖으로 나가지 않는다 [149:57] [2:30:10]

69. agent OS 내부 워크플로와 로컬 모델 확장

로컬 모델은 몇 가지 명령, LM Studio 설정, Hugging Face 다운로드를 통해 agent operating system에 연결될 수 있다 [150:42] [2:30:25]
Hermes 탭에는 Ornith용 별도 profile이 있고, 같은 로컬 모델을 local Hermes engine에 붙일 수 있다고 보여준다 [150:57] [2:30:40]

70. 로컬 AI에 대한 오해와 실제 포지셔닝

강력한 AI는 반드시 클라우드에 있어야 한다는 전제는 약해졌고, 로컬 모델도 결과물을 만들 수 있는 수준에 도달했다고 드러낸다 [151:42] [2:30:55]
무료 모델은 최상위 모델과 비교하면 부족하지만, 무료 로컬 실행 기준에서는 실용적인 선택지가 될 수 있다고 정리한다 [151:57] [2:31:10]

71. 커뮤니티 기반 설정 지원과 후반부 마무리

agent OS와 로컬 AI 설정은 AI Profit Boardroom 커뮤니티에서 classroom, training, setup guide로 지원된다 [152:27] [2:31:35]
weekly coaching call과 community map은 질문 대응, 지역 사용자 연결, 실제 사용 사례 공유를 돕는다 [152:42] [2:31:40]

72. AI SEO 성과와 에이전트 운영체제의 기본 구조

여러 웹사이트가 AI SEO 적용 이후 278, 74, 28 clicks per day 수준으로 성장했고 새 시스템 이후 상승세가 뚜렷해졌다고 드러낸다 [154:34] [2:34:44]
모든 일상 워크플로와 새 실험은 Claude로 만든 에이전트 운영체제 안에 통합된다고 보여준다 [154:39] [2:34:49]

73. Oracle을 통한 뉴스 기반 주제 발굴과 개인화 콘텐츠 생성

Oracle은 매일 최신 뉴스 헤드라인을 스캔하고 Hermes agent가 트렌딩 뉴스의 주제성·흥미도·카테고리를 정리한다 [155:04] [2:35:04]
각 뉴스 항목은 마지막 상담 시점과 이미 발행된 관련 콘텐츠를 함께 보여줘 새 주제 후보를 찾게 한다 [155:26] [2:35:59]

74. 워드프레스 게시 자동화와 수작업 병목 제거

콘텐츠는 generic ChatGPT fluff가 아니라 개인화된 정보 이득, 유용성, 품질관리, 뉴스 소스와 링크를 갖춰야 한다 [157:03] [2:37:03]
publish to WordPress 버튼을 누르면 Hermes Oracle이 로그인, 본문 작성, 출처 삽입, 링크 추가, 게시까지 처리한다 [157:35] [2:38:08]

75. 네 개 에이전트와 검색 데이터 기반 콘텐츠 파이프라인

한 번의 실행으로 기사 생성과 세 개 웹사이트 게시가 완료되고, 웹사이트 간 링크와 외부 링크가 함께 붙는다 [159:12] [2:39:12]
네 개 에이전트가 트렌드 발굴, 키워드 선택, 배포 준비, 영상 자동화를 단계별로 맡는다 [159:45] [2:40:17]

76. 기사에서 영상으로 확장되는 SEO 랭킹 전략

좋은 키워드를 찾으면 여러 웹사이트에 배포하고, 웹사이트별 분류·URL·게시 시점을 추적할 수 있다 [161:21] [2:41:21]
같은 기사는 특정 키워드용 고유 영상으로 확장될 수 있으며, 영상도 검색 랭킹에 기여한다고 보여준다 [161:54] [2:42:26]

77. 정보 이득, 품질관리, 자동 배포까지 묶인 최종 시스템

모든 콘텐츠는 실제 실험, 실제 결과, 대시보드 같은 케이스 스터디 데이터에 기반해야 한다고 드러낸다 [163:30] [2:43:30]
Hermes 안의 여러 에이전트 프로필이 품질관리를 맡아 게시 전 콘텐츠를 반복 점검한다 [163:45] [2:43:45]

78. 커뮤니티·교육·SEO 지원 흐름

AI SEO 섹션과 일일 업데이트 섹션에서 Agent OS, 설치 zip, 질문 답변, 영상 튜토리얼, 코칭콜이 제공된다 [167:46] [2:47:46]
커뮤니티에서는 지역별 AI 에이전트 제작자를 찾고 실시간 도움과 네트워킹을 받을 수 있다 [168:01] [2:48:01]

79. 에이전트 수와 작업 범위 질문에서 Agent OS 데모로 전환

현재 사용하는 에이전트 수와 각 작업을 묻는 질문이 나오고 시스템 전체 데모로 흐름이 전환된다 [168:31] [2:48:16]
Claude로 만든 Agent OS는 여러 에이전트를 하나의 메모리에 연결해 자동화와 구축 작업을 수행하는 구조다 [168:32] [2:48:53]

80. Paperclip·에이전트 그룹채팅·아이디어 구현 파이프라인

Paperclip은 오픈소스 에이전트 관리 프로젝트로, 활성 섹션과 토큰 사용량, 빌드 현황을 보여준다 [169:58] [2:49:58]
AI Agent Mastermind에서는 Claude, Hermes, Gemini, Codex, Open Core, GLM 5.2 등이 그룹채팅처럼 아이디어를 주고받는다 [172:00] [2:52:00]

81. 로컬 에이전트 칸반과 Claude·Ultra Code 작업공간

로컬 에이전트 칸반은 오프라인 에이전트 팀이 아이디어를 백로그, 빌드 중, 리뷰, 완료 상태로 옮기는 구조다 [172:57] [2:52:07]
Claude 섹션은 CLI를 연결해 API 비용 없이 Agent OS 안에서 작동하고, 작업물은 워크스페이스에 저장된다 [173:12] [2:53:11]

82. Hermes 프로필·음성 대화·뉴스·콘텐츠 발행 기능

Hermes 섹션에는 역할별 에이전트 프로필이 있고, 쓰지 않는 섹션은 숨겨 UI 복잡도를 줄일 수 있다 [175:59] [2:55:59]
Hermes 안에서는 로컬 에이전트 프로필과 무료 로컬 모델을 연결하고 Sidekicks 같은 신규 릴리스도 붙일 수 있다 [176:14] [2:56:14]

83. 리드 생성·공유 메모리·검수 루프·SEO 자동화

Studio와 Sessions에서는 이미지·비디오·음성 생성, 스킬, 플러그인, 칸반 보드, 최근 작업을 확인할 수 있다 [176:25] [2:56:25]
리드 생성 섹션은 잠재고객 탐색, 자동 보강, 캠페인 생성, 받은 편지함과 발송 내역 확인까지 포함한다 [177:01] [2:57:30]

84. 생성 도구와 로컬 에이전트가 하나의 작업 공간으로 묶인다

AI 아바타 영상 생성은 리서치, B-roll, 편집 요소를 합쳐 5분 길이 결과물까지 만들 수 있다 [180:01] [2:58:34]
Hermes Agent와 Suno API를 연결한 음악 생성 기능은 즉석 음악을 만들고 마음에 드는 결과를 저장해 재사용하게 한다 [180:21] [3:00:29]

85. 멀티에이전트 지능과 CLI 도구가 복잡도 조절형 시스템을 만든다

Fusion은 여러 에이전트가 동시에 답을 만들고 judge가 결과를 합치는 방식으로 더 나은 출력을 얻는다 [181:38] [3:00:43]
Sakana Fugu도 Fable 5 수준 지능을 목표로 하는 방식이며, 생성 이력과 결과물을 같은 시스템에서 확인할 수 있다 [182:02] [3:01:38]

86. 통합 대시보드는 흩어진 도구 사용보다 빠르고 재사용성이 높다

SEO 콘텐츠가 필요하면 SEO 섹션으로, Claude가 필요하면 연결된 영역으로 바로 이동할 수 있어 진입점이 고정된다 [182:58] [3:02:52]
Claude, ChatGPT, 터미널, Hermes를 따로 여는 방식은 연결성이 약하고 이전 결과 확인도 불편하다고 비교한다 [183:07] [3:03:57]

87. 커뮤니티형 배포와 AI 자동화가 채용 필요성까지 줄인다

코딩을 못하는 사용자도 30분 안에 설정한 사례가 있으며, 커뮤니티는 대시보드 수정본과 학습 내용을 공유한다 [183:48] [3:05:01]
Agent OS 섹션에는 당일 업데이트 튜토리얼, zip 파일, 전체 설정 가이드가 있고 질문은 커뮤니티·영상 답변·코칭콜로 지원받을 수 있다 [184:24] [3:05:25]

🧾 결론

영상의 큰 메시지는 “최고 모델을 당일에 쓸 수 있다”는 전제가 약해질수록, 모델 자체보다 모델을 바꿔 끼울 수 있는 시스템과 운영 능력이 더 중요해진다는 것이다.
Agent OS는 단일 챗봇이 아니라 공유 메모리, 작업 대시보드, 여러 에이전트, 품질검수 루프, 콘텐츠·SEO·영상 자동화가 결합된 작업 환경으로 제시된다.
Claude는 입문자가 시작하기 쉬운 핵심 도구로 다뤄지고, Hermes, OpenClaw, Codex, GLM, 로컬 모델은 필요에 따라 연결하거나 숨길 수 있는 확장 요소로 설명된다.
Obsidian 기반 메모리 구조는 새 채팅마다 맥락이 초기화되는 문제를 줄이고, 에이전트가 과거 작업·목표·클라이언트·프로젝트 기록을 다시 활용하도록 만드는 기반으로 강조된다.
검증 필요: GPT 5.6의 제한 공개, 정부·기관 승인 구조, 특정 모델 성능 비교, 커뮤니티 상품 구성, SEO 성과 수치 등은 영상에서 언급된 내용이므로 실제 투자·도입 판단 전에는 원문 보도, 공식 발표, 별도 벤치마크와 운영 데이터를 확인해야 한다.

📈 투자·시사 포인트

AI 도구 시장에서는 단일 모델 성능보다 여러 모델과 에이전트를 연결하는 운영 레이어, 메모리 레이어, 워크플로 자동화 레이어의 가치가 커질 가능성이 있다.
프런티어 모델 접근이 제한되거나 지연될수록, 기업과 개인은 특정 모델 의존도를 낮추고 Claude, 오픈 웨이트 모델, 로컬 LLM, API 기반 모델을 역할별로 교체할 수 있는 구조를 선호하게 될 수 있다.
Obsidian 같은 로컬 지식 저장소와 에이전트가 연결되는 흐름은 개인·팀 단위의 “AI 업무 기억” 인프라로 확장될 수 있으며, 장기적으로는 문서 관리, SOP, 교육, 품질관리 영역과 맞물릴 수 있다.
SEO와 콘텐츠 제작 영역에서는 검색 콘솔 데이터, 뉴스 트렌드, 내부 사례, 자동 게시, 영상 생성이 한 파이프라인으로 묶이면서 기존 수작업 중심 콘텐츠 운영의 비용 구조를 바꿀 수 있다.
로컬 모델은 프런티어 모델의 완전한 대체재라기보다 비용, 프라이버시, 오프라인 실행, 실험 자유도 측면에서 보완재로 의미가 있으며, Agent OS와 결합될 때 활용도가 커진다.
다만 영상은 특정 커뮤니티와 상품 안내가 많이 포함되어 있으므로, 실제 도입 전에는 기술 구현 가능성, 유지보수 부담, 팀 학습 비용, 데이터 보안, 자동화 결과물의 품질검수 체계를 따로 평가하는 것이 필요하다.

⚠️ 불확실하거나 확인이 필요한 부분

GPT 5.6의 제한적 출시, 정부·기관 승인, 7월 중순 공개 가능성, OpenAI 엔터프라이즈 파트너 테스트 관련 내용은 라이브 발화 기반 주장으로 보이며, Axios·Silicon Angle 등 원문 기사와 OpenAI 공식 발표로 별도 검증이 필요하다.
Fable 5, Table 5, GTC 5.6처럼 표기가 흔들리는 모델명은 자막 또는 발화 인식 오류일 가능성이 있어, 실제 지칭 대상이 무엇인지 확인해야 한다.
GLM 5.2가 Claude Opus 4.8 수준에 가깝다거나 일부 벤치마크에서 더 낫다는 평가는 영상 내 주장과 데모 맥락에 기반하므로, 공개 벤치마크·테스트 조건·실제 산출물 비교가 필요하다.
자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

GPT 5.6 제한적 출시, 정부 검토, 파트너 프리뷰 관련 주장은 공식 발표와 원문 기사 기준으로 사실 확인한다.
라이브 자막에서 흔들린 모델명과 도구명(Fable/Table, Ornif/Onif/ONRIF/Ornith, Qwen/Quen 등)을 원문 발화나 화면 자료로 정리한다.
Hermes, OpenClaw, Claude, Codex, GLM, 로컬 모델을 한 번에 모두 도입하지 말고, 입문자는 Claude 또는 현재 가장 막히는 단일 도구부터 테스트한다.
Agent OS를 구성할 때 단일 모델 의존을 줄이고, 모델 교체가 가능한 라우팅 구조와 공유 메모리 구조를 우선 설계한다.

❓ 열린 질문

영상에서 말한 GPT 5.6, Fable 5, Table 5, GTC 5.6은 각각 어떤 실제 모델이나 사건을 가리키는가?
GPT 5.6의 고객별 승인 구조가 일시적 프리뷰 방식인지, 향후 미국 프런티어 모델 출시의 장기 템플릿이 될 가능성이 있는지 어떻게 확인할 수 있는가?
Agent OS를 실제 팀에 적용할 때 최소 구성은 Claude와 Hermes만으로 충분한가, 아니면 Obsidian·Oracle·로컬 모델·영상 에이전트까지 포함해야 효과가 나는가?