How to Build Your Own Agent Operating System
Quick Summary
How to Build Your Own Agent Operating System의 핵심은 AI 도구를 더 많이 모으는 것이 아니라, 공유 메모리·모델 라우팅·에이전트 루프를 한 운영체제처럼 묶어 누적 개선되는 작업 시스템을 만드는 데 있다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
How to Build Your Own Agent Operating System의 핵심은 AI 도구를 더 많이 모으는 것이 아니라, 공유 메모리·모델 라우팅·에이전트 루프를 한 운영체제처럼 묶어 누적 개선되는 작업 시스템을 만드는 데 있다.
📌 핵심 요점
- Agent OS는 Claude, Hermes, OpenClaw, 로컬 모델, API, 전용 에이전트를 하나의 미션 컨트롤 안에 연결해 리드 생성, 아웃리치, 뉴스 탐색, 영상, SEO 같은 반복 업무를 처리하려는 구조다.
- 기존 AI 사용 방식의 문제는 여러 탭과 앱이 분리되어 있어 비즈니스 맥락, 고객 정보, 파일, 말투를 매번 다시 설명해야 한다는 점이다.
- 영상은 Agent OS를 foundation, memory, routers, agents, loop의 5개 층으로 설명하며, 단순한 도구 수집이 아니라 시간이 갈수록 강해지는 레이어형 시스템을 강조한다.
- Obsidian 기반 공유 메모리는 모든 모델과 에이전트가 같은 비즈니스 맥락을 읽게 만들어 반복 설명을 줄이고, 작업 기록과 말투, 고객 정보, 최신 자료를 누적하는 역할을 한다.
- 라우터와 병렬 에이전트 구조는 작업별로 적합한 모델을 선택하고, 계획·빌드·글쓰기·리서치 같은 흐름을 동시에 실행해 사용자가 직접 모든 AI 도구를 조율하는 부담을 낮춘다.
🧩 배경과 문제 정의
- 영상의 문제의식은 여러 AI 도구를 탭마다 따로 쓰는 방식이 실제 업무 흐름을 끊어 놓는다는 데 있다. ChatGPT, Claude, 코딩 도구, 로컬 모델, 파일, 고객 정보가 서로 분리되면 사용자는 매번 비즈니스 맥락과 말투, 고객 정보, 이전 작업을 다시 설명해야 한다.
- Agent OS는 Claude, Hermes, OpenClaw, 로컬 모델, API, 전용 에이전트, 자체 SaaS 도구를 하나의 운영체제처럼 묶어 쓰려는 구조다. 단순히 AI 도구를 많이 모으는 것이 아니라, 반복 업무와 도구 제작, 산업별 워크플로를 한 시스템 안에서 연결하는 것이 핵심이다.
- 핵심 문제는 “어떤 AI가 가장 좋은가”가 아니라 “AI들이 같은 맥락과 메모리, 라우팅 규칙, 자동화 루프 안에서 함께 일하게 만들 수 있는가”에 가깝다.
- 이를 위해 영상은 Agent OS를 여러 층으로 설명한다. 모델을 한 대시보드에 연결하는 foundation, Obsidian 기반 공유 메모리, 작업별 모델 라우터, 병렬 에이전트, 그리고 루프 엔지니어링이 서로 쌓이면서 시간이 갈수록 더 강해지는 구조를 만든다.
- 비용과 데이터 통제도 중요한 배경이다. 기존 구독 도구, 무료 로컬 모델, 무료 API, 로컬 Obsidian vault를 조합하면 추가 구독 비용과 클라우드 의존을 줄이면서도 개인화된 AI 업무 시스템을 만들 수 있다는 방향을 제시한다.
🕒 시간순 섹션별 상세정리
- Agent OS의 개념과 5개 층 구조
- Agent OS는 Claude, Hermes, OpenClaw 같은 여러 에이전트와 자체 SaaS 도구를 한 시스템 안에서 함께 작동시키는 구조로 드러난다. 리드 생성, 아웃리치, 뉴스 탐색, 영상 제작, SEO, 음악 에이전트처럼 서로 다른 업무 영역까지 확장할 수 있는 운영체제형 구조다 [01:41]
- 발표자는 약 8주 동안 처음부터 이 시스템을 구축했다고 보여준다. 경험이 없는 상태에서도 AI 기반 SaaS와 자동화 도구를 층별로 쌓아 올리면, 매일 개선되는 운영체제처럼 성장시킬 수 있다는 사례로 보여준다 [01:56]
- 미션 컨트롤과 기존 AI 사용 방식의 한계
- 미션 컨트롤 대시보드는 Claude Code, Lambda, Obsidian, GLM-5.2, 모델 선택 라우터를 한 화면에 묶는 중심 화면으로 드러난다. 각 층은 완전히 새로운 도구를 강제로 도입하는 것이 아니라, 이미 쓰고 있는 도구를 기반으로 쌓는 방식이다 [02:21]
- 기존 AI 사용 방식의 문제는 도구들이 서로 분리되어 있다는 점이다. ChatGPT, Claude, 코딩 도구가 각각 다른 탭에 있고, 사용자는 비즈니스, 고객, 목소리, 파일, 맥락을 매번 다시 설명해야 하며, 이 과정에서 작업 흐름이 쉽게 끊긴다 [02:51]
- 도구 수집에서 레이어 구축으로 전환
- 발표자는 AI를 더 즐겁고 강력하게 쓰려면 새 모델과 업데이트를 계속 쫓는 방식에서 벗어나야 한다고 드러낸다. 통제 가능한 시스템을 먼저 세우지 않으면 shiny object syndrome과 정보 과부하가 커진다는 문제의식을 제시한다 [04:49]
- 기존 방식에서는 많은 탭, 반복 설명, 잃어버린 파일과 컨텍스트, 월별 도구 비용, 연결되지 않은 앱들이 누적된다. 결국 사용자가 모든 AI 도구 사이를 이어 붙이는 접착제 역할을 직접 맡게 되고, 이것이 Agent OS가 해결하려는 핵심 병목으로 드러난다 [05:27]
- 첫 번째 층: 모든 모델을 한 대시보드에 연결
- 첫 번째 foundation 층은 모든 기능이 올라가는 기반이다. 실제로 쓰는 도구만 에이전트 섹션과 사이드바에 연결해, 하나의 대시보드에서 필요한 모델과 도구를 바로 호출할 수 있게 만드는 것이 목표다 [06:20]
- 이 구조에서는 로컬 무료 모델이 일상적인 작업을 처리하고, 무료 API나 이미 비용을 내고 있는 Claude CLI 같은 도구도 추가 결제 없이 연결된다. 발표자는 이를 통해 중복 비용을 줄이고, 모델 사용을 한곳에서 통제할 수 있다고 보여준다 [06:36]
- 두 번째 층: Obsidian 기반 공유 메모리
- 두 번째 memory 층은 Agent OS의 공유 두뇌로 드러난다. Obsidian vault가 계속 커지는 메모리 갤럭시처럼 작동하면서 비즈니스 정보, 고객 정보, 말투, 작업 기록을 한곳에 축적한다 [07:37]
- 메모리가 없는 모델은 매일 처음 만나는 낯선 사람처럼 동작한다. 공유 vault를 쓰면 모든 모델과 에이전트가 답변 전에 같은 맥락을 읽을 수 있어, 사용자가 반복해서 배경 설명을 입력해야 하는 부담이 줄어든다 [07:54]
- 세 번째 층: 작업별 최적 모델 라우팅
- 세 번째 router 층은 사용자가 매번 “어떤 모델이 최고인가”를 고민하지 않게 만드는 지능형 분배 장치로 드러난다. 핵심은 하나의 만능 모델을 찾는 것이 아니라, 각 작업을 그 작업에서 가장 잘 이기는 모델로 보내는 것이다 [09:33]
- 단순 텍스트 생성은 무료 오픈 모델이나 로컬 모델이 맡고, 더 복잡하거나 품질이 중요한 빌드는 GLM-5.2, Claude, Fable 5 같은 더 강한 모델이 맡는 식으로 역할이 갈린다. 이렇게 작업별로 모델을 나누면 비용과 품질을 동시에 관리할 수 있다 [09:48]
- 병렬 에이전트와 산업별 워크플로 구성
- 발표자는 먼저 어떤 모델이 어떤 작업을 가장 잘하는지 파악한 뒤, 실제로 일을 끝낼 수 있는 에이전트를 선택하는 흐름을 보여준다. 이는 단순 모델 호출이 아니라, 업무 목적에 맞는 에이전트 운영으로 넘어가는 출발점이다 [12:00]
- 계획, 빌드, 글쓰기, 리서치 에이전트가 병렬로 움직이면 사용자는 한 가지 작업만 기다릴 필요가 없다. 사용자가 다른 일을 하는 동안에도 여러 작업 흐름이 동시에 진행되며, Agent OS는 산업별 워크플로를 실행하는 구조로 확장된다 [12:18]
- 루프 엔지니어링과 확장 가능한 에이전트 OS
- 마지막 단계인 loop engineering에서는 명령, 에이전트 작업, 메모리 성장, 운영체제 개선이 반복된다. 이 순환 구조가 단순 자동화 묶음을 시간이 지날수록 더 강해지는 운영체제 수준으로 끌어올린다 [13:49]
- 작업의 성과는 메모리에 기록되고, 새 모델은 Golden Bench에서 테스트된 뒤 적절한 위치에 들어가며, 새 도구는 새 에이전트로 연결된다. 따라서 새로운 기능을 추가할 때마다 기존 구조를 다시 만들 필요가 줄어들고, Agent OS는 계속 확장 가능한 시스템으로 마무리된다 [14:08]
- 모델 변화에도 유지되는 시스템과 직접 구축 선택지
- 발표자는 6개월 뒤의 운영체제가 지금보다 훨씬 나아질 것이며, 모델이 다음 주·다음 달·내년에 바뀌어도 시스템 자체가 계속 유용하게 남는다고 정리한다 [14:21]
- 직접 구축할 수도 있지만, 자신은 매일 약 3시간씩 새 기능을 붙이고 개선하면서 시스템을 더 유용하게 만들고 있다고 드러낸다 [14:36]
- 그 과정을 건너뛰고 싶다면 화면에 보인 전체 Agent OS를 AI Profit Boardroom에서 받을 수 있다고 안내한다 [14:45]
- 커뮤니티 구성과 최종 안내
- 커뮤니티 안에는 앞서 설명한 foundation, memory, agents, loop와 함께 local homies engine, token efficiency playbooks, 주 4회 코칭콜이 포함된다고 보여준다 [14:58]
- daily update 섹션에서는 전체 Agent OS 설치 튜토리얼, 마지막 업데이트 날짜, 설치용 zip 파일, 새 기능이 나올 때마다 추가되는 일일 튜토리얼을 제공한다고 드러낸다 [15:15]
- 커뮤니티에서는 발표자가 매일 직접 질문에 답하고, 다른 사람들도 온라인에서 도움을 줄 수 있다고 강조한다 [15:25]
- classroom, calendar, map을 통해 교육 자료를 보고, 라이브 콜에서 질문하거나 화면을 공유하며, 지역의 AI 에이전트 빌더들과 만날 수 있다고 마무리한다 [15:33]
🧾 결론
- 이 영상의 핵심 메시지는 “AI 도구를 많이 쓰는 사람”에서 “AI 도구들이 함께 작동하는 시스템을 설계하는 사람”으로 역할을 바꾸라는 것이다.
- Agent OS의 출발점은 거창한 자동화가 아니라, 실제로 쓰는 모델과 도구를 한 화면에 모으고, 공통 메모리를 붙이며, 작업별 모델 선택 기준을 만드는 것이다.
- 시간이 갈수록 중요한 차이는 개별 모델 성능보다 메모리, 라우팅, 에이전트 실행, 결과 기록이 반복되는 루프를 갖췄는지에 달려 있다.
- 영상에서 언급된 커뮤니티 사용자 성과, 8주 구축 사례, 30분 만의 생산성 향상 등은 발표자의 사례 주장으로 이해해야 하며, 일반적으로 재현 가능한 결과인지는 별도 검증이 필요하다.
📈 투자·시사 포인트
- AI 활용의 경쟁력은 단일 모델 구독보다 여러 모델을 업무 흐름에 맞게 연결하고, 비용·품질·속도를 기준으로 라우팅하는 운영 능력으로 이동하고 있다.
- 로컬 모델, 무료 API, 기존 유료 구독, Obsidian 같은 로컬 메모리 도구를 조합하면 클라우드 의존도와 중복 구독 비용을 줄일 수 있다는 점이 실무적 시사점이다.
- 기업이나 개인이 AI 자동화를 도입할 때는 “최신 모델을 무엇으로 바꿀 것인가”보다 “모델이 바뀌어도 유지되는 메모리와 워크플로 구조가 있는가”를 먼저 봐야 한다.
- 산업별로는 SEO, 영상 제작, 리서치, 리드 생성처럼 반복성과 맥락 의존성이 큰 업무에서 Agent OS형 접근의 효과가 더 크게 나타날 가능성이 있다.
- 다만 실제 투자나 도입 판단에서는 구축 시간, 유지보수 부담, 데이터 보안, 모델별 성능 검증, 자동화 결과물의 품질 관리 비용을 함께 따져야 한다.
⚠️ 불확실하거나 확인이 필요한 부분
- 영상에서 언급된 모델명과 벤치마크명은 표기 확인이 필요하다. section-detail에는 GLM-5.2, Claude Fable 5, Goldy Bench, Golden Bench가 함께 나오는데, 실제 공식 명칭이나 발음 인식 결과가 정확한지 별도 검증이 필요하다.
- “8주 동안 처음부터 구축했다”, “매일 약 3시간씩 개선했다”, “30분 만에 작업 능력이 커졌다” 같은 수치는 발표자의 경험 또는 커뮤니티 사례로 제시된 것으로 보이며, 일반적으로 재현 가능한 결과라고 단정하기는 어렵다.
- Agent OS가 추가 비용을 줄일 수 있다는 설명은 기존에 Claude Code 구독, 로컬 모델 실행 환경, 무료 API 접근권을 이미 갖고 있다는 전제에 가깝다. 사용자의 환경에 따라 실제 비용 절감 폭은 달라질 수 있다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- 현재 사용 중인 AI 도구를 정리해 Claude, Hermes, OpenClaw, 로컬 모델, API, Obsidian처럼 Agent OS의 foundation에 들어갈 후보를 분류한다.
- 반복 설명이 많이 발생하는 비즈니스 정보, 고객 정보, 말투, 작업 기록을 Obsidian vault에 저장할 폴더 구조로 설계한다.
- 작업 유형을 단순 텍스트 생성, 리서치, 코딩, SEO, 영상 제작, 리드 생성처럼 나누고 각 작업에 적합한 모델 후보를 매핑한다.
- 자주 반복되는 업무 하나를 골라 “명령 → 에이전트 실행 → 결과 저장 → 메모리 업데이트” 루프로 작게 자동화해 본다.
❓ 열린 질문
- Agent OS를 처음 구축할 때 가장 먼저 자동화할 업무는 무엇이어야 하는가: 리드 생성, 콘텐츠 제작, SEO, 리서치, 고객 응대 중 어디가 가장 큰 병목인가?
- 공유 메모리로 Obsidian vault를 쓸 때, 어떤 정보까지 에이전트가 읽게 하고 어떤 정보는 제외해야 안전한가?
- 모델 라우팅 기준은 품질, 비용, 속도, 프라이버시, 안정성 중 무엇을 우선해야 하는가?