Build with Fable 5: The Last AI Assistant You''ll Ever Need (JARVIS)
Quick Summary
Fable 5 기반 JARVIS는 흩어진 파일·노트·이메일·캘린더·웹 검색을 음성으로 연결해 개인 업무 맥락을 기억하고 실행을 돕는 AI Assistant 데모다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
Fable 5 기반 JARVIS는 흩어진 파일·노트·이메일·캘린더·웹 검색을 음성으로 연결해 개인 업무 맥락을 기억하고 실행을 돕는 AI Assistant 데모다.
📌 핵심 요점
- Jarvis의 핵심 문제의식은 개인 지식과 업무 자료가 여러 도구에 흩어질수록 AI를 써도 탐색, 정리, 컨텍스트 전환 비용이 계속 커진다는 점이다.
- 영상의 Jarvis는 호출어 기반 음성 실행, 3D second brain, 노트 연결, 장기기억을 통해 사용자가 잊은 작업 맥락과 관련 자료를 다시 불러오는 비서로 소개된다.
- 온라인 리서치 기능은 Kit의 대안처럼 사용자가 요청한 주제를 웹에서 찾아 EmailOctopus, Brevo 같은 후보를 카드 형태로 남기는 방식으로 시연된다.
- 화면 공유 기능은 사용자가 허용한 탭을 Jarvis가 읽고, 페이지의 대시보드·저장소 정보·수치 등을 바탕으로 설명하는 형태로 작동한다.
- 모델 전환, 실시간 대화 모드, 캘린더·이메일 브리핑, 장기기억이 결합되면서 단순 챗봇보다 개인화된 업무 인터페이스에 가까운 방향이 강조된다.
🧩 배경과 문제 정의
- 이 영상은 개인의 지식, 파일, 일정, 이메일, 웹 검색이 여러 도구에 흩어져 있을 때 AI 비서가 어떤 방식으로 업무 흐름을 줄일 수 있는지를 Jarvis 데모를 통해 보여준다.
- 문제의 출발점은 사용자가 필요한 맥락을 직접 기억하고, 여러 앱을 오가며 검색하고, 이전 작업 내용을 다시 찾아야 하는 부담이다.
- Jarvis는 음성 호출, 장기기억, 화면 공유, 온라인 리서치, 모델 전환, 캘린더·이메일 접근을 하나의 인터페이스에 묶어 개인 second brain처럼 작동하도록 설계된 AI 비서로 소개된다.
- 핵심은 단순히 질문에 답하는 챗봇이 아니라, 사용자의 업무 맥락과 선호를 기억하고 필요한 정보를 찾아 카드로 정리하며, 화면과 외부 도구에 접근해 실제 작업 단계를 줄이는 데 있다.
- 다만 영상에서 제시되는 기능들은 데모 중심으로 설명되므로, 실제 구축 난이도, 보안 설정, 서비스 연동 범위, 운영 안정성은 별도 검증이 필요한 영역이다.
🕒 시간순 섹션별 상세정리
1. Jarvis의 음성 호출과 개인 second brain 데모
- Jarvis는 자신을 사용자의 second brain과 노트 관리 역할을 맡은 비서로 소개하며, 사용자가 잊은 작업 맥락을 대신 기억하는 존재로 설정된다 [00:06]
- 사용자는 음성으로 Jarvis를 호출하고, Jarvis는 개인 지식 관리와 업무 보조를 결합한 비서처럼 응답한다 [00:21]
- 영상의 초반부는 Jarvis가 단순한 채팅창이 아니라 사용자의 기억, 노트, 업무 흐름을 이어주는 인터페이스라는 점을 강조한다 [00:36]
- Claude Fable 5 모델 기반 Jarvis는 여러 시간과 많은 토큰을 들여 만든 AI 비서로 소개되며, 영상은 전체 데모와 유사한 시스템을 어떻게 구축할 수 있는지 보여주는 흐름으로 전개된다 [01:12]
2. 온라인 리서치와 결과 카드 생성
- 사용자는 Kit이라는 이메일 마케팅 플랫폼의 비용 부담을 줄이기 위해 더 저렴한 대안을 온라인에서 찾아달라고 요청한다 [03:38]
- 이 요청은 Jarvis가 개인 비서처럼 웹에서 정보를 찾고, 사용자의 실제 의사결정에 필요한 후보를 정리하는 장면으로 계속된다 [03:53]
- Jarvis는 인터넷 접근 권한을 활용해 외부 정보를 검색하고, 수집한 내용을 카드 형태로 되돌려 작업 메모처럼 남길 수 있다 [04:08]
- 이 기능은 검색 결과를 단순히 나열하는 것이 아니라, 나중에 다시 참고할 수 있는 구조화된 정보 단위로 저장한다는 점에서 second brain 개념과 연결된다 [04:23]
3. 화면 공유, 시각 인식, 실시간 인터럽트
- 하단의 화면 버튼을 통해 특정 탭을 공유하면 Jarvis는 사용자가 허용한 화면만 볼 수 있으며, 접근 범위는 사용자의 공유 선택에 의해 제한된다 [04:33]
- 이 장면은 AI 비서가 사용자의 전체 컴퓨터를 무제한으로 보는 것이 아니라, 명시적으로 공유된 화면을 기반으로 시각 정보를 이해한다는 점을 보여준다 [04:48]
- 공유된 화면에서 Jarvis는 starhistory.com 대시보드, Hermes agent 저장소, Python MIT repo 태그라인, 글로벌 랭크, 스타·포크·기여자 수 같은 세부 정보를 읽는다 [04:53]
- 화면 인식 기능은 사용자가 직접 설명하지 않아도 Jarvis가 현재 보고 있는 웹페이지의 내용을 파악하고, 대화 중 필요한 맥락으로 활용할 수 있음을 보여준다 [05:08]
4. 모델 전환, 일정·이메일 접근, 장기기억
- 하단 안테나 버튼은 GPT real-time 기반 저지연 라이브 대화 모드로 전환하는 기능으로 소개되며, Jarvis는 상황에 맞는 대화형 인터페이스로 바뀔 수 있다 [05:42]
- 모델 전환 기능은 하나의 고정된 응답 방식만 사용하는 대신, 작업 성격에 따라 실시간 대화나 다른 모델 기반 처리로 넘어갈 수 있음을 보여준다 [05:57]
- 브리핑 버튼은 아침 인사, 할 일, 주의가 필요한 항목을 모아주는 기능으로 제시되며, Jarvis가 하루 업무를 시작하는 개인 비서 역할을 확장할 수 있음을 보여준다 [06:12]
- 캘린더와 이메일 접근은 Jarvis가 단순 지식 검색을 넘어 사용자의 일정과 커뮤니케이션 맥락까지 참고할 수 있게 만드는 핵심 연결점으로 드러난다 [06:27]
- 장기기억 기능은 사용자의 선호와 반복되는 업무 맥락을 기억해, 매번 같은 정보를 다시 설명해야 하는 부담을 줄이는 방향으로 드러난다 [06:42]
5. 댓글을 통한 질문 수렴
- 영상 후반부에서는 시청자에게 질문이 있으면 댓글에 남길 수 있다고 안내하며, 남은 의문을 영상 밖의 후속 대화로 이어갈 수 있는 통로를 연다 [12:01]
- 이 구간은 Jarvis 기능 설명이나 구축 과정 자체보다, 시청자의 추가 질문을 수렴하고 이후 설명 요청을 받을 수 있도록 하는 마무리 안내에 가깝다 [12:16]
- 댓글 아래 영역이 질문 수집 장소가 되면서, 시청자 반응과 추가 설명 요청이 이후 상호작용의 근거가 된다 [12:31]
6. 시청 감사와 다음 콘텐츠 연결
- 마지막 구간에서는 시청 감사 인사가 나오며, 새로운 기능 설명보다는 영상 전체를 마무리하고 시청자와의 관계를 유지하는 데 초점이 맞춰진다 [12:46]
- 발표자는 다음 콘텐츠에서 다시 만나는 흐름을 열어두며, Jarvis 데모와 구축 흐름에 대한 관심을 후속 영상이나 댓글 상호작용으로 이어가려 한다 [13:01]
- 입력 metadata의 durationMs와 제공된 12분대 후반 타임스탬프 사이에는 차이가 있으므로, 실제 영상 종료 시각과 마지막 발화 위치는 원본 기준 확인이 필요하다 [13:16]
🧾 결론
- 이 영상의 Jarvis는 “대화만 하는 AI”보다 “내 자료와 화면, 일정, 이메일, 웹 검색에 접근해 업무 흐름을 줄이는 AI 비서”에 초점을 둔다.
- 가장 중요한 가치는 멋진 3D 인터페이스 자체보다, 흩어진 second brain과 업무 자료를 음성으로 검색·요약·연결할 수 있게 만드는 데 있다.
- Jarvis가 강력해질수록 접근 권한도 커지므로, 실제 사용에서는 파일·이메일·캘린더·화면 공유 범위를 신중하게 관리해야 한다.
- 영상에서 언급된 EmailOctopus 가격 우위나 Brevo 과금 방식은 데모 속 리서치 결과이므로, 실제 도입 전에는 최신 공식 요금표로 별도 검증이 필요하다.
📈 투자·시사 포인트
- 개인 AI 비서의 경쟁력은 모델 성능만이 아니라 사용자의 파일, 노트, 이메일, 캘린더, 화면 맥락을 얼마나 안전하고 자연스럽게 연결하느냐에 달려 있다.
- 단일 모델 고정형보다 Claude, Gemini, Grok 등 여러 모델을 상황에 맞게 바꾸는 구조가 비용·성능 최적화 측면에서 더 중요해질 수 있다.
- 장기기억과 업무 맥락 복원 기능은 지식노동자의 반복 탐색 시간을 줄이는 핵심 사용 사례로 보이며, 생산성 도구 시장에서 차별화 포인트가 될 수 있다.
- 다만 화면 공유와 이메일·캘린더 접근은 개인정보·보안 리스크를 동반하므로, 권한 제어와 투명한 데이터 처리 방식이 채택의 관건이 될 가능성이 크다.
⚠️ 불확실하거나 확인이 필요한 부분
- 영상에서는 Jarvis가 “Claude Fable 5” 기반으로 소개되지만, 해당 모델명·버전의 실제 제공 여부와 공식 사양은 transcript만으로 검증되지 않는다.
- EmailOctopus가 Kit보다 최대 50% 저렴하고 Brevo가 발송 이메일 기준 과금으로 진입 가격이 낮다는 비교는 영상 내 리서치 결과이므로, 최신 요금제·제한 조건·자동화 기능 차이는 공식 가격 페이지에서 재확인이 필요하다.
- Jarvis가 이메일, 캘린더, 파일, 화면 공유, 온라인 검색에 접근하는 방식은 데모 기준 설명이며, 실제 구현 시 권한 범위·보안 모델·개인정보 처리 방식은 별도로 확인해야 한다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- Jarvis형 개인 AI 비서를 만들기 전에 내 업무 자료가 어디에 흩어져 있는지 파일, 노트, 이메일, 캘린더, 브라우저 기준으로 목록화한다.
- 음성 호출, 화면 공유, 온라인 검색, 장기기억, 모델 전환 중 실제로 필요한 기능을 우선순위별로 나눈다.
- 이메일·캘린더·파일 접근 권한을 연결하기 전, 어떤 데이터까지 AI 비서가 읽고 저장할 수 있는지 보안 기준을 정한다.
- Kit 대안으로 언급된 EmailOctopus와 Brevo의 최신 가격, 자동화 기능, 구독자·발송량 제한을 직접 비교한다.
❓ 열린 질문
- Jarvis의 장기기억은 사용자의 선호와 작업 맥락을 어떤 방식으로 저장하며, 사용자가 기억을 수정하거나 삭제할 수 있는가?
- 화면 공유 기능은 특정 탭만 보는 구조라고 설명되지만, 실제 구현에서 브라우저 권한과 로컬 파일 접근은 어떻게 분리되는가?
- 여러 모델을 OpenRouter API로 전환할 때, 비용·응답 속도·정확도 기준으로 어떤 작업에 어떤 모델을 배치하는 것이 적절한가?