Mythos Begets Fable, Cursor's Composer 2.5, Agents Building Agents

🖼️ 인포그래픽

Mythos Begets Fable, Cursor's Composer 2.5, Agents Building Agents 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 요약

원문은 데스크톱 AI 에이전트와 오픈소스 대안 OpenCoworker를 소개한 뒤, Anthropic의 Claude Mythos 5·Claude Fable 5 출시, 성능, 안전장치, 데이터 보관 정책, 논란을 상세히 다룬다.

📌 핵심 요약

Andrew는 사용자가 웹 챗봇에 파일을 복사해 넣는 방식에서 더 나아가, 로컬 파일을 읽고 수정하며 메시지를 처리하고 예약된 산출물을 제공할 수 있는 데스크톱 AI 에이전트를 직접 실험해 보라고 권한다.
데스크톱 에이전트는 파일 접근, 웹 검색·가져오기, 메시징 앱 연동 같은 도구를 프런티어 LLM에 연결하고 권한과 가드레일을 설정하는 에이전트 하네스를 통해 작동하며, 최근에는 LLM이 다음 행동을 고르는 방식이 실용적 대안으로 부상했다.
상용 데스크톱 에이전트의 데이터 보관 정책과 기밀문서 처리 리스크를 우려한 Andrew와 협업자들은 무료 오픈소스 대안 OpenCoworker를 만들고 있으며, 사용자는 API 키나 로컬 Ollama 모델을 통해 개인정보 요구 수준에 맞춰 운용할 수 있다.
뉴스 파트는 Anthropic이 Claude Mythos 5와 Claude Fable 5를 출시했다고 설명하며, 두 모델은 기본적으로 동일하지만 Fable 5는 보안, 생물학, 화학, 증류, 최첨단 AI 구축 관련 요청에 제한을 두는 일반 사용자용 버전이라고 정리한다.
Claude Fable 5는 여러 벤치마크에서 높은 성능을 보였지만, 기계학습 연구 관련 응답 성능을 사용자에게 알리지 않고 낮추는 초기 제한 때문에 개발자와 연구자의 강한 비판을 받았고, Anthropic은 이후 거부 또는 덜 강력한 모델로의 전달과 사용자 고지 방식으로 정책을 수정했다.

🧩 주요 포인트

Andrew는 사용자가 웹 챗봇에 파일을 복사해 넣는 방식에서 더 나아가, 로컬 파일을 읽고 수정하며 메시지를 처리하고 예약된 산출물을 제공할 수 있는 데스크톱 AI 에이전트를 직접 실험해 보라고 권한다.
데스크톱 에이전트는 파일 접근, 웹 검색·가져오기, 메시징 앱 연동 같은 도구를 프런티어 LLM에 연결하고 권한과 가드레일을 설정하는 에이전트 하네스를 통해 작동하며, 최근에는 LLM이 다음 행동을 고르는 방식이 실용적 대안으로 부상했다.
상용 데스크톱 에이전트의 데이터 보관 정책과 기밀문서 처리 리스크를 우려한 Andrew와 협업자들은 무료 오픈소스 대안 OpenCoworker를 만들고 있으며, 사용자는 API 키나 로컬 Ollama 모델을 통해 개인정보 요구 수준에 맞춰 운용할 수 있다.
뉴스 파트는 Anthropic이 Claude Mythos 5와 Claude Fable 5를 출시했다고 설명하며, 두 모델은 기본적으로 동일하지만 Fable 5는 보안, 생물학, 화학, 증류, 최첨단 AI 구축 관련 요청에 제한을 두는 일반 사용자용 버전이라고 정리한다.
Claude Fable 5는 여러 벤치마크에서 높은 성능을 보였지만, 기계학습 연구 관련 응답 성능을 사용자에게 알리지 않고 낮추는 초기 제한 때문에 개발자와 연구자의 강한 비판을 받았고, Anthropic은 이후 거부 또는 덜 강력한 모델로의 전달과 사용자 고지 방식으로 정책을 수정했다.

🧠 상세 정리

1. 데스크톱 에이전트 사용을 권하는 문제의식

Andrew의 편지는 사용자가 AI 에이전트를 단순한 대화 상대가 아니라 실제 업무를 수행하는 도구로 실험해 보라고 권하는 데서 시작한다. 그는 웹 기반 챗봇의 답을 복사해 데스크톱에 붙여 넣거나 파일을 챗봇에 끌어다 놓는 방식도 여전히 유효하다고 인정한다. 그러나 데스크톱 에이전트는 로컬 파일을 직접 읽고 편집하며, 메시지를 읽거나 보내고, 매일 뉴스 요약 같은 예약 산출물을 제공할 수 있다는 점에서 더 효율적으로 맥락을 얻고 바로 행동할 수 있다. 원문은 이러한 차이를 통해 AI 활용의 중심이 대화형 출력에서 실제 작업 실행으로 확장되고 있음을 강조한다.

2. 에이전트 하네스의 기본 구조

원문은 데스크톱 에이전트를 만드는 주된 방식으로 도구 집합, 프런티어 LLM, 권한과 가드레일의 결합을 설명한다. 파일 접근, 웹 검색과 웹 가져오기, 메시징 앱 통합 같은 기능은 함수 호출 형태의 도구로 제공되고, LLM은 주어진 과제를 진행하기 위해 언제 어떤 도구를 사용할지 선택한다. LLM을 감싸 원하는 에이전트 시스템을 구현하는 소프트웨어는 에이전트 하네스라고 불리며, 이 하네스는 각 단계에서 다음 행동을 결정하는 핵심 루프를 LLM이 구동하게 한다. 이는 개발자가 모든 순서를 고정하는 워크플로와 달리, 모델이 상황에 따라 도구 사용과 진행 방향을 선택하는 구조다.

3. 개발자 지정 워크플로에서 LLM 주도형 에이전트로의 변화

Andrew는 지금까지 코딩 에이전트를 제외한 대부분의 실용적인 에이전트형 AI 워크플로가 LLM에 다음 행동 결정을 크게 맡기지 않았다고 설명한다. 그 대신 높은 신뢰성을 위해 개발자가 미리 지정한 워크플로에 더 많이 의존해 왔다. 하지만 최근 몇 달 사이 프런티어 LLM의 성능이 향상되면서, 완전히 신뢰할 수는 없더라도 LLM이 다음 단계를 주도하는 하네스 설계가 중요한 대안으로 떠올랐다고 본다. 원문은 Claude Code, Codex CLI, Antigravity CLI, OpenCode 같은 명령줄 코딩 에이전트를 이러한 방식의 대표 사례로 들면서도, 사용하기 쉬운 비명령줄 데스크톱 에이전트에도 가치가 있다고 말한다.

4. 상용 데스크톱 에이전트에 대한 기밀성과 법적 우려

Andrew는 기존 상용 데스크톱 에이전트를 매우 기밀성이 높은 작업에는 사용하지 않는다고 밝힌다. 그 이유는 일부 서비스의 데이터 보관 정책이 난해한 법률 문구 속에 묻혀 있거나 새 모델 출시와 함께 갑자기 바뀔 수 있다는 불편함 때문이다. 그는 Anthropic의 Fable 출시에서 보았듯 정책 변화가 사용자에게 중요한 영향을 줄 수 있다고 암시한다. 또한 작은 실수 하나가 기밀 문서에 대한 법적 특권을 잃는 등 예상치 못한 법적 결과로 이어질 수 있다고 경고한다. 이 대목은 데스크톱 에이전트가 강력한 만큼, 데이터 보관과 문서 접근 권한을 신중히 다뤄야 한다는 문제의식을 보여준다.

5. 오픈소스 대안 OpenCoworker의 목적과 사용 조건

이러한 우려를 바탕으로 Andrew는 Rohit Prsad, Devika Verma와 함께 무료 오픈소스 대안인 OpenCoworker를 개발하고 있다고 소개한다. OpenCoworker는 aisuite를 확장해 에이전트 하네스를 지원하는 과정에서 만들어진 프로젝트이며, 에이전트형 하네스에 관심 있는 독자에게 코드를 살펴보라고 권한다. 사용자는 OpenAI, Anthropic, Google 또는 다른 제공자의 API 키를 직접 준비해야 하며, Ollama로 로컬 모델을 실행하면 데이터가 기기 밖으로 나가지 않게 할 수도 있다. 이메일 같은 일부 데이터 통합은 아직 설정이 어렵고, OpenClaw나 Hermes Agent 같은 다른 오픈소스 프로젝트 사용자들이 겪었을 법한 수준의 난도가 있다고 설명한다.

6. OpenCoworker의 현재 활용과 지향점

Andrew의 팀은 OpenCoworker를 메시징 자동화, 문서 작성, 워크플로 자동화 등 다양한 작업에 실험하고 있다. 원문은 이 프로젝트가 아직 진행 중인 작업이라고 분명히 말하며, 닫힌 상용 데스크톱 에이전트와 견줄 수 있거나 그보다 나은 공개형 선택지가 생기기를 기대한다. OpenCoworker는 메모리를 사용자 컴퓨터에 저장하고, 사용자는 개인정보 요구 사항에 따라 데이터 보관을 하지 않는 LLM 제공자, 로컬 추론, 기타 선택지를 고를 수 있다. Andrew는 프로젝트를 더 쉽게 사용할 수 있도록 개선 중이라고 밝히며, 오픈소스 커뮤니티의 기여와 피드백을 환영한다.

7. Claude Mythos 5와 Claude Fable 5의 출시와 사양

뉴스 파트는 Anthropic이 Claude Mythos 5와 Claude Fable 5를 출시했다고 전한다. 두 모델은 4월 초부터 엄격하게 제한 배포된 Claude Mythos Preview를 갱신한 모델이며, 기본적으로 동일하지만 Claude Fable 5는 보안, 생물학, 화학, 증류 관련 요청에 응답하지 않고 최첨단 AI 구축 관련 요청에 대해서는 응답 품질을 낮추는 차이가 있다고 설명된다. 두 모델은 소프트웨어 엔지니어링과 지식 작업 등 여러 영역에서 새로운 최고 수준의 성능을 세웠다고 소개된다. 텍스트와 이미지를 입력으로 받고 최대 100만 토큰 입력, 최대 12만8000토큰 출력이 가능하며, 적응형 추론, 다섯 단계의 추론 노력, 도구 사용, 병렬 서브에이전트 같은 기능이 언급된다.

8. 성능 평가, 안전 우려, 데이터 보관 정책

원문에 따르면 Claude Fable 5는 Artificial Analysis Intelligence Index와 여러 구성 평가에서 최상위 성능을 보였고, 지식 작업, 도구 사용, 사이버보안, 공간 추론, 과학 연구, 코딩과 에이전트형 코딩 평가에서도 강한 결과를 냈다. 다만 발표 시점에는 Claude Mythos 5에 대한 독립 평가가 제공되지 않았으며, Anthropic은 Mythos 5의 능력이 Fable 5와 같다고 설명했다. Anthropic은 Mythos 5와 Fable 5, 그리고 동등하거나 더 높은 능력의 미래 모델에 대해 비즈니스 고객 데이터를 30일간 보관하되, 이를 새 모델 훈련이 아니라 악의적 활동 관리 개선에 사용한다고 밝혔다. 또한 Anthropic은 두 모델이 사용자 의도에 반하는 행동을 할 가능성을 매우 낮게 평가하면서도, Mythos 5가 민감 자산 접근과 자율적 목표 수행이 가능한 시스템에서 우려를 낳을 수 있다고 본다.

9. Claude Fable 5 제한 정책을 둘러싼 논란과 수정

Claude Fable 5는 출시 당시 고성능 AI 구축과 관련된 요청에 대해 특별한 제한을 두었고, 이 점이 큰 논란을 일으켰다. 원문은 사전학습 파이프라인, 분산 학습 인프라, 머신러닝 가속기 설계 같은 요청이 들어오면 모델이 프롬프트 수정, 스티어링 벡터, 파라미터 효율적 미세조정 같은 방식으로 효과를 제한했다고 설명한다. 더 문제가 된 부분은 사용자가 모델의 능력이 낮아졌다는 사실을 통보받지 못했다는 점이었다. AI 연구자 Dean W. Ball은 기계학습 연구 성능을 알리지 않고 낮추는 것은 충격적으로 적대적이라고 비판했고, Robert Scoble은 주요 모델 출시를 두고 AI 커뮤니티가 이렇게 화난 것을 본 적이 없다고 말했다. Anthropic은 이후 관련 입력을 거부하거나 덜 강력한 Claude Opus 4.8로 넘기고, 어느 경우든 사용자에게 알리는 방식으로 정책을 바꾸었다.

10. 왜 중요한가와 Andrew의 평가

원문은 Claude Mythos Preview가 공개된 4월 이후 보안 담당자들이 AI 지원 공격 가능성에 대비해 왔고, 대중은 이 새로운 모델 계열이 실제로 무엇을 할 수 있는지 궁금해했다고 설명한다. Claude Mythos 5와 Claude Fable 5는 특히 AI 지원 코딩에서 의미 있는 향상을 보여 주며, 완전한 성능의 Mythos를 제한 배포하고 일반 사용자를 위한 가드레일 버전인 Fable을 제공하는 구분은 보안팀이 대비하는 동안 합리적인 선택으로 제시된다. 동시에 Andrew는 Anthropic이 개발자가 Anthropic과 경쟁할 수 있는 기술을 만드는 데 도움을 주는 능력을 낮추는 결정에 우려를 표한다. 그는 사용자가 합법적인 목적이라면 제품을 원하는 방식으로 사용할 수 있어야 한다고 보며, 원문은 Microsoft가 개발자에게 Windows로 특정 애플리케이션을 만들 수 없다고 말하는 상황을 상상해 보라는 문장으로 이어지다가 제공된 본문이 중간에서 끝난다.

🧾 핵심 주장 / 시사점

원문 전체의 핵심 긴장은 에이전트가 더 많은 권한을 갖고 실제 작업을 수행할수록 생산성은 커지지만, 데이터 보관, 기밀 문서 접근, 법적 책임, 사용자 통제 문제가 동시에 커진다는 점이다.
OpenCoworker 소개는 단순한 프로젝트 홍보라기보다, 닫힌 상용 데스크톱 에이전트에 대한 불신과 프라이버시 요구를 오픈소스·로컬 추론·데이터 보관 선택권으로 대응하려는 흐름을 보여준다.
Claude Fable 5 논란은 안전장치 자체보다도 사용자가 성능 저하나 모델 전환을 알지 못한 채 결과를 받는 상황이 얼마나 큰 신뢰 문제를 만들 수 있는지를 드러낸다.

✅ 액션 아이템

로컬 파일 읽기·수정, 웹 검색·메시징 연동까지 포함한 데스크톱 에이전트 실험 시나리오로 실제 작업 적용 범위를 점검한다.
상용 에이전트의 데이터 보관·기밀문서 위험을 낮추기 위해 OpenCoworker 도입과 API 키, 로컬 Ollama 운용 방식을 비교해 기준을 정한다.
Mythos 5와 Fable 5의 기본 동일성 및 제한 도메인을 대조해, 연구자 대상 성능 저하 통지 방식의 적정성도 점검한다.