YouTubeRiley Brown·2026년 6월 21일·0

AI Agents Just Changed Forever: GLM 5.2, Codex Skills, Claude & Cursor

Quick Summary

AI Agents 경쟁은 GLM 5.2의 저비용 오픈소스 압박, Codex Skills의 화면 녹화 자동화, Claude와 Cursor의 업무 흐름 통합으로 한 단계 더 넓어졌다.

영상 보기

클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.

원본 열기

🖼️ 인포그래픽

AI Agents Just Changed Forever: GLM 5.2, Codex Skills, Claude & Cursor 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

AI Agents Just Changed Forever: GLM 5.2, Codex Skills, Claude & Cursor 내용을 설명하는 본문 이미지

💡 한 줄 결론

AI Agents 경쟁은 GLM 5.2의 저비용 오픈소스 압박, Codex Skills의 화면 녹화 자동화, Claude와 Cursor의 업무 흐름 통합으로 한 단계 더 넓어졌다.

📌 핵심 요점

  1. GLM 5.2는 영상에서 Opus 4.8·GPT 5.5에 근접한 성능 후보이자 훨씬 낮은 비용의 오픈소스 모델로 소개되며, 폐쇄형 프런티어 모델 의존도를 낮출 수 있는 선택지로 부각된다.
  2. Cursor에서는 OpenRouter를 통해 GLM 5.2를 붙여 쓸 수 있고, 여러 모델 API를 하나의 경로로 연결해 코딩 에이전트 환경 안에서 모델 선택권을 넓히는 흐름이 강조된다.
  3. Codex의 record and replay는 사람이 브라우저에서 수행한 UI 작업을 녹화한 뒤 재사용 가능한 skill로 바꾸는 방식으로, 에이전트가 “보여준 업무 절차”를 따라 하게 만드는 변화로 제시된다.
  4. Slack 기반 Hyperagent, Claude Design, Claude Code artifacts는 에이전트가 별도 도구가 아니라 팀 채널, 디자인 캔버스, 공유 가능한 미니 앱 안으로 들어오는 흐름을 보여준다.
  5. Cursor, Claude, Codex, 오픈소스 모델, Google까지 경쟁 축이 늘어나면서 사용자는 더 많은 선택지를 얻지만, 각 제품의 실제 성능·비용·지속 가능성은 계속 검증해야 한다.

🧩 배경과 문제 정의

  • 이 영상은 AI 에이전트 생태계가 오픈소스 모델, 코딩 에이전트, 업무용 자동화 도구, 협업용 AI 앱까지 동시에 확장되는 흐름을 다룬다.
  • 핵심 문제의식은 “AI 에이전트가 별도 챗봇이나 실험용 도구에 머무르지 않고, Cursor·Slack·Codex·Claude 같은 실제 작업 환경 안으로 들어오고 있다”는 점이다.
  • GLM 5.2는 낮은 비용과 프런티어급 모델에 근접했다는 평가를 앞세워, GPT 5.5·Opus 4.8 같은 폐쇄형 모델 중심 구도에 압박을 주는 사례로 제시된다.
  • 오픈 모델의 장점은 단순히 가격이 낮다는 데 그치지 않고, 사용자가 모델 가중치와 실행 환경을 더 직접 통제할 수 있어 특정 폐쇄형 서비스 접근권에만 의존하는 위험을 줄인다는 데 있다.
  • Codex의 화면 녹화 기반 skill 생성은 사람이 브라우저에서 수행한 UI 작업을 에이전트가 재사용 가능한 절차로 바꾸는 흐름을 보여준다.
  • Slack 기반 Hyperagent, Claude Design, Claude Code artifacts는 에이전트가 팀 업무·디자인·분석·공유 가능한 미니 앱 제작까지 확장되는 방향을 보여준다.
  • 검증이 필요한 내용으로는 SpaceX의 Cursor 인수 소식, Fable/Mythos 관련 모델 명칭과 출시 가능 시점, GLM 5.2의 실제 성능·비용 비교 수치가 있다. 영상 내 주장으로는 정리할 수 있지만, 외부 사실로 단정하려면 별도 확인이 필요하다.

🕒 시간순 섹션별 상세정리

  1. GLM 5.2가 오픈소스 에이전트 모델 경쟁의 핵심으로 등장
  • Z.ai의 GLM 5.2는 중국 기반 회사가 공개한 오픈소스 모델로 소개되며, GPT 5.5보다 5~6배 저렴할 수 있고 Opus 4.8·GPT 5.5에 가까운 성능 후보로 거론된다 [00:40]
  • 발표자는 매일 쓰는 폐쇄형 모델에만 의존하면 접근권이나 정책 변화에 취약할 수 있다고 보고, 가중치를 다운로드할 수 있는 오픈 모델이 이 리스크를 줄인다고 보여준다 [01:11]
  • GLM 5.2 같은 오픈 모델의 등장은 OpenAI와 Anthropic 같은 프런티어 랩에도 더 강력한 모델과 더 나은 가격 경쟁을 요구하는 압력으로 작용한다 [01:26]
  1. 벤치마크와 실제 사용 테스트에서 기대 이상의 결과가 나온 GLM 5.2
  • 공개 벤치마크상 GLM 5.2는 Opus와 GPT 5.5에 비교 가능한 위치로 제시되며, 단순히 그래프와 hype만 앞세운 기존 오픈 모델 사례와 다를 수 있다는 기대가 나온다 [01:41]
  • 발표자는 벤치마크만으로는 모델의 실제 유용성을 판단하기 어렵다고 전제하면서도, 이번 모델은 실사용 테스트에서 기대보다 좋은 인상을 줬다고 평가한다 [02:07]
  • 실제 사용 후 GLM 5.2는 “vibe check”를 통과한 모델로 언급되며, Opus 4.8과 GPT 5.5 같은 프런티어 모델에 더 가까워지고 있다는 판단이 드러난다 [02:22]
  1. Cursor에서 OpenRouter로 GLM 5.2를 직접 붙이는 절차
  • Cursor 안에서 GLM 5.2를 사용하기 위해 OpenRouter를 활용하면, 여러 모델별 API 키를 따로 관리하지 않고 하나의 키로 GPT 5.5, Claude Opus, DeepSeek V4, GLM 5.2 등에 접근할 수 있다고 보여준다 [03:35]
  • OpenRouter는 다양한 모델을 하나의 라우팅 계층으로 연결해 주는 방식으로 소개되며, Cursor 사용자 입장에서는 모델 선택지를 넓히는 실용적 방법으로 드러난다 [03:50]
  • Cursor 설정의 Models와 API keys 영역에서 자체 API 키 사용을 켜고 OpenAI base URL을 OpenRouter 주소로 바꾸면, OpenAI 키 입력란을 OpenRouter API 키 입력 방식으로 전환할 수 있다 [04:13]
  • 이 절차를 통해 Cursor 내부에서 GLM 5.2를 포함한 여러 모델을 테스트하고, 폐쇄형 모델과 오픈 모델을 같은 작업 흐름 안에서 비교할 수 있게 된다 [04:28]
  1. 오픈소스 모델의 Fable급 도달 가능성과 비용 경쟁 압력
  • Z.AI 창업자는 GLM 5.2 이후 Fable급 오픈소스 모델이 올해 안에 가능하다는 취지의 반응을 보였고, 발표자는 이것이 Elon Musk가 예상한 Q1보다 빠른 일정 가능성을 시사한다고 해석한다 [06:09]
  • 이 부분은 영상 내 주장으로는 중요한 전망이지만, Fable이라는 모델명과 실제 출시 일정은 외부 확인이 필요한 내용으로 분리해서 봐야 한다 [06:24]
  • 약 5개월 안에 Fable보다 나을 수 있는 오픈소스 모델이 등장할 가능성이 생기면, 성능뿐 아니라 비용 측면에서도 폐쇄형 프런티어 모델에 큰 압박이 발생한다는 논지가 계속된다 [06:46]
  1. Slack 안에서 팀 업무 에이전트를 운영하는 Hyperagent 사례
  • 발표자는 팀 마케팅 업무처럼 반복적이고 협업이 필요한 작업에서는 Slack 안에서 바로 움직이는 클라우드 기반 에이전트가 특히 유용하다고 보여준다 [06:55]
  • Hyperagent는 에이전트를 팀 채널에 붙이고, 일정 실행, 외부 통합 사용, 알림 발송까지 처리할 수 있는 사례로 묶인다 [07:10]
  • YouTube researcher 에이전트는 경쟁자 채널을 스캔하고 성과가 좋은 영상을 추적하며, 특정 niche에서 잘 작동하는 키워드와 토픽을 바탕으로 새 영상 아이디어를 제안한다 [07:22]
  • 이 예시는 에이전트가 별도 도구가 아니라 팀의 기존 커뮤니케이션 공간 안에서 작동할 때 업무 자동화의 체감 가치가 커진다는 점을 보여준다 [07:37]
  1. Codex의 record and replay가 화면 작업을 재사용 가능한 skill로 전환
  • Codex의 record and replay 플러그인은 화면 녹화를 켜고 사람이 Typefully draft 생성 절차를 직접 보여주면, 그 과정을 바탕으로 manual tweet draft 같은 skill을 만들 수 있다고 드러난다 [08:19]
  • 이 기능의 핵심은 사람이 브라우저에서 수행하는 클릭, 입력, 이동, 업로드 같은 UI 작업을 에이전트가 이후 반복 실행할 수 있는 절차로 변환한다는 점이다 [08:34]
  • 녹화 중에는 Comet에서 Typefully로 이동하고 계정을 전환한 뒤 텍스트 초안 작성, 이미지 업로드, PNG 선택까지 실제 브라우저 작업 흐름이 캡처된다 [09:14]
  • 발표자는 이 흐름을 통해 에이전트가 API 기반 자동화만이 아니라 사람이 쓰는 웹 인터페이스 자체를 보고 따라 하는 방향으로 확장된다고 본다 [09:29]
  1. Cursor는 SpaceX 자본·컴퓨트·유통망을 얻으며 Codex와 Claude를 추격한다
  • SpaceX의 Cursor 인수 소식은 단순한 M&A가 아니라 에이전트 코딩 플랫폼 경쟁에 직접적인 영향을 주는 사건으로 드러난다 [12:16]
  • 이 인수 소식은 외부 검증이 필요한 내용이지만, 영상의 논지 안에서는 Cursor가 Codex와 Claude Code의 격차를 줄일 가능성을 키우는 변수로 다뤄진다 [12:31]
  • Cursor는 SpaceX를 통해 막대한 컴퓨트와 자본을 확보하고, Twitter 유통망까지 활용할 수 있어 모델 학습과 사용자 확산 양쪽에서 유리해질 수 있다고 드러난다 [12:55]
  • 발표자는 이런 조건이 Cursor의 제품 개선 속도와 시장 확산을 동시에 밀어 올릴 수 있으며, 에이전트 코딩 도구 경쟁을 더 빠르게 만들 수 있다고 본다 [13:10]
  1. Fable/Mythos 부재는 Claude 사용자 기대치를 낮추고 모델 야망의 기준을 바꾼다
  • Claude 사용자들 사이에서는 Fable 사용 후 Opus로 돌아갔을 때 작업 추진력과 문제 해결 집요함이 부족하다는 반응이 늘어난다고 묶인다 [14:44]
  • 이 대목은 사용자 경험담과 모델 비교 인상에 가까우므로, 실제 모델 성능 차이로 단정하기보다는 영상 내 평가로 보는 것이 적절하다 [14:59]
  • Fable은 어려운 문제를 포기하지 않고 다양한 방식으로 시도하는 느낌을 줬고, 사용자는 “무엇이든 만들 수 있다”는 기대치를 경험했다고 드러난다 [15:02]
  • 발표자는 이런 경험이 사용자의 기준을 바꾸며, 이후 다른 모델을 쓸 때 단순한 답변 품질보다 끈질긴 실행력과 문제 해결 야망을 기대하게 만든다고 정리한다 [15:17]
  1. Claude Design은 캔버스 편집과 외부 배포 흐름을 강화한다
  • Claude Design은 프로젝트 전반에서 디자인 시스템을 유지하고, 캔버스 직접 편집과 Claude Code 동기화, 기존 도구 연결을 지원하는 방향으로 업데이트된다고 드러난다 [16:41]
  • 발표자는 이 기능이 Claude를 단순 대화형 모델이 아니라 디자인 작업 흐름과 연결되는 실무 도구로 확장하는 변화라고 본다 [16:56]
  • 웹 Claude에서만 동작하는 Design 기능은 캔버스 안의 문구를 직접 수정할 수 있어, 모델 출력물을 다시 프롬프트로만 고치는 방식보다 즉각적인 편집성이 커진다 [16:57]
  • 이 변화는 AI가 생성한 결과물을 다시 AI에게 설명해 수정시키는 간접 흐름에서, 사용자가 화면 위에서 바로 조정하고 모델과 동기화하는 흐름으로 이동하는 사례다 [17:12]
  1. Claude Code artifacts는 공유 가능한 미니 앱으로 팀 협업을 바꾼다
  • Claude Code는 기존 Claude 웹·데스크톱의 artifacts 흐름을 가져와, 작은 인터랙티브 페이지나 에이전트 네이티브 앱을 만들 수 있게 된다고 묶인다 [18:35]
  • 이 기능은 코드 결과물을 텍스트나 파일로만 남기는 것이 아니라, 팀원이 바로 열어 보고 상호작용할 수 있는 형태로 공유하게 만든다 [18:50]
  • 사용자 이탈 지점을 조사하는 예시에서는 Claude Code가 작은 앱 형태의 artifact를 만들고, 현재 상태와 제안안을 한 화면에서 비교할 수 있게 한다 [19:05]
  • 발표자는 이런 artifact가 분석 결과, 제품 개선안, 내부 도구를 더 시각적이고 협업 가능한 형태로 전달하는 수단이 될 수 있다고 본다 [19:20]
  1. AI 에이전트 경쟁은 Cursor·Claude·Codex·오픈소스·Google까지 확장된다
  • 발표자는 이번 주 핵심 변화로 Claude의 Design mode와 mini apps, OpenAI의 화면 녹화 기반 skill 생성, GLM 5.2의 오픈소스 모델 성과, SpaceX의 Cursor 인수 소식을 함께 묶어 정리한다 [19:52]
  • 이 결론부의 핵심은 에이전트 경쟁이 단일 챗봇 성능 경쟁을 넘어, 모델 비용, 코딩 환경, 업무 자동화, 디자인 도구, 배포 가능한 미니 앱까지 확장됐다는 점이다 [20:07]
  • Cursor는 인수 이후 더 좋아질 가능성이 크고, 월 20달러·200달러 요금제의 가치도 개선될 수 있어 Codex·Claude와의 가격 및 기능 경쟁이 강해진다고 드러난다 [20:08]
  • 마지막 논지는 앞으로 사용자가 어떤 에이전트 도구를 선택할지 판단할 때, 단순 모델 성능뿐 아니라 실제 업무 흐름 안에서 얼마나 깊게 통합되고 반복 작업을 자동화하는지가 더 중요해진다는 것이다 [20:23]
  1. 다음 주에는 Anthropic·OpenAI·오픈소스·Gemini 발표 가능성을 주목한다
  • 발표자는 Cursor·Claude·Codex뿐 아니라 오픈소스 모델까지 네 번째 축으로 묶으며, 여러 국가와 방향에서 경쟁이 커지는 상황을 긍정적으로 본다 [20:34]
  • 다음 주 예상으로 Anthropic의 Fable 복귀 가능성 또는 개인적 기대를 언급하고, OpenAI의 새 모델 루머도 함께 짚는다 [20:56]
  • 중국 기업들을 포함한 다른 회사들의 추가 오픈소스 모델 공개 가능성과 Gemini의 모델 발표 가능성도 다음 관전 포인트로 둔다 [21:08]
  1. Google은 super app을 하나로 정해야 경쟁자로 돌아올 수 있다
  • 발표자는 Gemini의 super app 관련 발표 가능성을 특히 기대하면서, Google이 아직 어떤 제품을 중심 앱으로 삼을지 정하지 못했다고 본다 [21:15]
  • Antigravity, Google AI Studio, Jules, Gemini 데스크톱 앱 등 후보가 많지만, 그래서 오히려 사용자에게 어떤 Google 도구를 쓰라고 말하기 어렵다고 지적한다 [21:46]
  • Google 모델은 현재 뒤처져 보이지만 이론적으로는 경쟁자가 될 수 있는 회사이기 때문에, 발표자는 Google이 다시 따라잡기를 바란다고 마무리한다 [22:04]
  • 발표자는 이번 주를 매우 흥미로운 한 주로 정리하고, 다음 주에는 뉴욕 스튜디오에서 촬영하겠다고 알리며 영상을 끝낸다 [22:17]

🧾 결론

  • 이 영상의 중심 메시지는 AI 에이전트 시장이 단일 모델 경쟁을 넘어, 모델 성능·가격·업무 통합·재사용 가능한 자동화 절차가 동시에 경쟁하는 단계로 이동했다는 것이다.
  • GLM 5.2는 오픈소스 모델이 프런티어 모델에 더 가까워질 수 있다는 기대를 키우며, 특히 비용과 접근성 측면에서 OpenAI·Anthropic 같은 폐쇄형 모델 제공자에게 압박을 줄 수 있는 사례로 다뤄진다.
  • Codex의 화면 녹화 기반 skill 생성은 “프롬프트로 설명하는 자동화”에서 “사람이 직접 보여준 작업을 에이전트가 절차화하는 자동화”로 넘어가는 신호로 해석할 수 있다.
  • Claude Design과 Claude Code artifacts는 AI 결과물을 텍스트 답변에 머물게 하지 않고, 캔버스 편집·외부 배포·링크 공유 가능한 앱 형태로 확장하는 방향을 보여준다.
  • 검증 필요: SpaceX의 Cursor 인수, GLM 5.2의 실제 비용·성능 비교, Fable/Mythos의 제품 복귀 여부, Google의 다음 모델 발표 가능성은 영상에서 언급된 주장과 전망이므로 별도 확인이 필요하다.

📈 투자·시사 포인트

  • 오픈소스 모델의 성능이 프런티어 모델에 근접하고 비용이 크게 낮아진다면, 폐쇄형 모델 사업자는 가격 인하, 더 빠른 모델 출시, 차별화된 제품 경험으로 대응해야 할 가능성이 커진다.
  • AI 에이전트의 가치는 모델 자체뿐 아니라 Cursor, Slack, Claude, Codex처럼 사용자가 이미 일하는 환경 안에 얼마나 자연스럽게 들어가는지에 의해 결정될 가능성이 높다.
  • record and replay 방식의 skill 생성은 반복적인 브라우저·소프트웨어 작업 자동화 시장을 넓힐 수 있으며, 향후 에이전트 도구의 핵심 경쟁력이 “업무 절차를 얼마나 쉽게 학습·재사용하느냐”로 이동할 수 있다.
  • Claude Code artifacts와 Claude Design 같은 공유형 산출물은 AI가 만든 분석, UI 초안, 의사결정 자료를 팀 단위 협업 자산으로 바꾸는 흐름을 강화한다.
  • 투자 관점에서는 모델 제공사만이 아니라 에이전트 플랫폼, IDE, 협업 도구, 모델 라우팅 서비스, 업무 자동화 계층까지 함께 봐야 하며, 단기 hype보다 실제 워크플로우 안착 여부가 중요하다.

⚠️ 불확실하거나 확인이 필요한 부분

  • GLM 5.2가 GPT 5.5보다 5~6배 저렴하고 Opus 4.8·GPT 5.5에 근접한다는 평가는 영상 내 주장과 사용 사례 중심이므로, 공식 가격표·독립 벤치마크·실사용 로그로 별도 검증이 필요하다.
  • Trello 앱 생성, 리서치 기반 랜딩페이지 생성, Notion·Slack 통합 테스트는 발표자의 “vibe check” 성격이 강해 보이며, 반복 테스트나 실패율 데이터가 제시되지는 않았다.
  • SpaceX의 Cursor 인수, Cursor가 SpaceX의 컴퓨트·자본·Twitter 유통망을 활용할 수 있다는 내용은 시장 영향이 큰 주장이라 공식 발표·신뢰 가능한 보도 확인이 필요하다.
  • 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
  • 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
  • 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

  • GLM 5.2의 공식 모델 카드, 라이선스, 컨텍스트 길이, 가격, OpenRouter 제공 조건을 확인한다.
  • Cursor에서 OpenRouter 기반 GLM 5.2를 연결해 간단한 코딩 과제 2~3개로 응답 품질·속도·비용을 비교한다.
  • GLM 5.2를 기존 GPT 5.5·Claude Opus 계열 모델과 같은 프롬프트로 테스트해 “충분히 대체 가능한 작업”과 “아직 폐쇄형 모델이 나은 작업”을 나눈다.
  • Codex record and replay를 실제 계정·민감 데이터가 없는 테스트 워크플로에서 먼저 실험하고, 녹화 기반 skill이 어디까지 안정적으로 재현되는지 기록한다.

❓ 열린 질문

  • GLM 5.2 같은 오픈 모델이 실제 업무에서 충분히 안정적이라면, 어떤 작업부터 폐쇄형 프런티어 모델 의존도를 줄일 수 있을까?
  • 화면 녹화로 만든 Codex skill은 편리하지만, 계정 전환·파일 업로드·브라우저 조작 같은 작업에서 어떤 보안 가드레일이 필수일까?
  • Cursor, Claude Code, Codex가 모두 범용 에이전트 플랫폼으로 확장된다면, 사용자는 IDE 중심·채팅 중심·업무툴 중심 중 어떤 진입점을 선택하게 될까?

관련 문서

공통 태그와 주제 흐름을 기준으로 같이 보면 좋은 문서를 이어서 제안합니다.