AI Agents Just Changed Forever: GLM 5.2, Codex Skills, Claude & Cursor

🖼️ 인포그래픽

AI Agents Just Changed Forever: GLM 5.2, Codex Skills, Claude & Cursor 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 결론

AI Agents 경쟁은 GLM 5.2의 저비용 오픈소스 압박, Codex Skills의 화면 녹화 자동화, Claude와 Cursor의 업무 흐름 통합으로 한 단계 더 넓어졌다.

📌 핵심 요점

GLM 5.2는 영상에서 Opus 4.8·GPT 5.5에 근접한 성능 후보이자 훨씬 낮은 비용의 오픈소스 모델로 소개되며, 폐쇄형 프런티어 모델 의존도를 낮출 수 있는 선택지로 부각된다.
Cursor에서는 OpenRouter를 통해 GLM 5.2를 붙여 쓸 수 있고, 여러 모델 API를 하나의 경로로 연결해 코딩 에이전트 환경 안에서 모델 선택권을 넓히는 흐름이 강조된다.
Codex의 record and replay는 사람이 브라우저에서 수행한 UI 작업을 녹화한 뒤 재사용 가능한 skill로 바꾸는 방식으로, 에이전트가 “보여준 업무 절차”를 따라 하게 만드는 변화로 제시된다.
Slack 기반 Hyperagent, Claude Design, Claude Code artifacts는 에이전트가 별도 도구가 아니라 팀 채널, 디자인 캔버스, 공유 가능한 미니 앱 안으로 들어오는 흐름을 보여준다.
Cursor, Claude, Codex, 오픈소스 모델, Google까지 경쟁 축이 늘어나면서 사용자는 더 많은 선택지를 얻지만, 각 제품의 실제 성능·비용·지속 가능성은 계속 검증해야 한다.

🧩 배경과 문제 정의

이 영상은 AI 에이전트 생태계가 오픈소스 모델, 코딩 에이전트, 업무용 자동화 도구, 협업용 AI 앱까지 동시에 확장되는 흐름을 다룬다.
핵심 문제의식은 “AI 에이전트가 별도 챗봇이나 실험용 도구에 머무르지 않고, Cursor·Slack·Codex·Claude 같은 실제 작업 환경 안으로 들어오고 있다”는 점이다.
GLM 5.2는 낮은 비용과 프런티어급 모델에 근접했다는 평가를 앞세워, GPT 5.5·Opus 4.8 같은 폐쇄형 모델 중심 구도에 압박을 주는 사례로 제시된다.
오픈 모델의 장점은 단순히 가격이 낮다는 데 그치지 않고, 사용자가 모델 가중치와 실행 환경을 더 직접 통제할 수 있어 특정 폐쇄형 서비스 접근권에만 의존하는 위험을 줄인다는 데 있다.
Codex의 화면 녹화 기반 skill 생성은 사람이 브라우저에서 수행한 UI 작업을 에이전트가 재사용 가능한 절차로 바꾸는 흐름을 보여준다.
Slack 기반 Hyperagent, Claude Design, Claude Code artifacts는 에이전트가 팀 업무·디자인·분석·공유 가능한 미니 앱 제작까지 확장되는 방향을 보여준다.
검증이 필요한 내용으로는 SpaceX의 Cursor 인수 소식, Fable/Mythos 관련 모델 명칭과 출시 가능 시점, GLM 5.2의 실제 성능·비용 비교 수치가 있다. 영상 내 주장으로는 정리할 수 있지만, 외부 사실로 단정하려면 별도 확인이 필요하다.

🕒 시간순 섹션별 상세정리

GLM 5.2가 오픈소스 에이전트 모델 경쟁의 핵심으로 등장

Z.ai의 GLM 5.2는 중국 기반 회사가 공개한 오픈소스 모델로 소개되며, GPT 5.5보다 5~6배 저렴할 수 있고 Opus 4.8·GPT 5.5에 가까운 성능 후보로 거론된다 [00:40]
발표자는 매일 쓰는 폐쇄형 모델에만 의존하면 접근권이나 정책 변화에 취약할 수 있다고 보고, 가중치를 다운로드할 수 있는 오픈 모델이 이 리스크를 줄인다고 보여준다 [01:11]
GLM 5.2 같은 오픈 모델의 등장은 OpenAI와 Anthropic 같은 프런티어 랩에도 더 강력한 모델과 더 나은 가격 경쟁을 요구하는 압력으로 작용한다 [01:26]

벤치마크와 실제 사용 테스트에서 기대 이상의 결과가 나온 GLM 5.2

공개 벤치마크상 GLM 5.2는 Opus와 GPT 5.5에 비교 가능한 위치로 제시되며, 단순히 그래프와 hype만 앞세운 기존 오픈 모델 사례와 다를 수 있다는 기대가 나온다 [01:41]
발표자는 벤치마크만으로는 모델의 실제 유용성을 판단하기 어렵다고 전제하면서도, 이번 모델은 실사용 테스트에서 기대보다 좋은 인상을 줬다고 평가한다 [02:07]
실제 사용 후 GLM 5.2는 “vibe check”를 통과한 모델로 언급되며, Opus 4.8과 GPT 5.5 같은 프런티어 모델에 더 가까워지고 있다는 판단이 드러난다 [02:22]

Cursor에서 OpenRouter로 GLM 5.2를 직접 붙이는 절차

Cursor 안에서 GLM 5.2를 사용하기 위해 OpenRouter를 활용하면, 여러 모델별 API 키를 따로 관리하지 않고 하나의 키로 GPT 5.5, Claude Opus, DeepSeek V4, GLM 5.2 등에 접근할 수 있다고 보여준다 [03:35]
OpenRouter는 다양한 모델을 하나의 라우팅 계층으로 연결해 주는 방식으로 소개되며, Cursor 사용자 입장에서는 모델 선택지를 넓히는 실용적 방법으로 드러난다 [03:50]
Cursor 설정의 Models와 API keys 영역에서 자체 API 키 사용을 켜고 OpenAI base URL을 OpenRouter 주소로 바꾸면, OpenAI 키 입력란을 OpenRouter API 키 입력 방식으로 전환할 수 있다 [04:13]
이 절차를 통해 Cursor 내부에서 GLM 5.2를 포함한 여러 모델을 테스트하고, 폐쇄형 모델과 오픈 모델을 같은 작업 흐름 안에서 비교할 수 있게 된다 [04:28]

오픈소스 모델의 Fable급 도달 가능성과 비용 경쟁 압력

Z.AI 창업자는 GLM 5.2 이후 Fable급 오픈소스 모델이 올해 안에 가능하다는 취지의 반응을 보였고, 발표자는 이것이 Elon Musk가 예상한 Q1보다 빠른 일정 가능성을 시사한다고 해석한다 [06:09]
이 부분은 영상 내 주장으로는 중요한 전망이지만, Fable이라는 모델명과 실제 출시 일정은 외부 확인이 필요한 내용으로 분리해서 봐야 한다 [06:24]
약 5개월 안에 Fable보다 나을 수 있는 오픈소스 모델이 등장할 가능성이 생기면, 성능뿐 아니라 비용 측면에서도 폐쇄형 프런티어 모델에 큰 압박이 발생한다는 논지가 계속된다 [06:46]

Slack 안에서 팀 업무 에이전트를 운영하는 Hyperagent 사례

발표자는 팀 마케팅 업무처럼 반복적이고 협업이 필요한 작업에서는 Slack 안에서 바로 움직이는 클라우드 기반 에이전트가 특히 유용하다고 보여준다 [06:55]
Hyperagent는 에이전트를 팀 채널에 붙이고, 일정 실행, 외부 통합 사용, 알림 발송까지 처리할 수 있는 사례로 묶인다 [07:10]
YouTube researcher 에이전트는 경쟁자 채널을 스캔하고 성과가 좋은 영상을 추적하며, 특정 niche에서 잘 작동하는 키워드와 토픽을 바탕으로 새 영상 아이디어를 제안한다 [07:22]
이 예시는 에이전트가 별도 도구가 아니라 팀의 기존 커뮤니케이션 공간 안에서 작동할 때 업무 자동화의 체감 가치가 커진다는 점을 보여준다 [07:37]

Codex의 record and replay가 화면 작업을 재사용 가능한 skill로 전환

Codex의 record and replay 플러그인은 화면 녹화를 켜고 사람이 Typefully draft 생성 절차를 직접 보여주면, 그 과정을 바탕으로 manual tweet draft 같은 skill을 만들 수 있다고 드러난다 [08:19]
이 기능의 핵심은 사람이 브라우저에서 수행하는 클릭, 입력, 이동, 업로드 같은 UI 작업을 에이전트가 이후 반복 실행할 수 있는 절차로 변환한다는 점이다 [08:34]
녹화 중에는 Comet에서 Typefully로 이동하고 계정을 전환한 뒤 텍스트 초안 작성, 이미지 업로드, PNG 선택까지 실제 브라우저 작업 흐름이 캡처된다 [09:14]
발표자는 이 흐름을 통해 에이전트가 API 기반 자동화만이 아니라 사람이 쓰는 웹 인터페이스 자체를 보고 따라 하는 방향으로 확장된다고 본다 [09:29]

Cursor는 SpaceX 자본·컴퓨트·유통망을 얻으며 Codex와 Claude를 추격한다

SpaceX의 Cursor 인수 소식은 단순한 M&A가 아니라 에이전트 코딩 플랫폼 경쟁에 직접적인 영향을 주는 사건으로 드러난다 [12:16]
이 인수 소식은 외부 검증이 필요한 내용이지만, 영상의 논지 안에서는 Cursor가 Codex와 Claude Code의 격차를 줄일 가능성을 키우는 변수로 다뤄진다 [12:31]
Cursor는 SpaceX를 통해 막대한 컴퓨트와 자본을 확보하고, Twitter 유통망까지 활용할 수 있어 모델 학습과 사용자 확산 양쪽에서 유리해질 수 있다고 드러난다 [12:55]
발표자는 이런 조건이 Cursor의 제품 개선 속도와 시장 확산을 동시에 밀어 올릴 수 있으며, 에이전트 코딩 도구 경쟁을 더 빠르게 만들 수 있다고 본다 [13:10]

Fable/Mythos 부재는 Claude 사용자 기대치를 낮추고 모델 야망의 기준을 바꾼다

Claude 사용자들 사이에서는 Fable 사용 후 Opus로 돌아갔을 때 작업 추진력과 문제 해결 집요함이 부족하다는 반응이 늘어난다고 묶인다 [14:44]
이 대목은 사용자 경험담과 모델 비교 인상에 가까우므로, 실제 모델 성능 차이로 단정하기보다는 영상 내 평가로 보는 것이 적절하다 [14:59]
Fable은 어려운 문제를 포기하지 않고 다양한 방식으로 시도하는 느낌을 줬고, 사용자는 “무엇이든 만들 수 있다”는 기대치를 경험했다고 드러난다 [15:02]
발표자는 이런 경험이 사용자의 기준을 바꾸며, 이후 다른 모델을 쓸 때 단순한 답변 품질보다 끈질긴 실행력과 문제 해결 야망을 기대하게 만든다고 정리한다 [15:17]

Claude Design은 캔버스 편집과 외부 배포 흐름을 강화한다

Claude Design은 프로젝트 전반에서 디자인 시스템을 유지하고, 캔버스 직접 편집과 Claude Code 동기화, 기존 도구 연결을 지원하는 방향으로 업데이트된다고 드러난다 [16:41]
발표자는 이 기능이 Claude를 단순 대화형 모델이 아니라 디자인 작업 흐름과 연결되는 실무 도구로 확장하는 변화라고 본다 [16:56]
웹 Claude에서만 동작하는 Design 기능은 캔버스 안의 문구를 직접 수정할 수 있어, 모델 출력물을 다시 프롬프트로만 고치는 방식보다 즉각적인 편집성이 커진다 [16:57]
이 변화는 AI가 생성한 결과물을 다시 AI에게 설명해 수정시키는 간접 흐름에서, 사용자가 화면 위에서 바로 조정하고 모델과 동기화하는 흐름으로 이동하는 사례다 [17:12]

Claude Code artifacts는 공유 가능한 미니 앱으로 팀 협업을 바꾼다

Claude Code는 기존 Claude 웹·데스크톱의 artifacts 흐름을 가져와, 작은 인터랙티브 페이지나 에이전트 네이티브 앱을 만들 수 있게 된다고 묶인다 [18:35]
이 기능은 코드 결과물을 텍스트나 파일로만 남기는 것이 아니라, 팀원이 바로 열어 보고 상호작용할 수 있는 형태로 공유하게 만든다 [18:50]
사용자 이탈 지점을 조사하는 예시에서는 Claude Code가 작은 앱 형태의 artifact를 만들고, 현재 상태와 제안안을 한 화면에서 비교할 수 있게 한다 [19:05]
발표자는 이런 artifact가 분석 결과, 제품 개선안, 내부 도구를 더 시각적이고 협업 가능한 형태로 전달하는 수단이 될 수 있다고 본다 [19:20]

AI 에이전트 경쟁은 Cursor·Claude·Codex·오픈소스·Google까지 확장된다

발표자는 이번 주 핵심 변화로 Claude의 Design mode와 mini apps, OpenAI의 화면 녹화 기반 skill 생성, GLM 5.2의 오픈소스 모델 성과, SpaceX의 Cursor 인수 소식을 함께 묶어 정리한다 [19:52]
이 결론부의 핵심은 에이전트 경쟁이 단일 챗봇 성능 경쟁을 넘어, 모델 비용, 코딩 환경, 업무 자동화, 디자인 도구, 배포 가능한 미니 앱까지 확장됐다는 점이다 [20:07]
Cursor는 인수 이후 더 좋아질 가능성이 크고, 월 20달러·200달러 요금제의 가치도 개선될 수 있어 Codex·Claude와의 가격 및 기능 경쟁이 강해진다고 드러난다 [20:08]
마지막 논지는 앞으로 사용자가 어떤 에이전트 도구를 선택할지 판단할 때, 단순 모델 성능뿐 아니라 실제 업무 흐름 안에서 얼마나 깊게 통합되고 반복 작업을 자동화하는지가 더 중요해진다는 것이다 [20:23]

다음 주에는 Anthropic·OpenAI·오픈소스·Gemini 발표 가능성을 주목한다

발표자는 Cursor·Claude·Codex뿐 아니라 오픈소스 모델까지 네 번째 축으로 묶으며, 여러 국가와 방향에서 경쟁이 커지는 상황을 긍정적으로 본다 [20:34]
다음 주 예상으로 Anthropic의 Fable 복귀 가능성 또는 개인적 기대를 언급하고, OpenAI의 새 모델 루머도 함께 짚는다 [20:56]
중국 기업들을 포함한 다른 회사들의 추가 오픈소스 모델 공개 가능성과 Gemini의 모델 발표 가능성도 다음 관전 포인트로 둔다 [21:08]

Google은 super app을 하나로 정해야 경쟁자로 돌아올 수 있다

발표자는 Gemini의 super app 관련 발표 가능성을 특히 기대하면서, Google이 아직 어떤 제품을 중심 앱으로 삼을지 정하지 못했다고 본다 [21:15]
Antigravity, Google AI Studio, Jules, Gemini 데스크톱 앱 등 후보가 많지만, 그래서 오히려 사용자에게 어떤 Google 도구를 쓰라고 말하기 어렵다고 지적한다 [21:46]
Google 모델은 현재 뒤처져 보이지만 이론적으로는 경쟁자가 될 수 있는 회사이기 때문에, 발표자는 Google이 다시 따라잡기를 바란다고 마무리한다 [22:04]
발표자는 이번 주를 매우 흥미로운 한 주로 정리하고, 다음 주에는 뉴욕 스튜디오에서 촬영하겠다고 알리며 영상을 끝낸다 [22:17]

🧾 결론

이 영상의 중심 메시지는 AI 에이전트 시장이 단일 모델 경쟁을 넘어, 모델 성능·가격·업무 통합·재사용 가능한 자동화 절차가 동시에 경쟁하는 단계로 이동했다는 것이다.
GLM 5.2는 오픈소스 모델이 프런티어 모델에 더 가까워질 수 있다는 기대를 키우며, 특히 비용과 접근성 측면에서 OpenAI·Anthropic 같은 폐쇄형 모델 제공자에게 압박을 줄 수 있는 사례로 다뤄진다.
Codex의 화면 녹화 기반 skill 생성은 “프롬프트로 설명하는 자동화”에서 “사람이 직접 보여준 작업을 에이전트가 절차화하는 자동화”로 넘어가는 신호로 해석할 수 있다.
Claude Design과 Claude Code artifacts는 AI 결과물을 텍스트 답변에 머물게 하지 않고, 캔버스 편집·외부 배포·링크 공유 가능한 앱 형태로 확장하는 방향을 보여준다.
검증 필요: SpaceX의 Cursor 인수, GLM 5.2의 실제 비용·성능 비교, Fable/Mythos의 제품 복귀 여부, Google의 다음 모델 발표 가능성은 영상에서 언급된 주장과 전망이므로 별도 확인이 필요하다.

📈 투자·시사 포인트

오픈소스 모델의 성능이 프런티어 모델에 근접하고 비용이 크게 낮아진다면, 폐쇄형 모델 사업자는 가격 인하, 더 빠른 모델 출시, 차별화된 제품 경험으로 대응해야 할 가능성이 커진다.
AI 에이전트의 가치는 모델 자체뿐 아니라 Cursor, Slack, Claude, Codex처럼 사용자가 이미 일하는 환경 안에 얼마나 자연스럽게 들어가는지에 의해 결정될 가능성이 높다.
record and replay 방식의 skill 생성은 반복적인 브라우저·소프트웨어 작업 자동화 시장을 넓힐 수 있으며, 향후 에이전트 도구의 핵심 경쟁력이 “업무 절차를 얼마나 쉽게 학습·재사용하느냐”로 이동할 수 있다.
Claude Code artifacts와 Claude Design 같은 공유형 산출물은 AI가 만든 분석, UI 초안, 의사결정 자료를 팀 단위 협업 자산으로 바꾸는 흐름을 강화한다.
투자 관점에서는 모델 제공사만이 아니라 에이전트 플랫폼, IDE, 협업 도구, 모델 라우팅 서비스, 업무 자동화 계층까지 함께 봐야 하며, 단기 hype보다 실제 워크플로우 안착 여부가 중요하다.

⚠️ 불확실하거나 확인이 필요한 부분

GLM 5.2가 GPT 5.5보다 5~6배 저렴하고 Opus 4.8·GPT 5.5에 근접한다는 평가는 영상 내 주장과 사용 사례 중심이므로, 공식 가격표·독립 벤치마크·실사용 로그로 별도 검증이 필요하다.
Trello 앱 생성, 리서치 기반 랜딩페이지 생성, Notion·Slack 통합 테스트는 발표자의 “vibe check” 성격이 강해 보이며, 반복 테스트나 실패율 데이터가 제시되지는 않았다.
SpaceX의 Cursor 인수, Cursor가 SpaceX의 컴퓨트·자본·Twitter 유통망을 활용할 수 있다는 내용은 시장 영향이 큰 주장이라 공식 발표·신뢰 가능한 보도 확인이 필요하다.
자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

GLM 5.2의 공식 모델 카드, 라이선스, 컨텍스트 길이, 가격, OpenRouter 제공 조건을 확인한다.
Cursor에서 OpenRouter 기반 GLM 5.2를 연결해 간단한 코딩 과제 2~3개로 응답 품질·속도·비용을 비교한다.
GLM 5.2를 기존 GPT 5.5·Claude Opus 계열 모델과 같은 프롬프트로 테스트해 “충분히 대체 가능한 작업”과 “아직 폐쇄형 모델이 나은 작업”을 나눈다.
Codex record and replay를 실제 계정·민감 데이터가 없는 테스트 워크플로에서 먼저 실험하고, 녹화 기반 skill이 어디까지 안정적으로 재현되는지 기록한다.

❓ 열린 질문

GLM 5.2 같은 오픈 모델이 실제 업무에서 충분히 안정적이라면, 어떤 작업부터 폐쇄형 프런티어 모델 의존도를 줄일 수 있을까?
화면 녹화로 만든 Codex skill은 편리하지만, 계정 전환·파일 업로드·브라우저 조작 같은 작업에서 어떤 보안 가드레일이 필수일까?
Cursor, Claude Code, Codex가 모두 범용 에이전트 플랫폼으로 확장된다면, 사용자는 IDE 중심·채팅 중심·업무툴 중심 중 어떤 진입점을 선택하게 될까?