OpenAI Has Some Catching Up to Do

🖼️ 인포그래픽

OpenAI Has Some Catching Up to Do 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 요약

Dan Shipper는 Claude Code와 Opus 4.5가 스타트업 개발자·창업자 사이에서 빠르게 일상 도구가 된 이유를 분석하며, OpenAI의 Codex가 성능은 뛰어나지만 ‘일하는 방식’을 장악하는 경쟁에서는 따라잡아야 할 부분이 있다고 주장한다.

📌 핵심 요약

필자는 OpenAI의 Codex 사용량 제한에 걸린 경험으로 글을 시작하며, Codex가 복잡하고 세부적인 코딩 프로젝트에 강하지만 최근 자신의 실제 작업은 대부분 Claude Code에서 이루어진다고 말한다.
스타트업 창업자들과의 저녁 모임에서 프로그래머 대부분이 Claude Code와 Opus 4.5를 일상 AI 도구로 쓴다고 답했고, 이는 한 달 전이나 1년 전과 비교해 뚜렷한 변화로 제시된다.
Anthropic은 Claude Code를 터미널 우선 도구로 내놓으며 코드 편집기 중심 접근을 우회했고, OpenAI도 Codex CLI와 Codex Web으로 비슷한 방향을 보였지만 사용자 경험에서는 Claude Code가 앞섰다고 평가된다.
OpenAI는 GPT-5 이후 코딩 전략을 ChatGPT의 바이브 코딩과 Cursor·Codex CLI의 전문 코딩으로 나누었고, 이는 숙련 엔지니어에게는 맞았지만 빠르게 위임하고 여러 에이전트를 돌리는 사용자에게는 답답하게 느껴졌다고 설명된다.
필자는 Codex와 GPT-5.2가 벤치마크와 복잡한 작업에서 강력하고 성장 지표도 좋지만, Claude Code가 더 빠르고 덜 막혀 있으며 사용자가 의도를 전달하면 동료처럼 실행하는 경험을 제공한다는 점이 전략적 위협이라고 본다.

🧩 주요 포인트

필자는 OpenAI의 Codex 사용량 제한에 걸린 경험으로 글을 시작하며, Codex가 복잡하고 세부적인 코딩 프로젝트에 강하지만 최근 자신의 실제 작업은 대부분 Claude Code에서 이루어진다고 말한다.
스타트업 창업자들과의 저녁 모임에서 프로그래머 대부분이 Claude Code와 Opus 4.5를 일상 AI 도구로 쓴다고 답했고, 이는 한 달 전이나 1년 전과 비교해 뚜렷한 변화로 제시된다.
Anthropic은 Claude Code를 터미널 우선 도구로 내놓으며 코드 편집기 중심 접근을 우회했고, OpenAI도 Codex CLI와 Codex Web으로 비슷한 방향을 보였지만 사용자 경험에서는 Claude Code가 앞섰다고 평가된다.
OpenAI는 GPT-5 이후 코딩 전략을 ChatGPT의 바이브 코딩과 Cursor·Codex CLI의 전문 코딩으로 나누었고, 이는 숙련 엔지니어에게는 맞았지만 빠르게 위임하고 여러 에이전트를 돌리는 사용자에게는 답답하게 느껴졌다고 설명된다.
필자는 Codex와 GPT-5.2가 벤치마크와 복잡한 작업에서 강력하고 성장 지표도 좋지만, Claude Code가 더 빠르고 덜 막혀 있으며 사용자가 의도를 전달하면 동료처럼 실행하는 경험을 제공한다는 점이 전략적 위협이라고 본다.

🧠 상세 정리

1. Codex 한도에서 출발한 문제 제기

글은 필자가 OpenAI의 Claude Code 경쟁 제품인 Codex의 사용량 제한에 도달했다는 경험에서 시작된다. 그는 Every 팀을 위한 에이전트 네이티브 Markdown 편집기를 만들고 있었고, 이는 복잡하고 세부 사항이 많은 프로젝트라 Codex가 잘하는 유형이라고 설명한다. 그러나 이번 주에는 예외적으로 자신의 코딩 대부분이 Claude Code에서 이루어졌다고 말한다. 이 도입부는 Codex가 무능하다는 주장이 아니라, 강력한 도구임에도 실제 일상 작업의 중심이 다른 곳으로 이동하고 있다는 관찰을 제시한다.

2. 스타트업 현장에서 감지된 Claude Code 쏠림

필자는 약 20명의 창업자를 사무실 저녁 모임에 초대해 미래의 AI에 관해 이야기했고, 그 자리에서 각자의 일상 AI 도구를 물었다. 프로그래머 중 거의 모두가 Claude Code와 Opus 4.5를 사용한다고 답했으며, Monologue의 총괄 매니저 Naveen Naidu만이 Codex를 선호하는 예외로 언급된다. 한 달 전만 해도 Codex CLI, Cursor의 GPT 5.1, Claude Code, Droid 등이 나뉘어 쓰였고, 1년 전에는 거의 모두 GPT 모델을 사용했을 것이라고 비교한다. 이 변화는 좁은 표본이지만, 초기 ChatGPT에 열광했던 바로 그 사용자층에서 나타난 흐름이라는 점에서 의미가 있다고 본다.

3. Claude Code의 부상은 마케팅보다 제품 방향의 결과

필자는 Claude Code와 Opus가 스타트업圈에서 갑자기 부상한 이유가 더 나은 마케팅 때문은 아니라고 말한다. Anthropic이 ‘thinking’ 캡 같은 상징적 요소를 갖고 있기는 하지만, 중요한 모델 출시 때 흔히 볼 수 있는 대대적인 라이브스트림식 홍보에 비하면 Opus 4.5 출시는 조용한 편이었다고 설명한다. 핵심은 Anthropic이 누구를 위해 제품을 만들었고, 그 선택이 기술 산업의 방향을 어떻게 바꾸고 있는지에 있다고 본다. 즉 Claude Code의 성공은 성능 홍보보다 실제 작업 방식에 맞춘 설계에서 나온 것으로 해석된다.

4. 터미널 우선 접근과 코드 편집기 우회의 의미

Anthropic은 2025년 2월 말 Sonnet 3.7과 함께 Claude Code를 공개하면서 대담한 선택을 했다. 당시 많은 코드 편집기는 사이드바 안에 AI 에이전트를 집어넣는 방식에 머물러 있었지만, Claude Code는 터미널 우선으로 접근하며 코드 편집기 자체를 우회했다. 필자는 이것이 ‘코드가 덜 중요해지는 세계로 간다’는 신호처럼 보였다고 회상한다. 처음에는 새 프로젝트를 바이브 코딩으로 빠르게 만드는 데는 뛰어났지만, 큰 코드베이스를 혼자 다루기에는 충분하지 않다고 봤다. 그럼에도 그 방향성과 가능성은 인상적이었다고 평가한다.

5. OpenAI의 대응과 전략 분리

OpenAI는 두 달 뒤 Codex CLI를 출시했고, 이어 ChatGPT 안에서 실행되는 클라우드 기반 에이전트 Codex Web도 내놓았다. 두 제품 모두 코드 편집기 중심 접근에서 벗어나려 했지만, 필자에 따르면 Claude Code만큼 잘 작동하지는 않았다. Codex CLI는 OpenAI의 가장 강력한 모델에 접근하지 못했고, Codex Web은 실제 사용자의 컴퓨터가 아니라 가상 머신 안에서 실행되는 샌드박스 환경이었다. 이후 GPT-5 출시 때 OpenAI는 바이브 코딩은 ChatGPT에, 전문 코딩은 Cursor나 Codex CLI에 두는 식으로 전략을 나누었고, 후자는 완전 위임 도구라기보다 지시를 잘 따르는 페어 프로그래머에 가까웠다고 설명된다.

6. 숙련 엔지니어에게 맞춘 설계의 장점과 한계

필자는 OpenAI의 결정이 전략적으로는 이해 가능하다고 말한다. 숙련된 소프트웨어 엔지니어들은 코드를 직접 읽고, 에이전트가 컴퓨터를 망치지 않을 것이라는 확신을 원하기 때문이다. OpenAI는 그런 고객을 위해 영리하고 샌드박스화되어 있으며 지시를 정확히 따르는 에이전트를 만들고 있었다. 하지만 ChatGPT는 자신들에게 너무 약하고, Codex는 너무 강력하지만 느리고 권한 확인이 많다고 느끼는 사용자에게는 이 방향이 빗나간 것처럼 보였다고 한다. 필자는 여름 동안 프로그래밍이라는 활동이 근본적으로 바뀌었고, Claude Code에서 여러 에이전트를 동시에 돌리는 방식에 익숙한 사람에게 GPT-5는 후퇴처럼 느껴졌다고 인용한다.

7. Opus 4.5의 사용자 경험과 Codex의 성능

필자는 Opus 4.5를 빠르고 감정적으로 지능적이며, 세부 사항에는 약간 느슨하지만 사용자가 무엇을 하려는지 잘 이해하는 모델로 묘사한다. 11월 테스트에서 Cora의 총괄 매니저 Kieran Klaassen은 6시간 동안 11개의 병렬 코딩 프로젝트를 진행했고, 어느 것도 탈선하지 않았다고 한다. 그는 이를 사용자가 무엇을 만들려는지 이해하고 그에 맞춰 실행하는 매우 유능한 동료에 비유했다. 반면 GPT-5.2가 들어간 Codex와 ChatGPT 역시 강력하며, 벤치마크에서 높은 성과를 보이고 복잡한 작업에 매우 자율적이며 일부 숙련 엔지니어에게 선호된다고 인정한다. 다만 필자는 코드 품질의 작은 우위보다 실제 사용 경험의 차이가 더 중요해지고 있다고 본다.

8. Codex의 성장에도 남는 전략적 위협

OpenAI 관점에서 Codex의 지표는 좋아 보일 수 있다. 필자는 Codex가 공개적으로 제공된 10월에 이미 8월 대비 10배 성장했다고 발표했고, OpenAI가 자신에게 현재는 20배라고 확인했다고 전한다. OpenAI는 기업 엔지니어링 팀과 전문 개발자라는 가치 높은 고객을 겨냥하고 있으며, 이 시장 자체는 분명 중요하다. 그러나 필자는 세 가지 문제를 제기한다. 첫째, OpenAI가 겨냥하는 숙련 엔지니어 시장은 앞으로도 존재하겠지만 점점 코드를 읽는 사람이 아니라 에이전트를 조율하는 사람으로 바뀔 수 있다. 둘째, 오늘 가볍게 앱을 바이브 코딩하는 창업자들이 1~2년 뒤에는 실제 비즈니스용 소프트웨어를 만들게 될 가능성이 있다.

9. 바이브 코딩을 이기는 쪽이 컴퓨터 사용 방식을 장악한다

필자가 가장 중요하게 보는 위협은 바이브 코딩을 이기는 쪽이 컴퓨터에서 일하는 방식 전체를 장악한다는 점이다. Anthropic은 사용자의 컴퓨터 위에 앉아 무엇이든 만들 수 있는 AI가 있으면, 코딩뿐 아니라 스프레드시트 작성, 문서 편집 같은 다른 작업에도 유용하다는 사실을 발견했다고 설명된다. 그래서 Claude Code가 비기술 작업에도 널리 쓰이고, Cowork 같은 제품 출시로 이어졌다고 본다. Opus는 서버 사이드 코딩에서 카피라이팅, 성장 성과 분석, 웹 리서치로 자연스럽게 넘어갈 수 있지만, 필자는 GPT 5.2 Codex에 그런 일을 맡기는 장면은 상상하기 어렵다고 말한다. 이유는 너무 느리고, 너무 많이 막히며, 지나치게 엔지니어용 도구처럼 느껴지기 때문이다.

10. OpenAI가 졌다는 말이 아니라 따라잡을 부분이 있다는 결론

필자는 OpenAI가 패배했다거나 Codex 팀이 진전하지 못하고 있다고 주장하는 것은 아니라고 선을 긋는다. 오히려 현재의 대규모 언어 모델 물결이 가능했던 것은 OpenAI가 시작했기 때문이라고 인정한다. 역사적으로 OpenAI는 거의 모든 차원에서 경쟁자들보다 앞서 있었고, Codex 역시 강력한 제품이며 성장 중이다. 그러나 이 글의 핵심 결론은 적어도 이 특정 영역, 즉 사용자의 일상 작업 흐름과 바이브 코딩 경험을 장악하는 경쟁에서는 OpenAI가 따라잡아야 할 부분이 있다는 것이다. 성능과 벤치마크만으로는 충분하지 않고, 사용자가 실제로 어떤 방식으로 일을 맡기고 확장하는지가 더 큰 변수가 되고 있다는 주장이다.

🧾 핵심 주장 / 시사점

AI 코딩 도구 경쟁은 단순한 코드 품질이나 벤치마크 경쟁에서, 사용자가 얼마나 자연스럽게 일을 위임하고 여러 작업을 병렬로 굴릴 수 있는지의 경쟁으로 이동하고 있다.
전문 엔지니어를 위한 안전하고 정확한 도구와, 창업자·초기 사용자들이 빠르게 결과물을 만드는 느슨하지만 유연한 도구 사이의 제품 철학 차이가 시장 흐름을 가를 수 있다.
Claude Code의 강점은 코딩 도구에 머무르지 않고 사용자의 컴퓨터 작업 전반으로 확장될 수 있다는 점이며, 이 때문에 바이브 코딩의 승자는 더 넓은 생산성 플랫폼의 주도권을 잡을 가능성이 있다.

✅ 액션 아이템

AI 코딩 도구 평가 기준을 벤치마크 성능뿐 아니라 속도, 사용량 제한, 위임 흐름, 여러 에이전트 병렬 실행 경험까지 포함해 재정리한다.
팀의 실제 개발 업무를 복잡한 세부 코딩 작업과 빠른 위임형 작업으로 나누고, Codex와 Claude Code가 각각 더 적합한 구간을 비교해본다.
터미널 우선 코딩 도구가 기존 편집기 중심 워크플로를 어떻게 우회하는지 관찰하고, 내부 개발 환경에 적용 가능한 사용 패턴을 정리한다.

❓ 열린 질문

Claude Code가 스타트업 개발자와 창업자 사이에서 빠르게 일상 도구가 된 핵심 이유는 모델 성능보다 사용 경험과 작업 흐름에 더 가까운가?
Codex가 복잡한 코딩 프로젝트에서 강점을 보이면서도 빠른 위임형 작업에서 답답하게 느껴지는 병목은 사용량 제한, 인터페이스, 전략 분리 중 어디에 있는가?
OpenAI가 ChatGPT의 바이브 코딩과 전문 코딩 도구 전략을 나눈 접근은 숙련 엔지니어와 에이전트 병렬 사용자 모두를 만족시킬 수 있을까?