[한글자막] Claude Code 책임자 Boris Cherny와의 대담
Quick Summary
Claude Code는 AI가 코드를 쓰는 시대의 핵심 변화를 “코드 작성 자동화”가 아니라 개발 조직 전체의 병목 재배치로 설명한다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
Claude Code는 AI가 코드를 쓰는 시대의 핵심 변화를 “코드 작성 자동화”가 아니라 개발 조직 전체의 병목 재배치로 설명한다.
📌 핵심 요점
- Claude Code 사용이 확산되면서 개발 생산성의 기준은 “AI가 코드의 몇 %를 썼는가”에서 엔지니어 1인당 산출, 리뷰·배포·협업 병목 해소로 이동하고 있다.
- Boris Cherny는 토큰 비용 자체보다 ROI를 봐야 한다고 강조하며, 엔지니어뿐 아니라 PM·디자이너·데이터 과학자·마케팅 조직까지 AI 실험 권한을 넓히는 것이 중요하다고 본다.
- Loops는 에이전트가 단발성으로 코드를 작성하는 단계를 넘어, 코드 리뷰·피드백 반영·유지보수처럼 반복되는 업무를 계속 수행하는 구조로 확장하는 개념이다.
- Co-work는 Claude Code의 에이전트 구조를 비개발자 업무로 넓혀, 스프레드시트·Slack·브라우저·이메일·캘린더 같은 도구를 연결해 프로젝트 관리나 여행 예약 같은 반복 업무를 처리하는 방향을 보여준다.
- 코드 작성 병목이 줄어들수록 엔지니어의 역할은 직접 코딩보다 고객 이해, 아이디어 발굴, 제품 판단, 데이터 분석, 조직 정렬, 리뷰와 배포 안정성 관리로 이동한다.
🧩 배경과 문제 정의
- AI가 코드를 작성하는 비중이 빠르게 늘면서, 개발자 생산성의 기준은 단순한 코드 작성량에서 조직 전체의 병목을 얼마나 줄이는지로 이동하고 있다.
- Claude Code 같은 고성능 모델은 비용이 크지만, 기업에는 토큰 비용 자체보다 투자 대비 산출과 업무 전환 효과가 더 중요한 판단 기준이 된다.
- AI 코딩이 보편화될수록 병목은 코드 작성 자체에서 아이디어 발굴, 제품화 속도, 배포 안정성, 협업 구조로 옮겨간다.
- Loops는 단일 에이전트 활용을 넘어 반복 업무를 에이전트 루프로 구성하는 단계이며, 코드 리뷰와 피드백 반영처럼 반복적인 업무의 자동화 가능성을 높인다.
🕒 시간순 섹션별 상세정리
1. 대담의 출발점과 AI 코드 작성 확산
- Meta 개발 인프라 조직과 Claude Code 책임자가 함께한 40분 대담으로, 현장 질문과 사전 질문을 바탕으로 AI가 개발 생산성을 어떻게 바꾸고 있는지 다룬다 [00:20]
- 현장 참석자 중 AI로 코드를 작성하는 사람이 이미 상당수이며, 코드의 100%를 AI가 작성한다고 답한 사람도 이전보다 크게 늘었다 [01:02]
2. Claude Code 사용량과 개인 개발 방식의 변화
- 올해 코드 활동은 PR 1,700개, 추가 40만 줄, 삭제 25만 줄 수준이며, 3월 이후 Claude Code 사용 토큰은 80억 개로 집계된다 [01:51]
- Opus 4.5 이후 작성한 코드는 전부 Claude Code가 만들었고, 직접 손으로 코드를 쓰기보다 에이전트에 작성 과정을 맡기는 방식이 기본값이 됐다 [02:24]
3. 비용 중심이 아니라 ROI 중심으로 봐야 하는 AI 도입
- 기업의 AI 코딩 도입 관점은 비용 중심과 ROI 중심으로 갈리며, 토큰 비용만 보면 실제 생산성 효과를 제대로 판단하기 어렵다 [03:34]
- 성공적인 도입은 엔지니어에만 한정되지 않고 PM, 디자이너, 데이터 과학자까지 실험에 참여해 조직 전체에서 아이디어가 나오게 만드는 방식에 가깝다 [04:08]
4. 생산성 측정 기준의 이동과 새로운 병목
- ROI는 투자와 수익으로 나뉘며, 투자는 토큰 비용으로 비교적 쉽게 측정되지만 수익은 AI 작성 코드 비율만으로 충분히 설명되지 않는다 [05:48]
- AI 작성 코드 비율이 100%에 가까워질수록 “AI가 몇 퍼센트를 작성했는가”는 의미가 줄어들고, 엔지니어 1인당 코드 산출 속도가 더 중요한 기준이 된다 [06:01]
5. AI 코딩 이후의 조직 병목과 Loops 개념
- AI가 코딩 자체의 문제를 상당 부분 해결할수록, 실제 비즈니스 가치 전달에서는 협업, 조정, 안전한 배포, 정확한 실행 같은 상하류 병목이 더 크게 드러난다 [07:35]
- Threads가 월간 활성 사용자 5억 명에 도달한 맥락에서, 이어지는 논의는 Loops가 단순한 과대평가인지 실제 전환점인지에 초점을 맞춘다 [08:33]
6. 코드 리뷰와 피드백 반영을 반복 루프로 전환하는 흐름
- Loops는 소스 코드에서 에이전트로 넘어간 변화만큼 중요한 다음 단계로 제시되며, 아직 초기 단계지만 작동 가능성을 보여주는 신호가 나타나고 있다 [10:03]
- 코드 리뷰는 사람이 직접 하거나 에이전트에 한 번 맡길 수도 있지만, loop 방식에서는 에이전트가 모든 코드 리뷰를 반복적으로 수행하며 피드백을 반영한다 [10:27]
7. Co-work는 비개발자를 위한 Claude Code로 확장된다
- 자동화 루프의 핵심은 사람이 매 단계 개입하는 구조를 줄이고, 여러 도구를 연결해 생산성을 높이는 데 있다 [12:01]
- Co-work는 Claude 데스크톱 앱 안에서 사용할 수 있으며, Mac과 Windows에서 동작하고, 같은 앱 안에 채팅과 Claude Code도 함께 포함된다 [12:47]
8. 프로젝트 관리와 브라우저 자동화가 업무 흐름을 바꾼다
- 프로젝트 관리에서는 매일 스탠드업으로 팀원의 작업 상태를 확인하던 방식이, Co-work가 스프레드시트와 Slack을 오가며 상태를 수집하는 방식으로 바뀐다 [13:40]
- Co-work는 브라우저에서 주간 워크스트림 스프레드시트를 열고, 각 엔지니어에게 Slack으로 최신 상태를 요청한 뒤, 응답을 다시 스프레드시트에 채운다 [13:55]
9. 여행 예약 자동화는 개인 업무 대행의 범위를 넓힌다
- 초기 여행 예약 작업에서는 일정과 목적지를 주면 Co-work가 사내 여행 사이트를 브라우저로 열고 항공권 예약 양식을 채웠다 [14:52]
- 이후 예약 흐름은 매번 예약 요청을 입력하는 방식에서, 매일 이메일과 Google Calendar를 확인해 예약을 처리하는 방식으로 자동화된다 [15:12]
10. Fable은 코딩 모델 성능의 큰 도약으로 평가된다
- Fable 접근 제한은 내부적으로 오해에 가까운 상황이며, 다시 사용할 수 있도록 조정 작업이 진행 중이다 [16:41]
- 이전에는 Opus 4.5 출시 이후 모델의 코딩 성능이 크게 올라가면서, 많은 사람이 처음으로 Claude로 대부분의 코드를 작성하기 시작했다 [16:54]
11. 고성능 모델 선택의 기준은 비용보다 수익률 확대에 가까워진다
- Claude Code, Co-work, Anthropic의 여러 제품에서 Claude Code가 작성하는 코드 비중은 이미 매우 높고, Anthropic 전체 평균으로 80~90%에 이른다 [18:45]
- 일부 팀에서는 코드의 100%가 Claude Code로 작성되는 수준까지 올라갔으며, 이런 흐름은 Fable 이전 Opus 4.5 시점부터 시작됐다 [18:49]
12. 엔지니어 역할은 코딩 이후의 전체 개발 생명주기로 이동한다
- 협업 개선에는 아직 준비 중인 기능들이 있으며, 당장은 MCP로 Claude Code를 Slack, Teams, G Chat 같은 협업 도구에 연결하는 방식이 현실적인 선택지다 [21:29]
- 에이전트가 코드 대부분을 작성하더라도 엔지니어의 일은 고객 대화, 아이디어 발굴, 디자이너·PM과의 논의, 데이터 분석, 다음 빌드 대상 결정, 조직 간 정렬까지 넓게 남아 있다 [22:04]
13. 코딩 병목 해소와 엔지니어 역할 변화
- 코딩은 원래 개발 시간의 일부였고, 손으로 직접 코드를 쓰는 일은 즐겁기도 하지만 반복적이고 피로한 작업이기도 하다 [24:03]
- Claude Code는 모델 성능이 좋아질수록 개발 속도를 높이는 제트팩처럼 작동하며, 현재 병목은 코드 작성이 아니라 프롬프트 입력 속도와 좋은 아이디어 확보로 이동한다 [24:33]
14. 코드 리뷰와 보안 리뷰가 새로운 병목이 됨
- 코드가 작성된 뒤 production에 들어가고 revenue·usage 같은 비즈니스 지표로 이어지는 과정에는 여러 병목이 있으며, 기존 최대 병목이던 코딩은 Claude Code 도입 이후 상당 부분 해소된다 [25:38]
- 코드 작성량이 늘어나면서 다음 병목은 코드 리뷰가 되고, Anthropic은 내부 모든 pull request에 쓰는 Claude Code Review를 외부 고객도 사용할 수 있는 제품으로 만든다 [26:10]
15. CI 최적화와 dynamic workflow 사례
- 보안 병목 이후에는 아이디어 생성이나 CI 확장성이 다음 병목이 될 수 있으며, 느린 CI를 개선할 때는 실제 CI timing 데이터를 바탕으로 더 빠른 최적화를 요구하는 단일 프롬프트가 쓰인다 [28:15]
- Dynamic workflow는 모델이 수십·수백·수천 개의 sub-agent를 상황에 맞게 오케스트레이션하는 새 기능으로, test-time compute의 한 형태로 작동한다 [28:47]
16. Claude Code의 방향성과 장기 실행 능력
- Claude Code 팀은 1년 단위의 고정 계획보다 주간·월간 단위로 움직이며, 변화 속도가 빠른 만큼 짧은 주기의 적응을 더 중시한다 [29:59]
- 제품 방향은 가장 유능한 에이전트가 되는 것, 팀이 일하는 모든 환경에서 작동하는 것, 사용자가 별도 풀스택으로 이동하지 않아도 Claude를 쓸 수 있게 하는 데 맞춰져 있다 [30:17]
17. 유지보수 루프와 코드베이스 개선 자동화
- 대규모 프로젝트에서는 코딩 자체보다 유지보수가 더 큰 문제가 되며, Claude Code를 반복 루프로 실행해 아키텍처 개선, flaky test 제거, 불필요한 테스트 삭제, 중복 abstraction 통합을 맡길 수 있다 [32:00]
- 이 유지보수 루프는 변경마다 사전 승인을 받기보다, 에이전트가 pull request를 만든 뒤 사람이 결과를 리뷰하는 방식으로 운영된다 [32:42]
18. Test-time compute와 아직 어려운 영역
- Workflow와 loop는 구분되며, 전통적 scaling law는 데이터, 신경망 크기, 학습 compute가 모델 성능을 키우는 세 축이라는 관점에서 출발한다 [33:40]
- 최근에는 test-time compute가 네 번째 축으로 추가되며, 이는 모델이 더 많은 토큰을 생산적으로 사용해 더 나은 결과를 얻도록 하는 방식이다 [34:10]
19. 무비판적 수락 문제와 permission prompt fatigue
- 엔지니어가 Claude 출력물을 그대로 받아들이는 문제는 출력 품질 관리와 사용자의 적절한 개입이라는 두 층위로 나뉜다 [36:21]
- Claude Code는 초기부터 명령 실행, MCP 사용, 브라우저 URL 접근 같은 작업마다 승인 여부를 묻는 permission prompt를 사용해 왔다 [36:51]
20. auto mode와 장시간 에이전트 실행
- auto mode는 Claude Code의 새로운 permission mode로, 각 permission prompt를 모델에 전달해 대화 맥락에 따라 승인 여부를 판단하게 한다 [37:47]
- auto mode는 Anthropic 내부와 다수 사용자에게 쓰이고 있으며, dangerous mode나 기본 yes/no permission mode보다 보안 결과가 낫고 엔지니어의 반복 승인 부담도 줄인다 [38:05]
21. output style을 통한 학습 유지와 업무 이해
- AI가 코드를 직접 작성하는 환경에서도 엔지니어는 학습, 맥락 이해, 작업 루프 유지를 계속해야 한다 [39:24]
- 신규 엔지니어는 exploratory output style을 통해 아키텍처, 언어 특성, 코드베이스 구조를 변경 과정과 함께 이해할 수 있다 [39:38]
🧾 결론
- 이 대담의 핵심은 Claude Code가 단순한 코딩 보조 도구가 아니라, 소프트웨어 개발의 병목 구조를 바꾸는 에이전트 플랫폼으로 다뤄지고 있다는 점이다.
- AI가 코드 대부분을 작성할 수 있게 되면, 조직이 실제로 얻는 가치는 코드량 증가보다 좋은 아이디어를 더 빨리 제품화하고, 리뷰·보안·CI·배포 같은 후속 병목을 줄이는 데서 나온다.
- Loops, dynamic workflow, auto mode는 모두 사람이 매 단계 승인하고 지시하는 방식에서 벗어나, 에이전트가 더 오래·더 반복적으로·더 자율적으로 업무를 수행하게 하려는 흐름으로 연결된다.
- 다만 Fable, Opus 버전별 성능 향상, 내부 코드 작성 비율, prompt injection 성공률 등은 영상 속 발언 기준으로 정리한 내용이며, 실제 제품 상태나 외부 벤치마크는 별도 검증이 필요하다.
📈 투자·시사 포인트
- AI 코딩 도구의 경쟁력은 코드 생성 성능만이 아니라 코드 리뷰, 보안 리뷰, CI 최적화, 유지보수 자동화, 협업 도구 연동까지 포함한 개발 생명주기 전체 장악력으로 확장될 가능성이 크다.
- 기업 도입 관점에서는 “토큰 비용 절감”보다 “더 강한 모델을 써서 산출과 실행 속도를 얼마나 키우는가”가 초기 AI 전환기의 핵심 판단 기준이 될 수 있다.
- 개발 조직의 병목이 코드 작성에서 아이디어·제품 판단·리뷰·배포 안정성으로 이동하면, AI 도구 예산은 엔지니어링 부서만이 아니라 PM, 디자인, 데이터, 운영 조직까지 넓어질 수 있다.
- 에이전트 루프와 장시간 실행이 실무에 안착하면, 반복 유지보수·테스트 정리·코드베이스 개선·피드백 반영처럼 기존에는 우선순위에서 밀리던 작업이 상시 자동화 영역으로 바뀔 수 있다.
- 투자자나 기업 의사결정자는 AI 코딩 시장을 IDE 플러그인 시장으로만 보기보다, 협업·보안·브라우저 자동화·업무 대행·개발 운영 플랫폼을 포괄하는 더 큰 에이전트 인프라 시장으로 볼 필요가 있다.
⚠️ 불확실하거나 확인이 필요한 부분
- 영상에서는 Claude Code 사용 이후 엔지니어당 코드 산출이 8배 증가했다고 설명되지만, 이 수치가 어떤 기간·조직·측정 방식에 기반한 것인지는 별도로 확인이 필요하다.
- Boris Cherny 개인의 코드 활동으로 언급된 1,700개 PR, 40만 줄 추가, 25만 줄 삭제, 80억 토큰 사용량은 영상 내 발언 기준이며, 실제 저장소·기간·집계 기준은 공개 자료로 검증해야 한다.
- Claude Code, Co-work, Anthropic 내부 제품에서 코드의 80~90%가 Claude Code로 작성된다는 언급은 내부 사례로 보이며, 외부 기업이나 일반 개발 조직에 그대로 적용할 수 있는지는 불확실하다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- AI 코딩 도입 평가 지표를 “AI 작성 코드 비율”이 아니라 엔지니어당 산출, 리뷰 병목, 배포 속도, 실제 제품화 속도 중심으로 재정의한다.
- Claude Code 같은 고성능 모델 도입 시 토큰 비용만 보지 말고, 절감된 시간·늘어난 실험 수·출시 속도 개선을 함께 보는 ROI 프레임을 만든다.
- 엔지니어뿐 아니라 PM, 디자이너, 데이터 분석가, 마케팅 담당자도 안전하게 AI 도구를 실험할 수 있는 내부 사용 가이드와 비용 통제 장치를 마련한다.
- 반복적인 코드 리뷰, 피드백 반영, CI 최적화, flaky test 제거 같은 업무를 loop 또는 workflow 후보로 분류한다.
❓ 열린 질문
- AI가 코드 작성 병목을 줄인 뒤, 조직에서 가장 먼저 드러나는 병목은 코드 리뷰, 보안 리뷰, 배포, 아이디어 발굴 중 무엇인가?
- Claude Code나 유사 도구의 ROI를 측정할 때 코드 라인 수보다 더 신뢰할 만한 지표는 무엇인가?
- loops와 workflows를 실제 팀 운영에 도입할 때, 어떤 업무는 자동화하고 어떤 업무는 반드시 사람이 최종 판단해야 하는가?