I asked Claude Code to make me as much money as possible

🖼️ 인포그래픽

I asked Claude Code to make me as much money as possible 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 결론

Claude Code로 “as much money as possible”을 노리려면 더 많이 만들게 하는 것보다, 아이디어 검증·작업 검증·컨텍스트 관리·병렬 실행으로 돈이 새는 지점을 먼저 막아야 한다.

📌 핵심 요점

Claude Code의 기본값은 사용자를 생산적으로 느끼게 만들 수 있지만, 실제 수익은 출력 품질과 생산 속도에 좌우되므로 무비판적으로 답변을 받아들이면 비용이 커질 수 있다.
아이디어 단계에서는 Claude가 쉽게 동의하는 성향을 줄이기 위해 반대자, 확장주의자, 제1원칙 사고자, 리서처, 고객 관점을 나눠 시장성·해자·구매 의사를 먼저 검토해야 한다.
월 9달러 LinkedIn 도구 아이디어는 그대로 만들기보다 무료 대체재, 낮은 차별성, 배포망 부재를 고려해 좁은 유료 니치와 48시간 내 지불 의사 검증으로 재구성해야 한다는 판단을 받았다.
Claude가 만든 랜딩페이지나 자동화는 완성처럼 보여도 실제 작동을 보장하지 않으므로 Playwright, 스크린샷, 버튼 클릭, 폼 제출, 엣지 케이스 테스트 같은 검증 루프가 필요하다.
긴 대화로 인한 context rot을 피하기 위해 session handoff와 clear를 활용하고, subagent와 /goal을 통해 병렬 작업과 별도 완료 평가를 결합하면 실행 산출물의 속도와 품질을 높일 수 있다.

🧩 배경과 문제 정의

이 영상은 Claude Code를 단순한 코딩 보조 도구가 아니라 “돈을 더 벌게 만드는 비즈니스 실행 파트너”로 쓰려면 무엇을 보완해야 하는지를 다룬다.
핵심 문제는 Claude Code를 쓰면 생산적으로 느껴지지만, 그 생산성이 곧바로 수익으로 연결되지는 않는다는 점이다.
Claude는 사용자의 아이디어에 쉽게 동의하고, 그럴듯한 결과물을 빠르게 내놓기 때문에 사용자가 출력 품질을 과신하기 쉽다.
아이디어 검증 없이 바로 제품을 만들면 수요 없는 MVP, 낮은 전환율, 숨은 버그, 고객 앞에서의 실패 같은 비용이 발생할 수 있다.
영상의 해결 방향은 Claude의 답변을 그대로 믿는 것이 아니라, 반대 관점·시장 검증·실행 검증·컨텍스트 관리·병렬 에이전트 구조를 강제로 넣어 의사결정과 산출물 품질을 높이는 것이다.
검증 필요: 영상에서 언급되는 AI 모델의 반박 실패 비율, GitHub Copilot 보안 취약점 연구, Anthropic 내부 실험 수치 등은 발표자가 인용한 내용이므로, 실제 의사결정에 쓰려면 원문 연구나 자료 확인이 필요하다.

🕒 시간순 섹션별 상세정리

Claude Code는 생산성보다 수익 최적화에 맞춰져 있지 않다

발표자는 Claude Code를 “비즈니스 파트너”처럼 쓰기 위해 네 가지 업그레이드를 붙였다고 설명하며, 목표는 단순히 많은 작업을 처리하는 것이 아니라 시간과 돈을 낭비하게 만드는 기본 문제를 줄이는 것이라고 드러낸다 [00:40]
일반 사용자는 Claude의 답변을 최선의 답처럼 받아들이기 쉽지만, 기본 사용 방식만으로는 출력 품질을 낮추는 오류와 맹점이 계속 남아 비용으로 이어질 수 있다고 문제를 제기한다 [00:55]

동의 편향을 깨기 위해 반대 관점과 시장 검증을 강제한다

첫 번째 문제는 Claude가 사용자의 아이디어에 쉽게 동의하는 성향이며, 사용자가 방향을 바꿔도 그 방향을 다시 긍정하는 식의 패턴이 반복된다고 보여준다 [01:53]
발표자는 AI 모델이 사용자의 프레이밍에 반박하지 못하는 비율이 약 88%로 제시됐다고 말하며, 인간의 약 60%보다 높기 때문에 의사결정 검증 도구로 그대로 쓰면 위험하다고 강조한다 [02:16]
검증 필요: 이 구간의 88%와 60% 수치는 영상 속 인용이므로, 실제 적용 전에는 해당 실험의 조건과 원문 자료를 확인할 필요가 있다 [02:31]

Roast 스킬은 아이디어를 여러 역할로 공격한 뒤 실행 여부를 판정한다

발표자는 Claude를 기본적인 동의 모드에서 빼내기 위해 “Roast” 스킬을 사용하며, 이 스킬은 아이디어와 Claude 자신의 작업을 여러 각도에서 공격하게 만들어 승인 전에 결함과 가능성을 함께 드러내는 방식이라고 보여준다 [02:58]
Roast의 역할은 치명적 결함을 찾는 반대자, 최대 upside를 찾는 확장주의자, 순수 논리로 보는 제1원칙 사고자, 시장 데이터와 경쟁 가격을 찾는 리서처, 실제 구매 의사를 판단하는 고객 관점으로 나뉜다 [03:07]

월 9달러 LinkedIn 도구 아이디어는 좁은 니치와 검증 실험으로 재구성된다

Roast를 실행하기 전 Claude는 목표 구매자, 사용자의 강점, 예산, 첫 매출까지 필요한 속도 같은 조건을 묻고, 발표자는 “유튜브 링크가 있는 누구나”, “배포망 없음”, “Claude Code로 빠르게 만들 수 있음” 같은 조건을 입력한다 [04:31]
이후 여러 하위 에이전트가 같은 아이디어를 각자 평가하고, 비교를 위해 별도의 기본 Claude 세션에도 동일한 아이디어에 대한 일반 분석을 요청한다 [05:04]

일반 Claude 분석보다 역할 기반 검토가 사업 의사결정에 더 구체적이다

Roast 기반 검토에서는 코드를 쓰기 전에 하나의 니치를 정하고 48시간 안에 20~30명에게 DM이나 이메일을 보내 실제 지불 의사가 있는지 확인하는 것이 가장 싼 검증 방법으로 제안된다 [06:18]
역할별 점수는 반대자 2점, 확장주의자 8점, 나머지 관점은 3점·2점·2점 수준으로 갈리며, 원래 아이디어를 그대로 진행하기보다 더 좁은 니치와 검증 실험으로 재구성해야 한다는 결론으로 계속된다 [06:28]

완성처럼 보이는 결과물은 검증 루프 없이는 실제 작동을 보장하지 않는다

두 번째 문제는 Claude가 만든 결과물이 완성된 것처럼 보여도 실제로 작동하는지는 별개의 문제이며, 이 간극을 방치하면 며칠 동안 수정 작업에 시간을 잃을 수 있다는 점이다 [07:51]
발표자는 NYU 연구를 예로 들며 GitHub Copilot이 생성한 프로그램 약 1,600개 중 대략 40%에 보안 취약점이 있었다고 소개하고, 이런 문제는 고객 앞 충돌이나 라이브 데모 실패 전까지 드러나지 않을 수 있다고 경고한다 [08:06]
검증 필요: 이 보안 취약점 비율은 영상에서 인용된 연구 결과이므로, 실제 근거로 활용하려면 연구 범위와 측정 기준을 원문에서 확인해야 한다 [08:21]

검증 루프가 초안 품질과 검토 비용을 결정한다

발표자는 AI가 먼저 90% 수준의 초안을 만들고, 이후 사람이 취향과 판단을 더해 반복하는 방식이 처음부터 사람이 만드는 시간을 줄인다고 보여준다 [12:06]
중간 검증과 작업 확인 루프가 들어가면 Claude가 대충 멈추지 않고, 사람이 빠르게 검토해 바로 보낼 수 있는 수준까지 결과물을 밀어붙이게 된다고 드러낸다 [12:10]

랜딩페이지 빌드 결과는 화면과 코드 양쪽에서 검증된다

데모에서는 Cadence용 단일 페이지 랜딩페이지가 8개 섹션으로 구성되고, 검증 루프가 실행되어 통과까지 끝난 상태로 드러난다 [12:51]
Playwright가 데스크톱과 모바일 화면을 각각 11장씩 캡처해, 코드가 존재하는지만 보는 것이 아니라 실제 화면에서 결과물이 어떻게 보이는지도 확인할 수 있게 한다 [13:03]

폼 제출 스트레스 테스트가 사용자 입력 리스크를 드러낸다

발표자는 빌드 검증만으로는 부족하다고 보고, Playwright CLI의 headed browser로 실제 브라우저를 열어 여러 조건의 폼 제출을 반복한다 [14:18]
드롭다운 옵션, 이메일, 전화번호, 이름을 다양하게 바꿔가며 테스트하고, 백엔드 연결 전에도 프론트엔드 입력 흐름에서 발생할 수 있는 결함을 빠르게 확인한다 [14:34]

context rot은 긴 대화에서 성능과 산출물 품질을 무너뜨린다

세 번째 문제는 좋은 검증 방식도 먼저 결과물이 나와야 의미가 있는데, Claude 작업 중 대화가 길어지면 속도·품질·사용량 한계에 부딪히기 쉽다는 점이다 [16:46]
발표자는 18개 주요 AI 모델 테스트에서 대화가 길어질수록 성능이 떨어졌고, 단순한 작업에서도 hallucination과 품질 저하가 증가했다고 보여준다 [17:06]
검증 필요: 18개 모델 테스트와 성능 저하 수치는 영상에서 인용된 내용이므로, 모델 종류와 평가 방식은 별도 확인이 필요하다 [17:21]

session handoff와 clear로 깨끗한 작업 상태를 유지한다

/context는 현재 context window를 차지하는 항목을 보여주고, /clear는 전체 대화를 지워 새 세션으로 시작하게 만드는 명령으로 묶인다 [18:14]
발표자는 /compact 대신 /session handoff를 쓰면 작업 내용, 핵심 파일, 열린 결정, 이어서 할 지점이 요약되므로, context를 지우기 전에 필요한 상태를 보존할 수 있다고 보여준다 [18:21]

subagent와 goal이 병렬 실행과 별도 평가를 결합한다

네 번째 문제는 Claude가 한 번에 한 방향으로만 움직이기 때문에, 사용자가 결정자이자 리뷰어 역할을 모두 맡으며 병목이 된다는 점이다 [21:15]
발표자는 Anthropic 내부 실험에서 lead agent가 여러 subagent를 병렬 조정하는 구조가 단일 agent보다 연구 평가에서 90% 이상 높은 성과를 냈다고 보여준다 [21:31]
검증 필요: Anthropic 내부 실험 수치와 평가 조건은 영상 속 설명만으로는 한계가 있으므로, 정확한 의미를 확인하려면 원자료가 필요하다 [21:46]

/goal과 병렬 서브 에이전트로 실행 산출물 만들기

발표자는 웹앱 제품과 ICP를 기준으로 여섯 개 산출물을 만들도록 /goal을 설정하고, 각 산출물마다 별도 서브 에이전트를 붙여 파일 충돌 없이 병렬 작업을 진행한다 [24:03]
완료 조건은 여섯 개 파일 존재, 빈 파일 없음, 시장조사 내 경쟁사 6개 이상, 개인화 초안 25개처럼 객관적 기준으로 고정되며, 목표가 구체적일수록 에이전트가 끝까지 작업할 가능성이 커진다고 보여준다 [24:21]

산출물 검토와 병목 제거형 역할 전환

완성된 파일에는 포지셔닝, 시장조사, 출시 계획, 아웃리치 템플릿, 아웃리치 초안, 콘텐츠 캘린더가 포함되며, 사람은 직접 모든 것을 만드는 단계에서 벗어나 결과물을 검토하고 실행 방향을 결정하는 역할로 이동한다 [25:34]
발표자는 전체 데모가 1시간 미만이지만, 같은 방식을 일주일 동안 집중해서 쓰면 아이디어 도출, 제품 구축, 출시 계획까지 팀 단위 작업에 가까운 범위를 Claude Code로 압축할 수 있다고 마무리한다 [25:51]

완성 산출물의 실제 내용 점검

go-to-market 폴더에서 포지셔닝 문서를 열어 ICP, 세그먼트, 핵심 제안, 가격 티어, 업그레이드 논리, 한 줄 가치 제안이 생성됐음을 확인한다 [26:16]
반론 처리에는 “LinkedIn에 충분히 게시하지 않는다”, “AI 게시물이 가짜처럼 보인다” 같은 objection과 rebuttal이 포함되어 사람이 읽고 개인적 손질을 더할 수 있다고 본다 [26:34]
시장조사 파일에는 제품, wedge, ICP, 경쟁사와 인접 경쟁사, 비교표, $19 진입 가격의 근거와 출처가 정리되어 깊이 있는 자료가 됐다고 보여준다 [26:46]
14일 출시 계획, 아웃리치, 콘텐츠 캘린더까지 이어져 실행 순서를 따라갈 수 있는 상태임을 확인한다 [27:04]

병목에서 판단자로 이동하는 최종 메시지

발표자는 sub agent, /goal, automation을 묶어 사람이 병목이 되지 않도록 해야 한다고 정리하며, 역할이 builder/producer에서 problem solver, decision maker, reviewer, judge로 바뀐다고 말한다 [27:12]
네 가지 업그레이드는 AI가 무조건 동의하지 않게 만들기, 스스로 작업을 검증하게 하기, context를 관리해 Claude를 날카롭게 유지하기, sub agent와 /goal로 병목을 제거하기로 요약된다 [27:29]
이 방식으로 Claude를 활용해 비즈니스를 키우고 수익을 만들 수 있으며, 관련 자료와 커뮤니티는 무료 school community와 plus community에서 제공된다고 안내한다 [27:44]
마지막으로 설명란 링크를 언급한 뒤, 영상이 도움이 됐다면 좋아요를 눌러 달라고 말하며 마무리한다 [28:02]

🧾 결론

이 영상의 핵심은 Claude Code를 “대답하는 도구”가 아니라 “반박하고 검증하고 실행을 나누는 비즈니스 작업 시스템”으로 다루라는 것이다.
돈을 버는 데 중요한 것은 MVP를 빨리 만드는 것 자체가 아니라, 만들기 전에 수요와 차별성을 확인하고, 만든 뒤에는 실제 사용자 흐름에서 깨지는 지점을 찾아내는 것이다.
Roast 방식처럼 여러 관점에서 아이디어를 공격하면 기본 Claude 분석보다 더 구체적인 사업 판단과 다음 행동을 얻을 수 있다.
검증 루프는 결과물을 90% 수준까지 끌어올린 뒤 사람이 취향과 판단을 더하는 구조를 만들며, 반복 수정 비용을 줄이는 데 초점이 있다.
context rot을 피하고 subagent를 병렬로 쓰면 사용자는 직접 만드는 사람에서 문제 해결자, 의사결정자, 리뷰어 역할로 이동할 수 있다.

📈 투자·시사 포인트

AI 도구 활용의 수익성은 “얼마나 빨리 만들었는가”보다 “시장 검증, 오류 검출, 배포 가능 품질까지 얼마나 체계적으로 통제했는가”에 더 크게 달려 있다.
낮은 가격의 범용 SaaS 아이디어는 무료 대체재와 낮은 생애가치 때문에 고객 획득 비용을 감당하기 어려울 수 있으므로, 좁은 ICP와 명확한 유료 니치 검증이 우선이다.
AI 기반 자동화나 랜딩페이지 제작은 초기 비용을 낮출 수 있지만, 검증 없는 자동화는 실패를 늦게 발견하게 만들어 오히려 시간과 신뢰 비용을 키울 수 있다.
subagent와 /goal처럼 병렬 실행과 객관적 완료 조건을 결합하는 방식은 1인 창업자나 소규모 팀이 리서치, 포지셔닝, 출시 계획, 아웃리치 초안을 빠르게 묶어내는 데 유리하다.
검증 필요: 영상에서 언급된 AI 모델의 반박 실패 비율, Copilot 생성 코드 취약점 비율, Anthropic 내부 실험 성과 수치는 투자 판단에 쓰기 전 원문 연구와 조건을 별도로 확인해야 한다.

⚠️ 불확실하거나 확인이 필요한 부분

AI 모델이 프레이밍에 반박하지 못하는 비율이 약 88%이고 인간은 약 60%라는 수치는 영상에서 제시되지만, 원 연구·측정 방식·대상 모델을 별도로 확인해야 한다.
NYU 연구에서 GitHub Copilot 생성 프로그램 약 1,600개 중 약 40%에 보안 취약점이 있었다는 주장도 영상 내 언급 기준이며, 연구 범위와 현재 모델에도 그대로 적용 가능한지는 검증이 필요하다.
Anthropic 내부 실험에서 lead agent와 subagent 구조가 단일 agent보다 연구 평가에서 90% 이상 높은 성과를 냈다는 내용은 영상에 나온 사례지만, 평가 조건·작업 유형·재현 가능성은 추가 확인이 필요하다.
자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

Claude Code로 제품이나 자동화를 만들기 전, 아이디어에 대해 반대자·확장주의자·제1원칙 사고자·리서처·고객 관점의 검토를 먼저 수행한다.
MVP를 바로 만들기 전에 하나의 좁은 니치를 정하고, 20~30명에게 DM이나 이메일을 보내 실제 지불 의사와 문제 강도를 확인한다.
Claude가 만든 산출물은 완료 보고만 믿지 말고, 로컬 실행·스크린샷·클릭 테스트·폼 제출 테스트처럼 산출물 유형에 맞는 검증 루프를 붙인다.
긴 대화가 이어질 때는 context 사용량을 확인하고, 일정 토큰 이상이 되기 전에 session handoff 후 clear로 새 세션에서 이어간다.

❓ 열린 질문

Roast 방식으로 나온 “reshape” 판단이 실제 매출 가능성을 얼마나 잘 예측하는지, 여러 제품 아이디어에 반복 적용했을 때도 일관된 결과가 나오는가?
좁은 유료 니치를 고를 때 “충분히 좁지만 시장이 작지 않은” 기준은 무엇이며, 몇 명의 응답이나 어떤 신호를 유효한 검증으로 볼 수 있는가?
Claude Code의 검증 루프를 랜딩페이지 외에 영상 편집, 데이터 파이프라인, 이메일 자동화, SaaS 백엔드에는 각각 어떻게 설계해야 하는가?