I asked Claude Code to make me as much money as possible
Quick Summary
Claude Code로 “as much money as possible”을 노리려면 더 많이 만들게 하는 것보다, 아이디어 검증·작업 검증·컨텍스트 관리·병렬 실행으로 돈이 새는 지점을 먼저 막아야 한다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
Claude Code로 “as much money as possible”을 노리려면 더 많이 만들게 하는 것보다, 아이디어 검증·작업 검증·컨텍스트 관리·병렬 실행으로 돈이 새는 지점을 먼저 막아야 한다.
📌 핵심 요점
- Claude Code의 기본값은 사용자를 생산적으로 느끼게 만들 수 있지만, 실제 수익은 출력 품질과 생산 속도에 좌우되므로 무비판적으로 답변을 받아들이면 비용이 커질 수 있다.
- 아이디어 단계에서는 Claude가 쉽게 동의하는 성향을 줄이기 위해 반대자, 확장주의자, 제1원칙 사고자, 리서처, 고객 관점을 나눠 시장성·해자·구매 의사를 먼저 검토해야 한다.
- 월 9달러 LinkedIn 도구 아이디어는 그대로 만들기보다 무료 대체재, 낮은 차별성, 배포망 부재를 고려해 좁은 유료 니치와 48시간 내 지불 의사 검증으로 재구성해야 한다는 판단을 받았다.
- Claude가 만든 랜딩페이지나 자동화는 완성처럼 보여도 실제 작동을 보장하지 않으므로 Playwright, 스크린샷, 버튼 클릭, 폼 제출, 엣지 케이스 테스트 같은 검증 루프가 필요하다.
- 긴 대화로 인한 context rot을 피하기 위해 session handoff와 clear를 활용하고, subagent와
/goal을 통해 병렬 작업과 별도 완료 평가를 결합하면 실행 산출물의 속도와 품질을 높일 수 있다.
🧩 배경과 문제 정의
- 이 영상은 Claude Code를 단순한 코딩 보조 도구가 아니라 “돈을 더 벌게 만드는 비즈니스 실행 파트너”로 쓰려면 무엇을 보완해야 하는지를 다룬다.
- 핵심 문제는 Claude Code를 쓰면 생산적으로 느껴지지만, 그 생산성이 곧바로 수익으로 연결되지는 않는다는 점이다.
- Claude는 사용자의 아이디어에 쉽게 동의하고, 그럴듯한 결과물을 빠르게 내놓기 때문에 사용자가 출력 품질을 과신하기 쉽다.
- 아이디어 검증 없이 바로 제품을 만들면 수요 없는 MVP, 낮은 전환율, 숨은 버그, 고객 앞에서의 실패 같은 비용이 발생할 수 있다.
- 영상의 해결 방향은 Claude의 답변을 그대로 믿는 것이 아니라, 반대 관점·시장 검증·실행 검증·컨텍스트 관리·병렬 에이전트 구조를 강제로 넣어 의사결정과 산출물 품질을 높이는 것이다.
- 검증 필요: 영상에서 언급되는 AI 모델의 반박 실패 비율, GitHub Copilot 보안 취약점 연구, Anthropic 내부 실험 수치 등은 발표자가 인용한 내용이므로, 실제 의사결정에 쓰려면 원문 연구나 자료 확인이 필요하다.
🕒 시간순 섹션별 상세정리
- Claude Code는 생산성보다 수익 최적화에 맞춰져 있지 않다
- 발표자는 Claude Code를 “비즈니스 파트너”처럼 쓰기 위해 네 가지 업그레이드를 붙였다고 설명하며, 목표는 단순히 많은 작업을 처리하는 것이 아니라 시간과 돈을 낭비하게 만드는 기본 문제를 줄이는 것이라고 드러낸다 [00:40]
- 일반 사용자는 Claude의 답변을 최선의 답처럼 받아들이기 쉽지만, 기본 사용 방식만으로는 출력 품질을 낮추는 오류와 맹점이 계속 남아 비용으로 이어질 수 있다고 문제를 제기한다 [00:55]
- 동의 편향을 깨기 위해 반대 관점과 시장 검증을 강제한다
- 첫 번째 문제는 Claude가 사용자의 아이디어에 쉽게 동의하는 성향이며, 사용자가 방향을 바꿔도 그 방향을 다시 긍정하는 식의 패턴이 반복된다고 보여준다 [01:53]
- 발표자는 AI 모델이 사용자의 프레이밍에 반박하지 못하는 비율이 약 88%로 제시됐다고 말하며, 인간의 약 60%보다 높기 때문에 의사결정 검증 도구로 그대로 쓰면 위험하다고 강조한다 [02:16]
- 검증 필요: 이 구간의 88%와 60% 수치는 영상 속 인용이므로, 실제 적용 전에는 해당 실험의 조건과 원문 자료를 확인할 필요가 있다 [02:31]
- Roast 스킬은 아이디어를 여러 역할로 공격한 뒤 실행 여부를 판정한다
- 발표자는 Claude를 기본적인 동의 모드에서 빼내기 위해 “Roast” 스킬을 사용하며, 이 스킬은 아이디어와 Claude 자신의 작업을 여러 각도에서 공격하게 만들어 승인 전에 결함과 가능성을 함께 드러내는 방식이라고 보여준다 [02:58]
- Roast의 역할은 치명적 결함을 찾는 반대자, 최대 upside를 찾는 확장주의자, 순수 논리로 보는 제1원칙 사고자, 시장 데이터와 경쟁 가격을 찾는 리서처, 실제 구매 의사를 판단하는 고객 관점으로 나뉜다 [03:07]
- 월 9달러 LinkedIn 도구 아이디어는 좁은 니치와 검증 실험으로 재구성된다
- Roast를 실행하기 전 Claude는 목표 구매자, 사용자의 강점, 예산, 첫 매출까지 필요한 속도 같은 조건을 묻고, 발표자는 “유튜브 링크가 있는 누구나”, “배포망 없음”, “Claude Code로 빠르게 만들 수 있음” 같은 조건을 입력한다 [04:31]
- 이후 여러 하위 에이전트가 같은 아이디어를 각자 평가하고, 비교를 위해 별도의 기본 Claude 세션에도 동일한 아이디어에 대한 일반 분석을 요청한다 [05:04]
- 일반 Claude 분석보다 역할 기반 검토가 사업 의사결정에 더 구체적이다
- Roast 기반 검토에서는 코드를 쓰기 전에 하나의 니치를 정하고 48시간 안에 20~30명에게 DM이나 이메일을 보내 실제 지불 의사가 있는지 확인하는 것이 가장 싼 검증 방법으로 제안된다 [06:18]
- 역할별 점수는 반대자 2점, 확장주의자 8점, 나머지 관점은 3점·2점·2점 수준으로 갈리며, 원래 아이디어를 그대로 진행하기보다 더 좁은 니치와 검증 실험으로 재구성해야 한다는 결론으로 계속된다 [06:28]
- 완성처럼 보이는 결과물은 검증 루프 없이는 실제 작동을 보장하지 않는다
- 두 번째 문제는 Claude가 만든 결과물이 완성된 것처럼 보여도 실제로 작동하는지는 별개의 문제이며, 이 간극을 방치하면 며칠 동안 수정 작업에 시간을 잃을 수 있다는 점이다 [07:51]
- 발표자는 NYU 연구를 예로 들며 GitHub Copilot이 생성한 프로그램 약 1,600개 중 대략 40%에 보안 취약점이 있었다고 소개하고, 이런 문제는 고객 앞 충돌이나 라이브 데모 실패 전까지 드러나지 않을 수 있다고 경고한다 [08:06]
- 검증 필요: 이 보안 취약점 비율은 영상에서 인용된 연구 결과이므로, 실제 근거로 활용하려면 연구 범위와 측정 기준을 원문에서 확인해야 한다 [08:21]
- 검증 루프가 초안 품질과 검토 비용을 결정한다
- 발표자는 AI가 먼저 90% 수준의 초안을 만들고, 이후 사람이 취향과 판단을 더해 반복하는 방식이 처음부터 사람이 만드는 시간을 줄인다고 보여준다 [12:06]
- 중간 검증과 작업 확인 루프가 들어가면 Claude가 대충 멈추지 않고, 사람이 빠르게 검토해 바로 보낼 수 있는 수준까지 결과물을 밀어붙이게 된다고 드러낸다 [12:10]
- 랜딩페이지 빌드 결과는 화면과 코드 양쪽에서 검증된다
- 데모에서는 Cadence용 단일 페이지 랜딩페이지가 8개 섹션으로 구성되고, 검증 루프가 실행되어 통과까지 끝난 상태로 드러난다 [12:51]
- Playwright가 데스크톱과 모바일 화면을 각각 11장씩 캡처해, 코드가 존재하는지만 보는 것이 아니라 실제 화면에서 결과물이 어떻게 보이는지도 확인할 수 있게 한다 [13:03]
- 폼 제출 스트레스 테스트가 사용자 입력 리스크를 드러낸다
- 발표자는 빌드 검증만으로는 부족하다고 보고, Playwright CLI의 headed browser로 실제 브라우저를 열어 여러 조건의 폼 제출을 반복한다 [14:18]
- 드롭다운 옵션, 이메일, 전화번호, 이름을 다양하게 바꿔가며 테스트하고, 백엔드 연결 전에도 프론트엔드 입력 흐름에서 발생할 수 있는 결함을 빠르게 확인한다 [14:34]
- context rot은 긴 대화에서 성능과 산출물 품질을 무너뜨린다
- 세 번째 문제는 좋은 검증 방식도 먼저 결과물이 나와야 의미가 있는데, Claude 작업 중 대화가 길어지면 속도·품질·사용량 한계에 부딪히기 쉽다는 점이다 [16:46]
- 발표자는 18개 주요 AI 모델 테스트에서 대화가 길어질수록 성능이 떨어졌고, 단순한 작업에서도 hallucination과 품질 저하가 증가했다고 보여준다 [17:06]
- 검증 필요: 18개 모델 테스트와 성능 저하 수치는 영상에서 인용된 내용이므로, 모델 종류와 평가 방식은 별도 확인이 필요하다 [17:21]
- session handoff와 clear로 깨끗한 작업 상태를 유지한다
/context는 현재 context window를 차지하는 항목을 보여주고,/clear는 전체 대화를 지워 새 세션으로 시작하게 만드는 명령으로 묶인다 [18:14]- 발표자는
/compact대신/session handoff를 쓰면 작업 내용, 핵심 파일, 열린 결정, 이어서 할 지점이 요약되므로, context를 지우기 전에 필요한 상태를 보존할 수 있다고 보여준다 [18:21]
- subagent와 goal이 병렬 실행과 별도 평가를 결합한다
- 네 번째 문제는 Claude가 한 번에 한 방향으로만 움직이기 때문에, 사용자가 결정자이자 리뷰어 역할을 모두 맡으며 병목이 된다는 점이다 [21:15]
- 발표자는 Anthropic 내부 실험에서 lead agent가 여러 subagent를 병렬 조정하는 구조가 단일 agent보다 연구 평가에서 90% 이상 높은 성과를 냈다고 보여준다 [21:31]
- 검증 필요: Anthropic 내부 실험 수치와 평가 조건은 영상 속 설명만으로는 한계가 있으므로, 정확한 의미를 확인하려면 원자료가 필요하다 [21:46]
/goal과 병렬 서브 에이전트로 실행 산출물 만들기
- 발표자는 웹앱 제품과 ICP를 기준으로 여섯 개 산출물을 만들도록
/goal을 설정하고, 각 산출물마다 별도 서브 에이전트를 붙여 파일 충돌 없이 병렬 작업을 진행한다 [24:03] - 완료 조건은 여섯 개 파일 존재, 빈 파일 없음, 시장조사 내 경쟁사 6개 이상, 개인화 초안 25개처럼 객관적 기준으로 고정되며, 목표가 구체적일수록 에이전트가 끝까지 작업할 가능성이 커진다고 보여준다 [24:21]
- 산출물 검토와 병목 제거형 역할 전환
- 완성된 파일에는 포지셔닝, 시장조사, 출시 계획, 아웃리치 템플릿, 아웃리치 초안, 콘텐츠 캘린더가 포함되며, 사람은 직접 모든 것을 만드는 단계에서 벗어나 결과물을 검토하고 실행 방향을 결정하는 역할로 이동한다 [25:34]
- 발표자는 전체 데모가 1시간 미만이지만, 같은 방식을 일주일 동안 집중해서 쓰면 아이디어 도출, 제품 구축, 출시 계획까지 팀 단위 작업에 가까운 범위를 Claude Code로 압축할 수 있다고 마무리한다 [25:51]
- 완성 산출물의 실제 내용 점검
- go-to-market 폴더에서 포지셔닝 문서를 열어 ICP, 세그먼트, 핵심 제안, 가격 티어, 업그레이드 논리, 한 줄 가치 제안이 생성됐음을 확인한다 [26:16]
- 반론 처리에는 “LinkedIn에 충분히 게시하지 않는다”, “AI 게시물이 가짜처럼 보인다” 같은 objection과 rebuttal이 포함되어 사람이 읽고 개인적 손질을 더할 수 있다고 본다 [26:34]
- 시장조사 파일에는 제품, wedge, ICP, 경쟁사와 인접 경쟁사, 비교표, $19 진입 가격의 근거와 출처가 정리되어 깊이 있는 자료가 됐다고 보여준다 [26:46]
- 14일 출시 계획, 아웃리치, 콘텐츠 캘린더까지 이어져 실행 순서를 따라갈 수 있는 상태임을 확인한다 [27:04]
- 병목에서 판단자로 이동하는 최종 메시지
- 발표자는 sub agent,
/goal, automation을 묶어 사람이 병목이 되지 않도록 해야 한다고 정리하며, 역할이 builder/producer에서 problem solver, decision maker, reviewer, judge로 바뀐다고 말한다 [27:12] - 네 가지 업그레이드는 AI가 무조건 동의하지 않게 만들기, 스스로 작업을 검증하게 하기, context를 관리해 Claude를 날카롭게 유지하기, sub agent와
/goal로 병목을 제거하기로 요약된다 [27:29] - 이 방식으로 Claude를 활용해 비즈니스를 키우고 수익을 만들 수 있으며, 관련 자료와 커뮤니티는 무료 school community와 plus community에서 제공된다고 안내한다 [27:44]
- 마지막으로 설명란 링크를 언급한 뒤, 영상이 도움이 됐다면 좋아요를 눌러 달라고 말하며 마무리한다 [28:02]
🧾 결론
- 이 영상의 핵심은 Claude Code를 “대답하는 도구”가 아니라 “반박하고 검증하고 실행을 나누는 비즈니스 작업 시스템”으로 다루라는 것이다.
- 돈을 버는 데 중요한 것은 MVP를 빨리 만드는 것 자체가 아니라, 만들기 전에 수요와 차별성을 확인하고, 만든 뒤에는 실제 사용자 흐름에서 깨지는 지점을 찾아내는 것이다.
- Roast 방식처럼 여러 관점에서 아이디어를 공격하면 기본 Claude 분석보다 더 구체적인 사업 판단과 다음 행동을 얻을 수 있다.
- 검증 루프는 결과물을 90% 수준까지 끌어올린 뒤 사람이 취향과 판단을 더하는 구조를 만들며, 반복 수정 비용을 줄이는 데 초점이 있다.
- context rot을 피하고 subagent를 병렬로 쓰면 사용자는 직접 만드는 사람에서 문제 해결자, 의사결정자, 리뷰어 역할로 이동할 수 있다.
📈 투자·시사 포인트
- AI 도구 활용의 수익성은 “얼마나 빨리 만들었는가”보다 “시장 검증, 오류 검출, 배포 가능 품질까지 얼마나 체계적으로 통제했는가”에 더 크게 달려 있다.
- 낮은 가격의 범용 SaaS 아이디어는 무료 대체재와 낮은 생애가치 때문에 고객 획득 비용을 감당하기 어려울 수 있으므로, 좁은 ICP와 명확한 유료 니치 검증이 우선이다.
- AI 기반 자동화나 랜딩페이지 제작은 초기 비용을 낮출 수 있지만, 검증 없는 자동화는 실패를 늦게 발견하게 만들어 오히려 시간과 신뢰 비용을 키울 수 있다.
- subagent와
/goal처럼 병렬 실행과 객관적 완료 조건을 결합하는 방식은 1인 창업자나 소규모 팀이 리서치, 포지셔닝, 출시 계획, 아웃리치 초안을 빠르게 묶어내는 데 유리하다. - 검증 필요: 영상에서 언급된 AI 모델의 반박 실패 비율, Copilot 생성 코드 취약점 비율, Anthropic 내부 실험 성과 수치는 투자 판단에 쓰기 전 원문 연구와 조건을 별도로 확인해야 한다.
⚠️ 불확실하거나 확인이 필요한 부분
- AI 모델이 프레이밍에 반박하지 못하는 비율이 약 88%이고 인간은 약 60%라는 수치는 영상에서 제시되지만, 원 연구·측정 방식·대상 모델을 별도로 확인해야 한다.
- NYU 연구에서 GitHub Copilot 생성 프로그램 약 1,600개 중 약 40%에 보안 취약점이 있었다는 주장도 영상 내 언급 기준이며, 연구 범위와 현재 모델에도 그대로 적용 가능한지는 검증이 필요하다.
- Anthropic 내부 실험에서 lead agent와 subagent 구조가 단일 agent보다 연구 평가에서 90% 이상 높은 성과를 냈다는 내용은 영상에 나온 사례지만, 평가 조건·작업 유형·재현 가능성은 추가 확인이 필요하다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- Claude Code로 제품이나 자동화를 만들기 전, 아이디어에 대해 반대자·확장주의자·제1원칙 사고자·리서처·고객 관점의 검토를 먼저 수행한다.
- MVP를 바로 만들기 전에 하나의 좁은 니치를 정하고, 20~30명에게 DM이나 이메일을 보내 실제 지불 의사와 문제 강도를 확인한다.
- Claude가 만든 산출물은 완료 보고만 믿지 말고, 로컬 실행·스크린샷·클릭 테스트·폼 제출 테스트처럼 산출물 유형에 맞는 검증 루프를 붙인다.
- 긴 대화가 이어질 때는 context 사용량을 확인하고, 일정 토큰 이상이 되기 전에 session handoff 후 clear로 새 세션에서 이어간다.
❓ 열린 질문
- Roast 방식으로 나온 “reshape” 판단이 실제 매출 가능성을 얼마나 잘 예측하는지, 여러 제품 아이디어에 반복 적용했을 때도 일관된 결과가 나오는가?
- 좁은 유료 니치를 고를 때 “충분히 좁지만 시장이 작지 않은” 기준은 무엇이며, 몇 명의 응답이나 어떤 신호를 유효한 검증으로 볼 수 있는가?
- Claude Code의 검증 루프를 랜딩페이지 외에 영상 편집, 데이터 파이프라인, 이메일 자동화, SaaS 백엔드에는 각각 어떻게 설계해야 하는가?