Builders Unscripted: Ep. 4 - Pietro Schirano
Quick Summary
Builders Unscripted: Ep. 4 Pietro Schirano는 AI 모델을 단순 자동화 도구가 아니라 창의성, 멀티모달 제작, 에이전트형 작업 방식을 확장하는 새로운 제작 환경으로 바라본 대화다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
Builders Unscripted: Ep. 4 - Pietro Schirano는 AI 모델을 단순 자동화 도구가 아니라 창의성, 멀티모달 제작, 에이전트형 작업 방식을 확장하는 새로운 제작 환경으로 바라본 대화다.
📌 핵심 요점
- Pietro Schirano는 새 AI 모델의 가치를 벤치마크보다 실제 제작 과정에서 드러나는 지시 이행, 창의성, 멀티모달 처리, 긴 작업 지속 능력으로 평가한다.
- 영상에서는 GPT-5.5와 Codex 조합이 이미지와 소리를 오가는 데모, 디자인 생성, 앱 구현, 오래된 기기 재활용 같은 실험을 가능하게 했다고 설명한다.
- AI는 인간의 생각을 글, 디자인, 코드, 음성 입력으로 빠르게 외부화해 주는 사고 확장 장치로 제시된다.
- Codex는 단순한 코드 작성 도구를 넘어 파일 정리, 노트 작성, 제품 데이터 연결, 업무 알림 등 컴퓨터 전반을 다루는 개인 비서형 도구로 확장된다.
- 제품 개발 관점에서는 기능 제작과 고객 피드백 루프가 수개월 단위에서 하루 단위로 압축될 수 있으며, 이는 작은 팀의 실행 속도와 실험 빈도를 크게 높일 수 있다.
🧩 배경과 문제 정의
- 이 영상은 AI 모델을 단순 자동화 도구가 아니라, 아직 충분히 탐험되지 않은 잠재 공간이자 창작 방식을 바꾸는 실험장으로 다룬다.
- 핵심 문제의식은 새 모델이 이전 모델보다 실제 제작 과정에서 무엇을 더 잘하게 되었는지, 특히 창의성, 멀티모달 입력·출력, 에이전트 기반 작업에서 어떤 경계가 무너졌는지에 있다.
- 모델 평가는 벤치마크 점수보다 실제 사용 과정에서의 지시 이행, 긴 작업 지속성, 다른 에이전트를 지휘하는 능력, 디자인·음악·코딩 결과물의 품질로 옮겨간다.
- 인간은 시각과 청각 같은 입력 능력은 강하지만, 생각을 코드·글·디자인·음성으로 외부화하는 출력 과정에는 병목이 있다.
- AI가 글쓰기, 디자인, 코딩, 음성 입력, 물리 기기 제어까지 확장되면, 사람은 직접 모든 것을 수행하기보다 아이디어를 표현하고 에이전트에게 작업을 맡기는 방식으로 이동한다.
🕒 시간순 섹션별 상세정리
- AI는 새로 열린 탐험 공간이자 창작 실험장이다
- AI 시대의 창의성은 바다 탐험과 우주 탐험 사이에 놓인 새로운 영역처럼 다뤄지며, 모델의 잠재 공간을 파고들어 무엇이 가능한지 찾는 태도가 핵심이다 [01:08]
- 새 모델을 볼 때는 이전 모델이 못 하던 작은 경계와 새로운 가능성을 찾는 관점이 중요하고, 초기 테스트 과정에서도 그런 차이를 반복적으로 확인한다 [01:37]
- GPT-5.5는 비전·에이전트·창의 작업의 마찰을 줄인다
- 예전 GPT Vision에서는 이미지 위에 격자 오버레이를 붙여 모델이 위치를 이해하도록 도와야 했지만, GPT-5.5는 클릭할 위치와 봐야 할 영역을 자체적으로 추론할 만큼 비전 능력이 개선된다 [02:21]
- 중요한 평가는 사람들이 놓치기 쉬운 능력, 특히 재미와 창의성, 디자이너처럼 행동하는 능력, 다른 디자인 에이전트와 모델을 지휘하는 능력으로 옮겨간다 [02:43]
- 이미지와 소리를 오가는 데모는 ‘불가능해 보이는 아이디어’의 기준을 바꾼다
- OpenAI 로고 이미지를 앱에 넣으면 소리로 변환되고, Codex와 GPT-5.5 조합은 이 과정을 한 번에 구현해 암호화와 음악적 결과물을 동시에 처리한다 [04:10]
- 생성된 소리는 단순한 데이터 파일이 아니라 실제로 듣기 좋은 음악처럼 작동하며, 외계인과 음악적 신호로 소통하는 영화적 장면과 비슷한 감각까지 만든다 [04:33]
- 새 모델 평가는 지시 이행, 실제 실행, 에이전트 지휘 능력으로 나뉜다
- 새 모델을 볼 때 첫 기준은 지시 이행이며, 최신 모델이라고 해서 항상 지시를 더 잘 따르는 것은 아니기 때문에 일관되게 도움이 되는지가 중요하다 [06:11]
- 두 번째 기준은 요청한 작업을 실제로 완수하는지이고, 세 번째 기준은 Codex 같은 다른 에이전트를 지휘해 복잡한 작업을 끝까지 밀고 갈 수 있는지다 [06:38]
- Codex 워크플로는 멀티에이전트, PR, 디버깅, 멀티모달 구현으로 확장된다
- “Spawn”은 여러 하위 에이전트를 생성하고, PR 단축어는 저장소 기반 변경을 밀어붙이는 흐름으로 연결되며, 반복 작업을 짧은 명령으로 표준화한다 [07:56]
- 세션 종료 뒤에는 전체 코드 변경을 다시 검토하고 잠재 버그, 회귀, 엣지 케이스를 찾는 디버깅 흐름이 붙으며, 모델 성능은 이런 검토 작업에서 비교된다 [08:14]
- 디자인과 글쓰기 앱은 AI를 사고의 확장 장치로 만든다
- Odysseus 앱 아이콘은 그리스 배와 깃펜이라는 요구만으로 생성됐고, 과거라면 포토샵 레이어, 그라디언트, 테두리, 질감 작업에 여러 시간이 걸릴 결과가 한 번에 만들어졌다 [09:19]
- 핵심 주제는 인간과 AI의 마음 연결이며, Codex나 특정 AI 모델이 단순한 도구가 아니라 자신의 사고를 확장하는 장치처럼 작동하는 방향으로 이동한다 [10:31]
- 멀티모달 인터페이스와 코딩의 재료화
- 음성으로 생각을 말하고, 실시간으로 포착한 뒤, 글로 이어서 정리하는 흐름이 가능해지면서 컴퓨터 인터페이스가 사고의 자연스러운 확장처럼 작동한다 [12:10]
- 다크 모드, 명령어, 텍스트 서식 같은 UI 기능도 모델과의 대화만으로 구성되며, 사용자는 원하는 앱을 직접 구현하는 쪽으로 이동한다 [12:26]
- 새 모델을 시험하는 방식과 오래된 기기의 재활용
- 새 모델이 나오면 아직 해보지 못한 것, 과거에는 실패했던 것, 모델 성능 때문에 불가능했던 아이디어가 우선 실험 대상이 된다 [13:43]
- 소프트웨어 코딩 성능이 매우 높아지면서 일반적인 앱 제작은 어느 정도 포화된 느낌을 주고, 더 낯선 대상과 더 물리적인 기기로 관심이 옮겨간다 [14:08]
- 보안용 기기를 게임기로 바꾼 실험
- 보안 제어용으로 보이는 작업용 기기는 원래 게임에 맞지 않는 화면과 입력 구조를 가졌지만, 방향을 바꿔 잡으면서 새로운 플레이 가능성이 생긴다 [15:36]
- USB로 기기를 연결하고 Codex에 읽게 하자, 기기 식별 정보와 연결 상태를 파악한 뒤 실제로 무언가 실행할 수 있는 대상으로 인식된다 [16:05]
- 장난감 실험에서 업무용 리모컨으로 확장
- 단순한 재미 실험 이후 같은 기기를 업무에 쓸 수 있는 방식으로 전환하면서, AI와 인간의 연결을 실제 작업 흐름에 붙이는 문제가 중심이 된다 [17:29]
- Codex는 텍스트를 보내면 기기가 진동하고 메시지를 표시하는 제어 앱을 만들며, 완료 알림을 물리적 감각으로 받을 수 있게 한다 [17:47]
- MagicPath와 제품 팀 협업의 재구성
- MagicPath는 에이전트와 인간이 함께 설계하고 구축하는 무한 캔버스이며, 여러 기기와 환경에서 접근 가능한 공통 작업 공간을 지향한다 [19:09]
- 각자 다른 맥락과 정보를 가진 개인 에이전트가 생기면서, 제품 팀에는 PM, 디자이너, 엔지니어가 같은 기준 도구 안에서 협업할 필요가 커진다 [19:28]
- 창업자의 균형 문제와 Codex의 범용화
- AI가 너무 많은 기능을 빠르게 만들 수 있게 만들면서 PR 요청이 10배 수준으로 늘고, 창업자는 직접 만들고 싶은 욕구와 채용한 팀을 믿어야 하는 책임 사이에서 균형을 잡아야 한다 [21:10]
- Codex는 코드 작성뿐 아니라 컴퓨터 파일 정리, 오래된 음악 라이브러리의 커버와 메타데이터 수정, 미팅 전 Apple Notes 작성 같은 일상 작업에도 쓰인다 [22:26]
- 고객 피드백 루프를 하루 단위로 압축하는 제품 개발
- Codex로 원하는 작업을 빠르게 끝낼 수 있는 속도 덕분에, MagicPath는 제품을 고객 손에 더 빨리 넘기고 즉각적인 반응을 받을 수 있다 [24:22]
- 과거 대형 기술기업의 제품 개발은 사용자 피드백 수집과 기능 구현에 수개월이 걸렸고, 그 사이 더 나은 방향이 생겨도 처음 만든 것이 맞는지 확신하기 어려웠다 [24:34]
- 감독 중심 업무와 빌더 민주화가 되찾는 시간
- 앞으로의 일은 직접 작업을 수행하는 비중보다 작업을 지휘하는 비중이 커지며, 어디서든 접근 가능한 분산형 에이전트가 그 기반이 된다 [25:40]
- 새벽 2시에 휴대폰과 OpenClaw에서 아이디어를 전달하면 에이전트가 맥락을 바탕으로 작업을 만들고 링크를 돌려주며, 사람은 책상 앞에 붙어 있지 않아도 결과를 확인하고 피드백할 수 있다 [25:54]
- 검증 필요: 제공된 section-detail은 전체 길이 28:31 중 25:54까지의 마무리 논지만 포함하므로, 26:14 이후의 구체적인 최종 발언은 원 transcript 확인이 필요하다 [26:09]
- AI가 시간과의 싸움을 되돌리는 낙관
- 책상 앞에 붙어 있지 않아도 에이전트가 만든 결과를 확인하고 바로 피드백할 수 있다는 점에서, 이 변화에는 낭만적이고 희망적인 면이 있다고 드러낸다 [26:16]
- 인간에게 공통으로 주어진 것은 시간이며, AI는 인간이 시간에 맞서 되찾는 복수처럼 느껴진다고 보여준다 [26:30]
- 예전에는 제품을 만드는 데 6개월이 걸렸다면 이제는 2주로 줄어들 수 있고, 절약된 시간은 가족·친구·사랑하는 사람들과 보낼 수 있다 [26:41]
- 창업자로서 많이 일하더라도 에이전트가 대신 작업 중이라는 확신 덕분에 친구를 만나러 갈 수 있다는 점에서 큰 낙관을 느낀다 [26:59]
- 누구나 빌더가 되는 민주화와 마무리
- 마지막으로 남기고 싶은 감정은 무엇이든 만들 수 있다는 데서 오는 강렬한 행복감과 자유라고 드러낸다 [27:13]
- OpenAI의 미션처럼 모든 빌더와 모두를 위한 도구가 중요하며, 이제는 모두가 빌더가 되는 시대라고 정리한다 [27:27]
- 새 모델은 낯설고 멀게 느껴졌던 지능을 누구나 사용할 수 있는 것으로 민주화했고, 이 접근성이 가능성의 격차를 어느 정도 평준화한다고 평가한다 [27:52]
- 진행자는 Pietro의 작업과 모델에 대한 안목·취향·창의성에 감사를 전하고, MagicPath와 여러 기기에서 이어질 다음 작업이 사람들에게 훌륭한 것을 만들 영감을 주길 바란다고 마무리한다 [28:25]
🧾 결론
- 이 영상의 핵심은 “AI가 무엇을 대신하느냐”보다 “AI가 인간이 생각하고 만들 수 있는 범위를 어떻게 넓히느냐”에 있다.
- 새 모델의 성능은 점수표보다 실제로 아이디어를 앱, 디자인, 음악, 물리 기기 실험으로 바꿔 내는 과정에서 더 선명하게 드러난다.
- Pietro Schirano가 강조하는 변화는 코딩 능력 자체보다, 여러 에이전트와 도구를 지휘하며 복잡한 작업을 끝까지 밀고 가는 감독형 작업 방식이다.
- AI 도구가 충분히 빨라지고 개인 맥락을 이해하면, 창업자와 제작자는 더 많은 실험을 더 짧은 시간 안에 시도하고 검증할 수 있다.
- 다만 영상 속 사례들은 발표자 경험과 데모 중심으로 제시되므로, 일반 사용자나 조직에서도 같은 수준의 생산성 향상이 재현되는지는 별도 검증이 필요하다.
📈 투자·시사 포인트
- AI 제품의 경쟁력은 단순 모델 성능보다 실제 워크플로에 얼마나 깊게 붙는지, 그리고 사용자의 반복 작업을 얼마나 짧은 명령과 자동화된 루프로 바꾸는지에서 갈릴 가능성이 크다.
- 멀티모달 생성, 에이전트 지휘, 로컬 파일·업무 데이터 접근, 실시간 피드백 수집이 결합되면 개인 생산성 도구와 팀 협업 도구의 경계가 흐려질 수 있다.
- 작은 제품 팀이 더 많은 실험을 더 빠르게 수행할 수 있다면, 초기 스타트업의 제품 검증 속도와 자본 효율성은 높아질 수 있다.
- 오래된 기기나 특수 하드웨어를 AI로 다시 활용하는 사례는 소프트웨어 중심 AI 시장이 물리적 인터페이스와 엣지 기기 영역으로 확장될 여지를 보여준다.
- 검증 필요 포인트는 영상에서 언급된 생산성 향상, PR 증가, 고객 피드백 주기 단축이 특정 개인·팀의 사례를 넘어 보편적인 성과로 이어지는지 여부다.
⚠️ 불확실하거나 확인이 필요한 부분
- 영상에서 언급된 GPT-5.5의 비전·멀티모달·에이전트 성능 향상은 데모와 개인 사용 경험 중심으로 제시되며, 동일한 결과가 다른 환경에서도 일관되게 재현되는지는 별도 검증이 필요하다.
- 이미지→소리→이미지 복원 데모는 “한 번에 작동했다”는 흐름으로 설명되지만, 사용된 앱 구조, 인코딩 방식, 손실 허용 범위, 실패 사례는 transcript만으로 확인되지 않는다.
- 오래된 보안용 기기를 게임기나 업무용 알림 장치로 재활용한 사례는 흥미롭지만, 정확한 기기 모델명·펌웨어 제약·API 문서 범위는 명확히 분리해 확인해야 한다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- 새 모델을 평가할 때 벤치마크 점수만 보지 말고, 지시 이행력·작업 완수율·장기 실행 지속성·다른 에이전트 지휘 능력을 별도 기준으로 기록한다.
- 과거에 모델 성능 때문에 실패했던 아이디어를 목록화하고, 새 모델이 나올 때마다 재실험할 후보군으로 관리한다.
- 반복적으로 쓰는 프롬프트나 작업 지시를 단축어로 만들어, 멀티에이전트 실행·PR 생성·디버깅 검토 같은 흐름을 표준화한다.
- Codex나 에이전트 작업이 끝났는지 계속 확인해야 하는 문제를 줄이기 위해, 완료 알림·상태 표시·물리적 알림 장치 같은 피드백 루프를 설계한다.
❓ 열린 질문
- 창의성, 재미, 디자인 감각처럼 정량화하기 어려운 모델 능력은 어떤 기준으로 평가해야 실제 제작 품질과 연결될까?
- 에이전트가 장시간 작업을 수행할 때, 사람은 어느 지점에서 개입하고 어느 지점까지 위임해야 안전하고 효율적일까?
- 개인 에이전트가 PM, 디자이너, 엔지니어의 역할을 일부 번역하거나 평준화할 때, 팀 협업 도구는 어떤 형태로 재구성되어야 할까?