YouTubeOpenAI·2026년 6월 26일·0

Builders Unscripted: Ep. 4 - Pietro Schirano

Quick Summary

Builders Unscripted: Ep. 4 Pietro Schirano는 AI 모델을 단순 자동화 도구가 아니라 창의성, 멀티모달 제작, 에이전트형 작업 방식을 확장하는 새로운 제작 환경으로 바라본 대화다.

영상 보기

클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.

원본 열기

🖼️ 인포그래픽

Builders Unscripted: Ep. 4 - Pietro Schirano 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

Builders Unscripted: Ep. 4 - Pietro Schirano 내용을 설명하는 본문 이미지

💡 한 줄 결론

Builders Unscripted: Ep. 4 - Pietro Schirano는 AI 모델을 단순 자동화 도구가 아니라 창의성, 멀티모달 제작, 에이전트형 작업 방식을 확장하는 새로운 제작 환경으로 바라본 대화다.

📌 핵심 요점

  1. Pietro Schirano는 새 AI 모델의 가치를 벤치마크보다 실제 제작 과정에서 드러나는 지시 이행, 창의성, 멀티모달 처리, 긴 작업 지속 능력으로 평가한다.
  2. 영상에서는 GPT-5.5와 Codex 조합이 이미지와 소리를 오가는 데모, 디자인 생성, 앱 구현, 오래된 기기 재활용 같은 실험을 가능하게 했다고 설명한다.
  3. AI는 인간의 생각을 글, 디자인, 코드, 음성 입력으로 빠르게 외부화해 주는 사고 확장 장치로 제시된다.
  4. Codex는 단순한 코드 작성 도구를 넘어 파일 정리, 노트 작성, 제품 데이터 연결, 업무 알림 등 컴퓨터 전반을 다루는 개인 비서형 도구로 확장된다.
  5. 제품 개발 관점에서는 기능 제작과 고객 피드백 루프가 수개월 단위에서 하루 단위로 압축될 수 있으며, 이는 작은 팀의 실행 속도와 실험 빈도를 크게 높일 수 있다.

🧩 배경과 문제 정의

  • 이 영상은 AI 모델을 단순 자동화 도구가 아니라, 아직 충분히 탐험되지 않은 잠재 공간이자 창작 방식을 바꾸는 실험장으로 다룬다.
  • 핵심 문제의식은 새 모델이 이전 모델보다 실제 제작 과정에서 무엇을 더 잘하게 되었는지, 특히 창의성, 멀티모달 입력·출력, 에이전트 기반 작업에서 어떤 경계가 무너졌는지에 있다.
  • 모델 평가는 벤치마크 점수보다 실제 사용 과정에서의 지시 이행, 긴 작업 지속성, 다른 에이전트를 지휘하는 능력, 디자인·음악·코딩 결과물의 품질로 옮겨간다.
  • 인간은 시각과 청각 같은 입력 능력은 강하지만, 생각을 코드·글·디자인·음성으로 외부화하는 출력 과정에는 병목이 있다.
  • AI가 글쓰기, 디자인, 코딩, 음성 입력, 물리 기기 제어까지 확장되면, 사람은 직접 모든 것을 수행하기보다 아이디어를 표현하고 에이전트에게 작업을 맡기는 방식으로 이동한다.

🕒 시간순 섹션별 상세정리

  1. AI는 새로 열린 탐험 공간이자 창작 실험장이다
  • AI 시대의 창의성은 바다 탐험과 우주 탐험 사이에 놓인 새로운 영역처럼 다뤄지며, 모델의 잠재 공간을 파고들어 무엇이 가능한지 찾는 태도가 핵심이다 [01:08]
  • 새 모델을 볼 때는 이전 모델이 못 하던 작은 경계와 새로운 가능성을 찾는 관점이 중요하고, 초기 테스트 과정에서도 그런 차이를 반복적으로 확인한다 [01:37]
  1. GPT-5.5는 비전·에이전트·창의 작업의 마찰을 줄인다
  • 예전 GPT Vision에서는 이미지 위에 격자 오버레이를 붙여 모델이 위치를 이해하도록 도와야 했지만, GPT-5.5는 클릭할 위치와 봐야 할 영역을 자체적으로 추론할 만큼 비전 능력이 개선된다 [02:21]
  • 중요한 평가는 사람들이 놓치기 쉬운 능력, 특히 재미와 창의성, 디자이너처럼 행동하는 능력, 다른 디자인 에이전트와 모델을 지휘하는 능력으로 옮겨간다 [02:43]
  1. 이미지와 소리를 오가는 데모는 ‘불가능해 보이는 아이디어’의 기준을 바꾼다
  • OpenAI 로고 이미지를 앱에 넣으면 소리로 변환되고, Codex와 GPT-5.5 조합은 이 과정을 한 번에 구현해 암호화와 음악적 결과물을 동시에 처리한다 [04:10]
  • 생성된 소리는 단순한 데이터 파일이 아니라 실제로 듣기 좋은 음악처럼 작동하며, 외계인과 음악적 신호로 소통하는 영화적 장면과 비슷한 감각까지 만든다 [04:33]
  1. 새 모델 평가는 지시 이행, 실제 실행, 에이전트 지휘 능력으로 나뉜다
  • 새 모델을 볼 때 첫 기준은 지시 이행이며, 최신 모델이라고 해서 항상 지시를 더 잘 따르는 것은 아니기 때문에 일관되게 도움이 되는지가 중요하다 [06:11]
  • 두 번째 기준은 요청한 작업을 실제로 완수하는지이고, 세 번째 기준은 Codex 같은 다른 에이전트를 지휘해 복잡한 작업을 끝까지 밀고 갈 수 있는지다 [06:38]
  1. Codex 워크플로는 멀티에이전트, PR, 디버깅, 멀티모달 구현으로 확장된다
  • “Spawn”은 여러 하위 에이전트를 생성하고, PR 단축어는 저장소 기반 변경을 밀어붙이는 흐름으로 연결되며, 반복 작업을 짧은 명령으로 표준화한다 [07:56]
  • 세션 종료 뒤에는 전체 코드 변경을 다시 검토하고 잠재 버그, 회귀, 엣지 케이스를 찾는 디버깅 흐름이 붙으며, 모델 성능은 이런 검토 작업에서 비교된다 [08:14]
  1. 디자인과 글쓰기 앱은 AI를 사고의 확장 장치로 만든다
  • Odysseus 앱 아이콘은 그리스 배와 깃펜이라는 요구만으로 생성됐고, 과거라면 포토샵 레이어, 그라디언트, 테두리, 질감 작업에 여러 시간이 걸릴 결과가 한 번에 만들어졌다 [09:19]
  • 핵심 주제는 인간과 AI의 마음 연결이며, Codex나 특정 AI 모델이 단순한 도구가 아니라 자신의 사고를 확장하는 장치처럼 작동하는 방향으로 이동한다 [10:31]
  1. 멀티모달 인터페이스와 코딩의 재료화
  • 음성으로 생각을 말하고, 실시간으로 포착한 뒤, 글로 이어서 정리하는 흐름이 가능해지면서 컴퓨터 인터페이스가 사고의 자연스러운 확장처럼 작동한다 [12:10]
  • 다크 모드, 명령어, 텍스트 서식 같은 UI 기능도 모델과의 대화만으로 구성되며, 사용자는 원하는 앱을 직접 구현하는 쪽으로 이동한다 [12:26]
  1. 새 모델을 시험하는 방식과 오래된 기기의 재활용
  • 새 모델이 나오면 아직 해보지 못한 것, 과거에는 실패했던 것, 모델 성능 때문에 불가능했던 아이디어가 우선 실험 대상이 된다 [13:43]
  • 소프트웨어 코딩 성능이 매우 높아지면서 일반적인 앱 제작은 어느 정도 포화된 느낌을 주고, 더 낯선 대상과 더 물리적인 기기로 관심이 옮겨간다 [14:08]
  1. 보안용 기기를 게임기로 바꾼 실험
  • 보안 제어용으로 보이는 작업용 기기는 원래 게임에 맞지 않는 화면과 입력 구조를 가졌지만, 방향을 바꿔 잡으면서 새로운 플레이 가능성이 생긴다 [15:36]
  • USB로 기기를 연결하고 Codex에 읽게 하자, 기기 식별 정보와 연결 상태를 파악한 뒤 실제로 무언가 실행할 수 있는 대상으로 인식된다 [16:05]
  1. 장난감 실험에서 업무용 리모컨으로 확장
  • 단순한 재미 실험 이후 같은 기기를 업무에 쓸 수 있는 방식으로 전환하면서, AI와 인간의 연결을 실제 작업 흐름에 붙이는 문제가 중심이 된다 [17:29]
  • Codex는 텍스트를 보내면 기기가 진동하고 메시지를 표시하는 제어 앱을 만들며, 완료 알림을 물리적 감각으로 받을 수 있게 한다 [17:47]
  1. MagicPath와 제품 팀 협업의 재구성
  • MagicPath는 에이전트와 인간이 함께 설계하고 구축하는 무한 캔버스이며, 여러 기기와 환경에서 접근 가능한 공통 작업 공간을 지향한다 [19:09]
  • 각자 다른 맥락과 정보를 가진 개인 에이전트가 생기면서, 제품 팀에는 PM, 디자이너, 엔지니어가 같은 기준 도구 안에서 협업할 필요가 커진다 [19:28]
  1. 창업자의 균형 문제와 Codex의 범용화
  • AI가 너무 많은 기능을 빠르게 만들 수 있게 만들면서 PR 요청이 10배 수준으로 늘고, 창업자는 직접 만들고 싶은 욕구와 채용한 팀을 믿어야 하는 책임 사이에서 균형을 잡아야 한다 [21:10]
  • Codex는 코드 작성뿐 아니라 컴퓨터 파일 정리, 오래된 음악 라이브러리의 커버와 메타데이터 수정, 미팅 전 Apple Notes 작성 같은 일상 작업에도 쓰인다 [22:26]
  1. 고객 피드백 루프를 하루 단위로 압축하는 제품 개발
  • Codex로 원하는 작업을 빠르게 끝낼 수 있는 속도 덕분에, MagicPath는 제품을 고객 손에 더 빨리 넘기고 즉각적인 반응을 받을 수 있다 [24:22]
  • 과거 대형 기술기업의 제품 개발은 사용자 피드백 수집과 기능 구현에 수개월이 걸렸고, 그 사이 더 나은 방향이 생겨도 처음 만든 것이 맞는지 확신하기 어려웠다 [24:34]
  1. 감독 중심 업무와 빌더 민주화가 되찾는 시간
  • 앞으로의 일은 직접 작업을 수행하는 비중보다 작업을 지휘하는 비중이 커지며, 어디서든 접근 가능한 분산형 에이전트가 그 기반이 된다 [25:40]
  • 새벽 2시에 휴대폰과 OpenClaw에서 아이디어를 전달하면 에이전트가 맥락을 바탕으로 작업을 만들고 링크를 돌려주며, 사람은 책상 앞에 붙어 있지 않아도 결과를 확인하고 피드백할 수 있다 [25:54]
  • 검증 필요: 제공된 section-detail은 전체 길이 28:31 중 25:54까지의 마무리 논지만 포함하므로, 26:14 이후의 구체적인 최종 발언은 원 transcript 확인이 필요하다 [26:09]
  1. AI가 시간과의 싸움을 되돌리는 낙관
  • 책상 앞에 붙어 있지 않아도 에이전트가 만든 결과를 확인하고 바로 피드백할 수 있다는 점에서, 이 변화에는 낭만적이고 희망적인 면이 있다고 드러낸다 [26:16]
  • 인간에게 공통으로 주어진 것은 시간이며, AI는 인간이 시간에 맞서 되찾는 복수처럼 느껴진다고 보여준다 [26:30]
  • 예전에는 제품을 만드는 데 6개월이 걸렸다면 이제는 2주로 줄어들 수 있고, 절약된 시간은 가족·친구·사랑하는 사람들과 보낼 수 있다 [26:41]
  • 창업자로서 많이 일하더라도 에이전트가 대신 작업 중이라는 확신 덕분에 친구를 만나러 갈 수 있다는 점에서 큰 낙관을 느낀다 [26:59]
  1. 누구나 빌더가 되는 민주화와 마무리
  • 마지막으로 남기고 싶은 감정은 무엇이든 만들 수 있다는 데서 오는 강렬한 행복감과 자유라고 드러낸다 [27:13]
  • OpenAI의 미션처럼 모든 빌더와 모두를 위한 도구가 중요하며, 이제는 모두가 빌더가 되는 시대라고 정리한다 [27:27]
  • 새 모델은 낯설고 멀게 느껴졌던 지능을 누구나 사용할 수 있는 것으로 민주화했고, 이 접근성이 가능성의 격차를 어느 정도 평준화한다고 평가한다 [27:52]
  • 진행자는 Pietro의 작업과 모델에 대한 안목·취향·창의성에 감사를 전하고, MagicPath와 여러 기기에서 이어질 다음 작업이 사람들에게 훌륭한 것을 만들 영감을 주길 바란다고 마무리한다 [28:25]

🧾 결론

  • 이 영상의 핵심은 “AI가 무엇을 대신하느냐”보다 “AI가 인간이 생각하고 만들 수 있는 범위를 어떻게 넓히느냐”에 있다.
  • 새 모델의 성능은 점수표보다 실제로 아이디어를 앱, 디자인, 음악, 물리 기기 실험으로 바꿔 내는 과정에서 더 선명하게 드러난다.
  • Pietro Schirano가 강조하는 변화는 코딩 능력 자체보다, 여러 에이전트와 도구를 지휘하며 복잡한 작업을 끝까지 밀고 가는 감독형 작업 방식이다.
  • AI 도구가 충분히 빨라지고 개인 맥락을 이해하면, 창업자와 제작자는 더 많은 실험을 더 짧은 시간 안에 시도하고 검증할 수 있다.
  • 다만 영상 속 사례들은 발표자 경험과 데모 중심으로 제시되므로, 일반 사용자나 조직에서도 같은 수준의 생산성 향상이 재현되는지는 별도 검증이 필요하다.

📈 투자·시사 포인트

  • AI 제품의 경쟁력은 단순 모델 성능보다 실제 워크플로에 얼마나 깊게 붙는지, 그리고 사용자의 반복 작업을 얼마나 짧은 명령과 자동화된 루프로 바꾸는지에서 갈릴 가능성이 크다.
  • 멀티모달 생성, 에이전트 지휘, 로컬 파일·업무 데이터 접근, 실시간 피드백 수집이 결합되면 개인 생산성 도구와 팀 협업 도구의 경계가 흐려질 수 있다.
  • 작은 제품 팀이 더 많은 실험을 더 빠르게 수행할 수 있다면, 초기 스타트업의 제품 검증 속도와 자본 효율성은 높아질 수 있다.
  • 오래된 기기나 특수 하드웨어를 AI로 다시 활용하는 사례는 소프트웨어 중심 AI 시장이 물리적 인터페이스와 엣지 기기 영역으로 확장될 여지를 보여준다.
  • 검증 필요 포인트는 영상에서 언급된 생산성 향상, PR 증가, 고객 피드백 주기 단축이 특정 개인·팀의 사례를 넘어 보편적인 성과로 이어지는지 여부다.

⚠️ 불확실하거나 확인이 필요한 부분

  • 영상에서 언급된 GPT-5.5의 비전·멀티모달·에이전트 성능 향상은 데모와 개인 사용 경험 중심으로 제시되며, 동일한 결과가 다른 환경에서도 일관되게 재현되는지는 별도 검증이 필요하다.
  • 이미지→소리→이미지 복원 데모는 “한 번에 작동했다”는 흐름으로 설명되지만, 사용된 앱 구조, 인코딩 방식, 손실 허용 범위, 실패 사례는 transcript만으로 확인되지 않는다.
  • 오래된 보안용 기기를 게임기나 업무용 알림 장치로 재활용한 사례는 흥미롭지만, 정확한 기기 모델명·펌웨어 제약·API 문서 범위는 명확히 분리해 확인해야 한다.
  • 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
  • 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
  • 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

  • 새 모델을 평가할 때 벤치마크 점수만 보지 말고, 지시 이행력·작업 완수율·장기 실행 지속성·다른 에이전트 지휘 능력을 별도 기준으로 기록한다.
  • 과거에 모델 성능 때문에 실패했던 아이디어를 목록화하고, 새 모델이 나올 때마다 재실험할 후보군으로 관리한다.
  • 반복적으로 쓰는 프롬프트나 작업 지시를 단축어로 만들어, 멀티에이전트 실행·PR 생성·디버깅 검토 같은 흐름을 표준화한다.
  • Codex나 에이전트 작업이 끝났는지 계속 확인해야 하는 문제를 줄이기 위해, 완료 알림·상태 표시·물리적 알림 장치 같은 피드백 루프를 설계한다.

❓ 열린 질문

  • 창의성, 재미, 디자인 감각처럼 정량화하기 어려운 모델 능력은 어떤 기준으로 평가해야 실제 제작 품질과 연결될까?
  • 에이전트가 장시간 작업을 수행할 때, 사람은 어느 지점에서 개입하고 어느 지점까지 위임해야 안전하고 효율적일까?
  • 개인 에이전트가 PM, 디자이너, 엔지니어의 역할을 일부 번역하거나 평준화할 때, 팀 협업 도구는 어떤 형태로 재구성되어야 할까?

관련 문서

공통 태그와 주제 흐름을 기준으로 같이 보면 좋은 문서를 이어서 제안합니다.