AI영상 장인''은 어떤 프롬프트로 영상을 뽑나? (허준호 감독)
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
‘AI영상 장인’의 프롬프트는 단순 명령문이 아니라, 이야기·공간·감정·동선·대사 순서까지 통제하는 연출 설계도에 가깝다.
📌 핵심 요점
- AI 영상의 품질은 어떤 툴을 쓰느냐보다 원하는 장면을 얼마나 세밀하게 통제하고, 생성된 후보 중 무엇을 고르느냐에 의해 갈린다.
- 허준호 감독의 워크플로는 기획, 리서치, 시나리오, 이미지 설계, 영상 프롬프트, 반복 생성, 편집으로 이어지며, 각 단계마다 메타프롬프트가 사용된다.
- 좋은 AI 영상은 프롬프트만 길게 쓰는 것이 아니라, 실화성 있는 소재, 개인적 경험, 감정의 진정성, 캐릭터의 상처와 공간의 분위기를 함께 설계해야 가능하다.
- 짧은 15초 장면에도 대사 순서, 인물 동선, 소품 위치, 카메라 방향, 감정 레이어가 촘촘히 들어가며, 원하는 결과를 얻기 위해 여러 생성본의 좋은 구간을 편집해 붙인다.
- 클링, 시덴스 같은 도구가 상향평준화될수록 경쟁력은 기술 과시가 아니라 이야기 선택, 영상 문법, 공간 연속성, 마이크로 디렉션 같은 연출 디테일로 이동한다.
🧩 배경과 문제 정의
- AI 영상 제작은 단순히 프롬프트를 입력해 결과물을 얻는 과정이 아니라, 원하는 장면·동선·대사·감정·공간을 얼마나 정밀하게 통제하느냐가 품질을 좌우하는 작업이다.
- 숏폼 드라마 시장이 커지고 제작비·인력 제약이 커지는 상황에서, AI 영상은 저예산·고빈도 콘텐츠 제작을 가능하게 하는 새로운 방식으로 주목받고 있다.
- 그러나 도구가 좋아질수록 차별점은 툴 조작 능력보다 좋은 이야기, 좋은 샷, 자연스러운 영상 문법을 고르는 사람의 시선으로 옮겨간다.
- 허준호 감독은 기획, 리서치, 시나리오, 이미지 설계, 영상 프롬프트, 반복 생성, 편집으로 이어지는 전체 워크플로를 통해 AI 영상 제작의 실제 난이도와 가능성을 설명한다.
- 핵심 문제는 “AI가 영상을 만들어주느냐”가 아니라, “사람이 원하는 이야기와 장면을 AI가 따라오게 만들 수 있느냐”이다.
🕒 시간순 섹션별 상세정리
1. AI 영상 제작에서 통제와 선택이 품질을 좌우한다
- 우유를 들고 나가는 인물, 어머니의 대사, 동생과 부딪히는 장면 하나를 설계하는 데도 약 4천 자 분량의 프롬프트가 사용된다 [01:31]
- 프롬프트를 세밀하게 통제하지 않아도 영상은 생성되지만, 통제 수준이 높을수록 원하는 결과에 가까워진다 [01:46]
2. 기획 단계는 개인의 이야기와 메타프롬프트로 출발한다
- 기획은 재미나이·클로드와 대화하듯 시작했지만, 일반적인 질문만으로는 충분히 깊은 이야기를 끌어내기 어려웠다 [02:31]
- 좋은 기획을 만들기 위해서는 개인의 경험과 이야기를 이끌어내는 메타프롬프트가 필요해졌다 [02:46]
3. 리서치는 실화성과 진정성을 확보하는 과정이다
- 기획과 리서치 단계에서는 실제로 존재하는 이야기인지, 현실의 근거가 있는지를 집중적으로 찾는다 [03:56]
- 강화도에서 있었던 이야기를 모티브로 삼은 사례처럼, 실화 여부는 서사의 설득력과 진정성을 높이는 요소가 된다 [04:11]
4. 시나리오는 작법 지식과 보조작가식 대화로 다듬어진다
- 시나리오 단계에서도 메타프롬프트를 활용해 작업의 방향과 기준을 잡는다 [05:03]
- 작품에 맞는 작법서 기준을 적용해 시놉시스, 캐릭터, 관계도, 캐릭터 연대기, 트리트먼트, 풀 시나리오까지 단계적으로 뽑아낼 수 있게 구성한다 [05:18]
5. 이미지·영상 설계는 시나리오 전체를 넣고 대량 후보를 줄이는 방식이다
- 시나리오가 완성되면 이미지 프로젝트와 영상 프로젝트를 별도로 나누어 만든다 [07:56]
- 기획과 시나리오 텍스트 전체를 넣어 이미지용·영상용 프롬프트가 작품의 전체 맥락을 이해한 상태에서 작동하게 한다 [08:11]
6. 캐릭터와 공간은 감정의 디테일까지 고정해야 일관성이 생긴다
- 진돗개의 잘린 귀, 폐지를 줍다 부은 할머니 손처럼 캐릭터의 감정을 드러내는 핵심 디테일을 먼저 정한다 [10:01]
- 이런 특징을 초기에 고정하면 이후 컷시트 전반에 반복되어 정서적 일관성이 유지된다 [10:16]
7. AI 영상도 자율성보다 마이크로 디렉션이 결과를 좌우한다
- 기존 영화 연출에는 모든 컷과 연기 톤을 촘촘히 통제하는 방식과 배우에게 해석의 여지를 주는 방식이 있다 [11:28]
- AI 영상에서는 공간과 배우를 설정하는 것만으로는 부족하며, 원하는 결과를 얻기 위해 세부 디렉션이 필요하다 [11:43]
8. 메타프롬프트와 프리비즈 테스트로 장면을 단계적으로 고친다
- 대사는 한글로 유지하되, 장면 지시문은 중국어로 구성해 프롬프트를 설계한다 [13:03]
- 다음 컷의 행동, 시간 분할, 대사 순서를 함께 명시해 생성 모델이 장면 흐름을 어긋나지 않게 따라가도록 한다 [13:18]
9. 반복 생성과 편집은 원하는 15초를 만드는 핵심 공정이다
- 시덴스에서는 엄마가 말하는 도중 아이가 “몰라 몰라”라고 끼어드는 식의 사운드 디렉팅이 가능하다 [14:47]
- 대사를 따로 생성해 얹는 방식보다 연기 흐름이 자연스럽고 덜 끊긴다 [15:02]
10. 압축형 영상은 광고 제작처럼 많은 샷과 영상 문법을 요구한다
- 편집 기술이 좋아진 음악 녹음처럼, AI 영상도 한 번에 완벽한 15초를 얻기는 어렵다 [16:57]
- 여러 생성본에서 좋은 구간을 골라 잘라 붙이는 방식으로 최종 완성도를 높인다 [17:12]
11. 컷 연결 문법과 공간 일관성이 AI 영상의 진짜 품질을 가른다
- 냉장고가 열리는 방향, 여자아이의 이동 방향처럼 전후 컷의 동선이 어긋나면 해당 샷은 사용하지 않는다 [20:01]
- 기본 영상 문법을 지키려는 기준 때문에 50~60장까지 재생성을 감수하게 된다 [20:16]
12. 도구의 상향평준화 이후 변별력은 이야기와 연출 디테일로 이동한다
- 클링 3.0과 시덴스의 등장으로, 과거에는 숙련자만 만들 수 있던 수준의 결과물을 누구나 만들 수 있게 됐다 [21:44]
- 기존 영상 제작자들은 자신만의 영역이 빠르게 사라지는 데서 큰 스트레스를 느낀다 [21:59]
13. AI 시대 영상 문법은 짧고 자극적인 숏폼 드라마 쪽으로 기운다
- 10대는 5분 이상 길이의 영상을 잘 보지 않는다 [24:51]
- 한국 드라마와 롱폼 콘텐츠는 주로 40~50대가 소비하고, 10대와 20대는 유명작을 제외하면 유튜브 중심으로 콘텐츠를 소비한다 [25:06]
14. AI 제작도 혼자 끝나는 일이 아니라 팀과 하이브리드 구조가 필요해진다
- 충분한 예산이 있어 실제 배우 촬영까지 가능한 상황이라면 AI만 고집할 필요는 없다 [27:07]
- 현실적인 제작 방식은 배우와 AI를 섞는 하이브리드 구조에 가깝다 [27:22]
15. 다큐멘터리와 방송 영역에서도 AI 영상 대체가 빠르게 넓어진다
- 다큐멘터리에서는 재연 영상, 조선 시대 장면, 역사 고증 장면처럼 기존에는 실사 촬영이 필요했던 영역에 AI 영상이 많이 쓰인다 [28:27]
- 비용과 촬영 조건 때문에 구현하기 어려웠던 장면을 AI가 대체할 수 있다 [28:42]
16. AI 영상에서 영화 문법과 공간 연속성을 통제하는 어려움
- 소개된 작품은 시덴스와 클링이 나오기 전, BO 3.1만으로 제작된 작품이었다 [30:15]
- 영화사 관계자들이 수업에 많이 올 만큼, 초기 AI 영상 제작에서 영화 문법을 지킨 사례로 주목받았다 [30:30]
17. AI 영상 경험의 격차와 올해 안에 움직여야 하는 이유
- AI 시대에는 도구를 실제로 써 본 사람과 써 보지 않은 사람의 격차가 분명하게 갈린다 [32:31]
- 기업에서도 AI 사용 경험의 유무가 이미 중요한 판단 기준이 되고 있다 [32:46]
🧾 결론
- AI 영상 제작은 “프롬프트를 넣으면 영상이 나온다”는 수준을 넘어, 감독이 장면을 설계하고 배우·공간·감정·컷 연결을 통제하는 연출 행위로 설명된다.
- 허준호 감독이 강조한 핵심은 AI의 자율성에 맡기는 것이 아니라, 사람이 먼저 좋은 이야기와 샷을 고르고 AI를 보조작가·미술팀·프리비즈 도구처럼 활용하는 방식이다.
- 특히 숏폼 드라마처럼 짧은 시간 안에 많은 정보를 압축해야 하는 포맷에서는 프롬프트의 정교함, 반복 생성, 편집 선택 능력이 완성도를 좌우한다.
- AI 도구가 쉬워질수록 단순 제작 능력의 희소성은 낮아지고, 기존 영화 문법을 이해하며 장면의 연결감과 감정 밀도를 만드는 사람이 더 두드러질 가능성이 크다.
- 검증이 필요한 내용으로는 중국·미국 숏폼 드라마 시장 규모, 특정 AI 사극 드라마의 2억 뷰 사례, 향후 5년 안에 웹툰 IP 기반 AI 숏폼이 흥행할 가능성 등이 있다.
📈 투자·시사 포인트
- AI 영상 시장의 초기 기회는 생성 모델 자체보다, 기획·시나리오·캐릭터 시트·프리비즈·편집까지 연결하는 제작 워크플로와 운영 역량에 있을 가능성이 크다.
- 숏폼 드라마, 웹툰 IP 영상화, 다큐멘터리 재연 장면, 방송 그래픽 같은 분야는 저예산·고빈도 제작 수요가 크기 때문에 AI 영상 도입의 실사용처가 될 수 있다.
- 클링, 시덴스 등 생성 도구가 상향평준화되면 개별 툴의 기능 차이보다, 제작자가 축적한 프롬프트 템플릿, 영상 문법 데이터, 캐릭터·공간 일관성 관리 노하우가 차별화 요소가 된다.
- 기존 영상 제작자는 AI를 대체 위협으로만 보기보다, 프리비즈·VFX·광고 제작 문법과 결합해 더 빠른 콘셉트 검증과 하이브리드 제작을 시도필요가 있다.
- 창작자 관점에서는 올해 안에 직접 AI 영상 제작을 경험해 보는 것이 중요하다는 메시지가 나온다. 다만 “마지막 기회”나 “좋은 결과를 기대할 수 있다”는 전망은 개인 사례에 기반한 주장으로, 일반화에는 추가 검증이 필요하다.
⚠️ 불확실하거나 확인이 필요한 부분
- 중국과 미국의 숏폼 드라마 시장 규모, 국가 지원 사업 확대, AI 숏폼 드라마의 실제 산업적 성장세는 영상 내 발언에 기반한 내용이므로 별도 시장 자료로 확인이 필요하다.
- “2분짜리 50~70편을 약 2억 원 안에서 만들어야 한다”는 제작비 구조는 특정 숏폼 드라마 제작 환경을 설명한 것으로 보이며, 모든 숏폼 제작에 일반화하기는 어렵다.
- 시덴스에서 중국어 프롬프트를 쓰면 한글·영어보다 더 많은 디렉션을 4,000자 제한 안에 넣을 수 있다는 설명은 실제 모델별 토큰 처리 방식과 언어별 압축 효율을 추가 확인해야 한다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- AI 영상 제작을 시작할 때 기획, 리서치, 시나리오, 이미지 설계, 영상 프롬프트, 생성, 편집으로 이어지는 기본 워크플로를 문서화한다.
- 단순히 “좋은 소재를 추천해 달라”고 묻기보다 개인 경험, 감정, 가치관을 끌어내는 기획용 메타프롬프트를 먼저 만든다.
- 실화에서 모티브를 얻을 경우, 실제 사건의 감정과 구조는 참고하되 인물·장소·세부 사건을 직접 재현하지 않도록 법적 리스크를 점검한다.
- 시나리오 생성 전 AI에게 적용할 작법 기준, 캐릭터 관계도, 연대기, 트리트먼트 형식을 명확히 지정한다.
❓ 열린 질문
- AI 영상 제작에서 프롬프트 통제와 편집 후반작업 중 실제 품질에 더 큰 영향을 주는 단계는 무엇인가?
- 숏폼 드라마처럼 짧고 자극적인 문법이 AI 영상의 주류가 될 경우, 긴 호흡의 영화적 서사는 어떤 방식으로 살아남을 수 있을까?
- AI 영상에서 실화 기반의 진정성을 확보하면서도 법적·윤리적 문제를 피하려면 어느 정도까지 변형해야 할까?