AI 영상의 ''불쾌한 골짜기''를 넘어설 수 있는 방법은? (허준호 감독)
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
AI 영상의 ‘불쾌한 골짜기’를 넘는 핵심은 완벽한 기술보다 서사·음악·대사·연출이 결합된 감정 몰입에 있다.
📌 핵심 요점
- AI 영상은 과거에는 사용 여부 자체가 논란이었지만, 이제는 AI 부문 신설과 일반 영화제 수상 사례를 통해 하나의 표현 도구로 인정받는 단계에 들어섰다.
- 허준호 감독의 작품은 우주·로봇·휴머노이드 중심의 기존 AI 영상 흐름과 달리 이민자, 가족, 저출산, 부모의 감정 같은 사람의 이야기를 전면에 두며 차별화됐다.
- AI 실사 영상에는 여전히 가짜처럼 보이는 순간과 기술적 어색함이 있지만, 관객은 강한 서사와 감정선이 있을 때 그 불편함보다 이야기의 울림에 더 반응한다.
- 최신 AI 영상 도구는 캐릭터의 말하기, 연기, 주변 소리, 장면 연속성, 캐릭터 일관성을 강화하면서 이미지 중심 제작에서 스토리보드·프롬프트 중심의 연출 통제로 이동하고 있다.
- 제작 워크플로는 기획, 리서치, 시나리오, 스토리보드, 저해상도 프리비주얼, 본 영상 생성, 편집·사운드·자막 후반 작업으로 이어지며, AI 영상도 점점 영화 제작에 가까운 구조를 갖추고 있다.
🧩 배경과 문제 정의
- AI 영상은 과거 출품작의 AI 사용 여부만으로도 논란이 될 만큼 불신을 받았지만, 이제는 AI 전용 부문이 생기고 일반 영화제에서도 수상 사례가 나오며 하나의 표현 도구로 인정받기 시작했다.
- 허준호 감독의 작품은 우주·로봇 중심의 AI 영상 흐름과 달리, 이민자·가족·감정처럼 사람의 서사를 전면에 내세워 기술적 어색함을 감정적 울림으로 보완했다.
- AI 영상의 ‘불쾌한 골짜기’는 여전히 남아 있지만, 서사·연출·음악·대사가 충분히 결합되면 관객은 기술적 어색함보다 이야기의 감정과 메시지에 더 크게 반응한다.
- 패션 사업과 SNS 콘텐츠 경험을 가진 창작자가 AI 도구를 학습하고 조합해 영화제 수상작을 만들었다는 점은, 영상 제작의 진입 장벽과 창작자의 경로가 빠르게 달라지고 있음을 보여준다.
🕒 시간순 섹션별 상세정리
1. AI 영화제 수상과 국제적 반응
- 허준호 감독은 AI 영화계에서 규모 있는 크로마 어워드에서 톱 11에 선정됐다 [02:17]
- 뉴욕·할리우드권 영화제와 일반 영화제에서도 AI 작품 수상이 이어지며, AI 영상이 공식적으로 인정받는 사례가 늘고 있다 [02:32]
2. AI 영상의 한계와 서사의 힘
- AI 영상은 현업 영화 제작에 투입되는 시간과 노고에 비하면 아직 완성도 면에서 한계가 있다 [03:17]
- 그러나 개인의 이야기를 시각적으로 표현하는 도구로서는 충분히 인정받는 단계에 들어섰다 [03:32]
3. 패션·SNS 경험에서 AI 영상 제작으로 이동
- 허준호 감독의 작품은 뮤직비디오에 가까운 형식과 짧은 러닝타임 덕분에 접근성이 높다 [04:48]
- 영상 문법은 1990년대 대형 뮤직비디오처럼 이미지와 감정을 결합해 전달하는 방식에 가깝다 [05:03]
4. 독학과 음악형 대사로 만든 초기 제작 방식
- AI 뮤직비디오 사례를 보며 5초 단위 이미지 클립을 이어 3~5분짜리 영상으로 구성할 수 있다고 판단했다 [06:39]
- 정규 영화 교육을 거치기보다 AI 도구를 직접 익히며 영상 제작 방식을 독학하기 시작했다 [06:54]
5. AI 네이티브 워크플로와 감정 중심 장르화
- 제미나이, 챗GPT, 클로드를 활용해 글쓰기, 이미지 제작, 영상 제작의 역할을 나눠 작업했다 [07:33]
- 감독·영화·소설 관련 학습 데이터를 바탕으로 여러 AI 도구를 조합하는 제작 흐름을 구축했다 [07:48]
6. 불쾌한 골짜기를 서사로 넘기려는 제작 기준
- AI 실사 영상에는 아직 가짜처럼 느껴지는 순간이 남아 있다 [10:11]
- 기업 미팅이나 영화제에서도 실제 영화풍보다 애니메이션풍 결과물이 선택되는 경우가 더 많다 [10:26]
7. 가족 사례에서 로봇 액션이 감정 서사로 바뀌는 방식
- 아들이 테슬라와 사이버트럭을 좋아한다는 개인적 맥락이 영상의 출발점이 됐다 [11:32]
- 가족이 등장하는 설정은 단순한 로봇 액션에 현실적인 감정을 부여했다 [11:47]
8. 음악과 기대치가 AI 영상의 몰입을 바꾸는 과정
- 개별 컷만 보면 AI 특유의 어색함은 여전히 드러난다 [13:24]
- 그러나 몇 초 이상 흐름을 따라가면 관객은 작품 안으로 들어가고 감정 반응도 커질 수 있다 [13:39]
9. 뮤직비디오형 제작에서 드라마형 시네마틱 제작으로 이동
- 당시에는 립싱크와 음성 구현이 어려워 꼭 필요한 대사 구간만 소라 2로 제작했다 [15:34]
- 나머지 감정 흐름은 음악 중심으로 구성해 기술적 한계를 보완했다 [15:49]
10. 최신 AI 영상 도구가 제작 패러다임을 바꾸는 지점
- 시덴스와 클링 3.0 이후 캐릭터가 말하고 연기하며 주변 소리까지 함께 담을 수 있게 됐다 [16:31]
- 작년처럼 소리와 효과음을 별도 도구로 일일이 추가해야 하는 부담도 줄었다 [16:46]
11. 스토리보드와 프롬프트만으로 장면 흐름을 통제하는 방식
- 파쿠르 장면에서는 할머니의 반응, 옷을 갈아입는 남성, 파이프 위 고양이, 마지막 윙크까지 세부 사건을 프롬프트에 담았다 [20:04]
- 입력한 사건들은 스토리보드 순서에 맞춰 이어지며 하나의 장면 흐름을 만든다 [20:19]
12. 시덴스 2.0의 장면 연속성과 캐릭터 일관성
- 두 남녀가 태권도 겨루기를 하다가 여성이 발차기로 남성을 박스에 박히게 한다는 짧은 텍스트만으로도 장면이 생성된다 [22:04]
- 인물 이미지와 액션의 분위기까지 텍스트 기반으로 구성된다 [22:19]
13. 음성·캐릭터 유지와 텍스트 기반 영화화의 가능성
- 이전 장면에 등장한 여성과 남성의 목소리가 다음 장면에서도 유지된다 [24:16]
- 같은 인물들이 카페 손님과 바리스타로 설정이 바뀌어도 음성 정체성은 계속된다 [24:31]
14. 창작자의 통제권 확대와 영상 입력 기반 변형의 리스크
- 이미지 때문에 작업이 막히는 상황은 줄어들었다 [25:59]
- 영화의 무드를 스타일 레퍼런스로 넣으면 해당 분위기가 영상 전체에 반영돼 장면 설계가 쉬워진다 [26:14]
15. 도구별 강점, 비용 구조, 초보자 선택지
- 시덴스 2.0은 현재 매우 뛰어난 결과를 내지만 1080p 중심이라는 해상도 한계가 있다 [27:26]
- 가격 부담이 크고 결과물에는 시덴스 특유의 질감도 남는다 [27:41]
16. 이미지 중심 설계에서 프리비주얼 중심 워크플로로 전환
- 초기에는 이미지 자체가 영상이 되기 때문에 이미지를 중심으로 구조를 짜야 한다고 봤다 [30:02]
- 현재 AI 영상 제작은 이미지 중심에서 더 넓은 사전 설계 중심으로 이동하고 있다 [30:17]
17. 편집·사운드·자막까지 이어지는 통합 제작 흐름
- 편집 단계에서는 캡컷을 사용한다 [30:21]
- 영상을 먼저 만든 뒤 사운드를 별도로 붙이며 후반 작업을 이어간다 [30:36]
🧾 결론
- 이 영상의 핵심은 AI 영상의 품질 논쟁보다 “무엇을 이야기할 것인가”가 더 중요해지고 있다는 점이다.
- 허준호 감독의 사례는 기술적으로 완벽하지 않은 AI 영상도 개인적 경험, 가족 서사, 사회적 맥락, 음악적 감정선이 결합되면 관객에게 충분한 몰입과 감동을 줄 수 있음을 보여준다.
- ‘불쾌한 골짜기’는 단순히 그래픽 자연스러움의 문제가 아니라 관객이 인물과 상황을 감정적으로 받아들이느냐의 문제로 확장된다.
- AI 도구의 발전은 창작자의 진입 장벽을 낮추고 있지만, 동시에 스토리보드, 장면 설계, 음악 선택, 대사 배치 같은 연출 역량의 중요성을 더 크게 만들고 있다.
- 검증이 필요한 부분은 각 도구의 실제 가격, 해상도 정책, 도구별 성능 우위가 업로드 시점 이후에도 유지되는지 여부다.
📈 투자·시사 포인트
- AI 영상 시장의 경쟁력은 단순 생성 품질에서 캐릭터 일관성, 장면 연속성, 음성 유지, 사운드 통합, 스토리보드 기반 제어력으로 이동하고 있다.
- 광고·패션 필름·브랜드 콘텐츠 영역에서는 클링처럼 캐릭터와 의상 디테일을 정교하게 유지하는 도구와, 시덴스처럼 드라마·영화적 장면 구현에 강한 도구가 서로 다른 수요를 만들 가능성이 있다.
- 개인 창작자에게는 비용 구조가 중요한 변수다. 고가 도구는 품질과 통제력을 제공하지만, 저가 또는 입문용 도구는 학습과 실험의 저변을 넓히는 역할을 할 수 있다.
- AI 영상 제작이 보편화될수록 차별화 요소는 도구 사용 능력 자체보다 자기 이야기, 감정 설계, 음악 감각, 장면 구성, 프롬프트 기반 연출력으로 옮겨갈 가능성이 크다.
- 영화제와 상업 제작 현장에서 AI 영상 수용 사례가 늘어나는 흐름은 AI 영상이 별도 실험 장르를 넘어 실제 콘텐츠 제작 방식의 일부로 편입되고 있음을 시사한다.
⚠️ 불확실하거나 확인이 필요한 부분
- 크로마 어워드, 뉴욕·할리우드권 영화제, 일반 영화제 수상 및 오피셜 셀렉 약 25곳이라는 언급은 영상 속 발언 기준으로 정리된 내용이며, 각 영화제의 공식 수상·선정 기록은 별도 확인이 필요하다.
- 부산국제영화제와 부천판타스틱영화제에 AI 부문이 생겼다는 설명은 발언 맥락상 AI 영상에 대한 인식 변화 사례로 제시되었지만, 해당 부문의 정확한 명칭·운영 방식·연도는 공식 자료 확인이 필요하다.
- 시덴스 2.0, 클링 3.0, 그록, 비오, 배우 등 도구별 성능·가격·해상도 비교는 영상 촬영 시점의 경험과 평가에 기반한 것으로 보이며, 현재 요금제와 기능은 변동 가능성이 높다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- AI 영상 제작을 시작할 때 먼저 기술 시연보다 “누구의 어떤 감정과 사연을 전달할 것인가”를 한 문장으로 정리한다.
- 짧은 영상이라도 기획, 리서치, 시나리오, 스토리보드, 프리비주얼, 본 제작, 편집·사운드 순서의 워크플로를 만든다.
- 실사풍 AI 영상에서 어색함이 예상되는 장면은 음악, 내레이션, 대사, 가족·개인 서사 같은 감정 장치로 보완할 방법을 함께 설계한다.
- 제작 도구를 고를 때 시덴스는 드라마·영화적 장면, 클링은 캐릭터·의상 일관성이 중요한 광고형 작업, 저비용 실험은 그록·비오 계열처럼 목적별로 나눠 테스트한다.
❓ 열린 질문
- AI 영상에서 관객이 기술적 어색함을 잊고 몰입하게 만드는 최소한의 서사 조건은 무엇인가?
- 앞으로 AI 영상이 영화제에서 별도 부문으로 남을지, 아니면 일반 영상·영화 부문 안으로 자연스럽게 통합될지 지켜볼 필요가 있다.
- 창작자가 기존 영화의 톤앤무드나 장면 구조를 참고해 AI 영상을 만들 때, 어디까지가 합법적·윤리적 레퍼런스이고 어디서부터 문제가 되는가?