YouTube티타임즈TV·2026년 5월 26일·0

AI 영상의 ''불쾌한 골짜기''를 넘어설 수 있는 방법은? (허준호 감독)

Quick Summary

AI 영상의 ‘불쾌한 골짜기’를 넘는 핵심은 완벽한 기술보다 서사·음악·대사·연출이 결합된 감정 몰입에 있다.

영상 보기

클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.

원본 열기

🖼️ 인포그래픽

AI 영상의 ''불쾌한 골짜기''를 넘어설 수 있는 방법은? (허준호 감독) 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

AI 영상의 ''불쾌한 골짜기''를 넘어설 수 있는 방법은? (허준호 감독) 내용을 설명하는 본문 이미지

💡 한 줄 결론

AI 영상의 ‘불쾌한 골짜기’를 넘는 핵심은 완벽한 기술보다 서사·음악·대사·연출이 결합된 감정 몰입에 있다.

📌 핵심 요점

  1. AI 영상은 과거에는 사용 여부 자체가 논란이었지만, 이제는 AI 부문 신설과 일반 영화제 수상 사례를 통해 하나의 표현 도구로 인정받는 단계에 들어섰다.
  2. 허준호 감독의 작품은 우주·로봇·휴머노이드 중심의 기존 AI 영상 흐름과 달리 이민자, 가족, 저출산, 부모의 감정 같은 사람의 이야기를 전면에 두며 차별화됐다.
  3. AI 실사 영상에는 여전히 가짜처럼 보이는 순간과 기술적 어색함이 있지만, 관객은 강한 서사와 감정선이 있을 때 그 불편함보다 이야기의 울림에 더 반응한다.
  4. 최신 AI 영상 도구는 캐릭터의 말하기, 연기, 주변 소리, 장면 연속성, 캐릭터 일관성을 강화하면서 이미지 중심 제작에서 스토리보드·프롬프트 중심의 연출 통제로 이동하고 있다.
  5. 제작 워크플로는 기획, 리서치, 시나리오, 스토리보드, 저해상도 프리비주얼, 본 영상 생성, 편집·사운드·자막 후반 작업으로 이어지며, AI 영상도 점점 영화 제작에 가까운 구조를 갖추고 있다.

🧩 배경과 문제 정의

  • AI 영상은 과거 출품작의 AI 사용 여부만으로도 논란이 될 만큼 불신을 받았지만, 이제는 AI 전용 부문이 생기고 일반 영화제에서도 수상 사례가 나오며 하나의 표현 도구로 인정받기 시작했다.
  • 허준호 감독의 작품은 우주·로봇 중심의 AI 영상 흐름과 달리, 이민자·가족·감정처럼 사람의 서사를 전면에 내세워 기술적 어색함을 감정적 울림으로 보완했다.
  • AI 영상의 ‘불쾌한 골짜기’는 여전히 남아 있지만, 서사·연출·음악·대사가 충분히 결합되면 관객은 기술적 어색함보다 이야기의 감정과 메시지에 더 크게 반응한다.
  • 패션 사업과 SNS 콘텐츠 경험을 가진 창작자가 AI 도구를 학습하고 조합해 영화제 수상작을 만들었다는 점은, 영상 제작의 진입 장벽과 창작자의 경로가 빠르게 달라지고 있음을 보여준다.

🕒 시간순 섹션별 상세정리

1. AI 영화제 수상과 국제적 반응

  • 허준호 감독은 AI 영화계에서 규모 있는 크로마 어워드에서 톱 11에 선정됐다 [02:17]
  • 뉴욕·할리우드권 영화제와 일반 영화제에서도 AI 작품 수상이 이어지며, AI 영상이 공식적으로 인정받는 사례가 늘고 있다 [02:32]

2. AI 영상의 한계와 서사의 힘

  • AI 영상은 현업 영화 제작에 투입되는 시간과 노고에 비하면 아직 완성도 면에서 한계가 있다 [03:17]
  • 그러나 개인의 이야기를 시각적으로 표현하는 도구로서는 충분히 인정받는 단계에 들어섰다 [03:32]

3. 패션·SNS 경험에서 AI 영상 제작으로 이동

  • 허준호 감독의 작품은 뮤직비디오에 가까운 형식과 짧은 러닝타임 덕분에 접근성이 높다 [04:48]
  • 영상 문법은 1990년대 대형 뮤직비디오처럼 이미지와 감정을 결합해 전달하는 방식에 가깝다 [05:03]

4. 독학과 음악형 대사로 만든 초기 제작 방식

  • AI 뮤직비디오 사례를 보며 5초 단위 이미지 클립을 이어 3~5분짜리 영상으로 구성할 수 있다고 판단했다 [06:39]
  • 정규 영화 교육을 거치기보다 AI 도구를 직접 익히며 영상 제작 방식을 독학하기 시작했다 [06:54]

5. AI 네이티브 워크플로와 감정 중심 장르화

  • 제미나이, 챗GPT, 클로드를 활용해 글쓰기, 이미지 제작, 영상 제작의 역할을 나눠 작업했다 [07:33]
  • 감독·영화·소설 관련 학습 데이터를 바탕으로 여러 AI 도구를 조합하는 제작 흐름을 구축했다 [07:48]

6. 불쾌한 골짜기를 서사로 넘기려는 제작 기준

  • AI 실사 영상에는 아직 가짜처럼 느껴지는 순간이 남아 있다 [10:11]
  • 기업 미팅이나 영화제에서도 실제 영화풍보다 애니메이션풍 결과물이 선택되는 경우가 더 많다 [10:26]

7. 가족 사례에서 로봇 액션이 감정 서사로 바뀌는 방식

  • 아들이 테슬라와 사이버트럭을 좋아한다는 개인적 맥락이 영상의 출발점이 됐다 [11:32]
  • 가족이 등장하는 설정은 단순한 로봇 액션에 현실적인 감정을 부여했다 [11:47]

8. 음악과 기대치가 AI 영상의 몰입을 바꾸는 과정

  • 개별 컷만 보면 AI 특유의 어색함은 여전히 드러난다 [13:24]
  • 그러나 몇 초 이상 흐름을 따라가면 관객은 작품 안으로 들어가고 감정 반응도 커질 수 있다 [13:39]

9. 뮤직비디오형 제작에서 드라마형 시네마틱 제작으로 이동

  • 당시에는 립싱크와 음성 구현이 어려워 꼭 필요한 대사 구간만 소라 2로 제작했다 [15:34]
  • 나머지 감정 흐름은 음악 중심으로 구성해 기술적 한계를 보완했다 [15:49]

10. 최신 AI 영상 도구가 제작 패러다임을 바꾸는 지점

  • 시덴스와 클링 3.0 이후 캐릭터가 말하고 연기하며 주변 소리까지 함께 담을 수 있게 됐다 [16:31]
  • 작년처럼 소리와 효과음을 별도 도구로 일일이 추가해야 하는 부담도 줄었다 [16:46]

11. 스토리보드와 프롬프트만으로 장면 흐름을 통제하는 방식

  • 파쿠르 장면에서는 할머니의 반응, 옷을 갈아입는 남성, 파이프 위 고양이, 마지막 윙크까지 세부 사건을 프롬프트에 담았다 [20:04]
  • 입력한 사건들은 스토리보드 순서에 맞춰 이어지며 하나의 장면 흐름을 만든다 [20:19]

12. 시덴스 2.0의 장면 연속성과 캐릭터 일관성

  • 두 남녀가 태권도 겨루기를 하다가 여성이 발차기로 남성을 박스에 박히게 한다는 짧은 텍스트만으로도 장면이 생성된다 [22:04]
  • 인물 이미지와 액션의 분위기까지 텍스트 기반으로 구성된다 [22:19]

13. 음성·캐릭터 유지와 텍스트 기반 영화화의 가능성

  • 이전 장면에 등장한 여성과 남성의 목소리가 다음 장면에서도 유지된다 [24:16]
  • 같은 인물들이 카페 손님과 바리스타로 설정이 바뀌어도 음성 정체성은 계속된다 [24:31]

14. 창작자의 통제권 확대와 영상 입력 기반 변형의 리스크

  • 이미지 때문에 작업이 막히는 상황은 줄어들었다 [25:59]
  • 영화의 무드를 스타일 레퍼런스로 넣으면 해당 분위기가 영상 전체에 반영돼 장면 설계가 쉬워진다 [26:14]

15. 도구별 강점, 비용 구조, 초보자 선택지

  • 시덴스 2.0은 현재 매우 뛰어난 결과를 내지만 1080p 중심이라는 해상도 한계가 있다 [27:26]
  • 가격 부담이 크고 결과물에는 시덴스 특유의 질감도 남는다 [27:41]

16. 이미지 중심 설계에서 프리비주얼 중심 워크플로로 전환

  • 초기에는 이미지 자체가 영상이 되기 때문에 이미지를 중심으로 구조를 짜야 한다고 봤다 [30:02]
  • 현재 AI 영상 제작은 이미지 중심에서 더 넓은 사전 설계 중심으로 이동하고 있다 [30:17]

17. 편집·사운드·자막까지 이어지는 통합 제작 흐름

  • 편집 단계에서는 캡컷을 사용한다 [30:21]
  • 영상을 먼저 만든 뒤 사운드를 별도로 붙이며 후반 작업을 이어간다 [30:36]

🧾 결론

  • 이 영상의 핵심은 AI 영상의 품질 논쟁보다 “무엇을 이야기할 것인가”가 더 중요해지고 있다는 점이다.
  • 허준호 감독의 사례는 기술적으로 완벽하지 않은 AI 영상도 개인적 경험, 가족 서사, 사회적 맥락, 음악적 감정선이 결합되면 관객에게 충분한 몰입과 감동을 줄 수 있음을 보여준다.
  • ‘불쾌한 골짜기’는 단순히 그래픽 자연스러움의 문제가 아니라 관객이 인물과 상황을 감정적으로 받아들이느냐의 문제로 확장된다.
  • AI 도구의 발전은 창작자의 진입 장벽을 낮추고 있지만, 동시에 스토리보드, 장면 설계, 음악 선택, 대사 배치 같은 연출 역량의 중요성을 더 크게 만들고 있다.
  • 검증이 필요한 부분은 각 도구의 실제 가격, 해상도 정책, 도구별 성능 우위가 업로드 시점 이후에도 유지되는지 여부다.

📈 투자·시사 포인트

  • AI 영상 시장의 경쟁력은 단순 생성 품질에서 캐릭터 일관성, 장면 연속성, 음성 유지, 사운드 통합, 스토리보드 기반 제어력으로 이동하고 있다.
  • 광고·패션 필름·브랜드 콘텐츠 영역에서는 클링처럼 캐릭터와 의상 디테일을 정교하게 유지하는 도구와, 시덴스처럼 드라마·영화적 장면 구현에 강한 도구가 서로 다른 수요를 만들 가능성이 있다.
  • 개인 창작자에게는 비용 구조가 중요한 변수다. 고가 도구는 품질과 통제력을 제공하지만, 저가 또는 입문용 도구는 학습과 실험의 저변을 넓히는 역할을 할 수 있다.
  • AI 영상 제작이 보편화될수록 차별화 요소는 도구 사용 능력 자체보다 자기 이야기, 감정 설계, 음악 감각, 장면 구성, 프롬프트 기반 연출력으로 옮겨갈 가능성이 크다.
  • 영화제와 상업 제작 현장에서 AI 영상 수용 사례가 늘어나는 흐름은 AI 영상이 별도 실험 장르를 넘어 실제 콘텐츠 제작 방식의 일부로 편입되고 있음을 시사한다.

⚠️ 불확실하거나 확인이 필요한 부분

  • 크로마 어워드, 뉴욕·할리우드권 영화제, 일반 영화제 수상 및 오피셜 셀렉 약 25곳이라는 언급은 영상 속 발언 기준으로 정리된 내용이며, 각 영화제의 공식 수상·선정 기록은 별도 확인이 필요하다.
  • 부산국제영화제와 부천판타스틱영화제에 AI 부문이 생겼다는 설명은 발언 맥락상 AI 영상에 대한 인식 변화 사례로 제시되었지만, 해당 부문의 정확한 명칭·운영 방식·연도는 공식 자료 확인이 필요하다.
  • 시덴스 2.0, 클링 3.0, 그록, 비오, 배우 등 도구별 성능·가격·해상도 비교는 영상 촬영 시점의 경험과 평가에 기반한 것으로 보이며, 현재 요금제와 기능은 변동 가능성이 높다.
  • 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
  • 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
  • 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

  • AI 영상 제작을 시작할 때 먼저 기술 시연보다 “누구의 어떤 감정과 사연을 전달할 것인가”를 한 문장으로 정리한다.
  • 짧은 영상이라도 기획, 리서치, 시나리오, 스토리보드, 프리비주얼, 본 제작, 편집·사운드 순서의 워크플로를 만든다.
  • 실사풍 AI 영상에서 어색함이 예상되는 장면은 음악, 내레이션, 대사, 가족·개인 서사 같은 감정 장치로 보완할 방법을 함께 설계한다.
  • 제작 도구를 고를 때 시덴스는 드라마·영화적 장면, 클링은 캐릭터·의상 일관성이 중요한 광고형 작업, 저비용 실험은 그록·비오 계열처럼 목적별로 나눠 테스트한다.

❓ 열린 질문

  • AI 영상에서 관객이 기술적 어색함을 잊고 몰입하게 만드는 최소한의 서사 조건은 무엇인가?
  • 앞으로 AI 영상이 영화제에서 별도 부문으로 남을지, 아니면 일반 영상·영화 부문 안으로 자연스럽게 통합될지 지켜볼 필요가 있다.
  • 창작자가 기존 영화의 톤앤무드나 장면 구조를 참고해 AI 영상을 만들 때, 어디까지가 합법적·윤리적 레퍼런스이고 어디서부터 문제가 되는가?

관련 문서

공통 태그와 주제 흐름을 기준으로 같이 보면 좋은 문서를 이어서 제안합니다.