구글 업데이트 내놨습니다... AI로 원하는 부분만 편집, 기획까지

🖼️ 인포그래픽

구글 업데이트 내놨습니다... AI로 원하는 부분만 편집, 기획까지 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 결론

Gemini Omni가 Google Flow에 합쳐지면서 AI로 원하는 부분만 편집하는 기능이 단발 생성형 비디오를 누적형 창작 플랫폼으로 바꾸는 흐름을 보여준다.

📌 핵심 요점

기존 생성형 비디오 AI는 그럴듯한 영상을 처음부터 만드는 데는 강했지만, 특정 객체·배경·스타일만 바꾸고 원래 의도를 유지하는 통제력은 약했다.
Gemini Omni Flash가 Google Flow에 들어오면서 영상 속 일부 요소만 자연어로 선택해 바꾸는 부분 편집이 가능해졌고, 인물·카메라 무빙·광원·렌즈 특성 같은 일관성을 유지하는 방향이 강조됐다.
서핑 영상, 춤추는 캐릭터 영상, 인플루언서 브이로그 사례에서는 배경 전환, 객체 일괄 교체, 인물·렌즈 일관성 유지 등 단순 필터보다 깊은 수준의 영상 재구성이 시연됐다.
Flow Agent는 대사 작성, 플롯 제안, 다중 시안 생성, 배치 편집을 한 워크플로우로 묶으면서 사용자가 결과물을 계속 쌓고 수정하는 제작 파트너에 가까운 역할을 한다.
영상 내용 기준으로 Google Flow의 방향은 개별 AI 기능 추가보다 기획·생성·편집·피드백·도구 확장을 하나로 묶는 창작 플랫폼 전환에 있으며, 생성량 증가와 컴퓨팅 수요 확대가 함께 언급됐다.

🧩 배경과 문제 정의

기존 생성형 비디오 AI는 프롬프트만으로 그럴싸한 영상을 처음부터 만들어낼 수 있었지만, 이미 만들어진 영상에서 특정 객체·배경·스타일 같은 일부 디테일만 바꾸고 전체 의도와 장면 일관성을 유지하는 통제력은 약했다.
이 한계 때문에 작은 수정 하나를 위해서도 영상을 다시 생성해야 했고, 그 과정에서 원래 장면의 인물, 구도, 분위기, 동작이 달라지는 문제가 반복됐다.
Gemini Omni Flash가 Google Flow 안에 들어오면서, 영상 일부를 골라 바꾸는 부분 편집이 별도 후반 작업이 아니라 창작 워크플로우 안으로 들어오는 흐름이 제시된다.
이번 변화의 핵심은 단순히 “AI가 영상을 더 잘 만든다”가 아니라, 기획, 생성, 수정, 버전 비교, 피드백을 한 플랫폼 안에서 반복하는 제작 환경으로 이동한다는 점이다.
영상 제작자는 처음부터 완성본을 한 번에 뽑는 방식보다, 원하는 방향을 정하고 여러 시안을 만들고 특정 요소만 고치며 결과물을 누적적으로 다듬는 방식에 가까워진다.
다만 실제 서비스에서 어느 정도의 품질, 비용, 속도, 사용 가능 범위로 제공되는지는 제공된 section-detail만으로는 단정할 수 없으며 별도 검증이 필요하다.

🕒 시간순 섹션별 상세정리

Flow 업데이트와 창작 플랫폼 전환

이번 업데이트는 단일 기능 추가라기보다 Google이 Flow를 AI 영상 제작의 중심 플랫폼으로 확장하고 있다는 맥락에서 묶인다 [00:09]
핵심은 Omni 편집 기능 하나가 아니라, Flow가 기획부터 생성과 수정까지 이어지는 창작 환경으로 자리 잡는다는 점이다 [00:24]
Gemini Omni Flash가 Google Flow 안에 들어가면서 영상 제작자는 생성된 결과물을 다시 처음부터 만들기보다, 기존 장면을 유지한 채 원하는 부분을 수정하는 흐름으로 이동할 수 있게 된다 [00:31]
Flow는 단순 생성 도구가 아니라 AI 크리에이티브 스튜디오처럼 기획, 생성, 수정 과정을 함께 담는 방향으로 드러난다 [00:46]

기존 생성형 비디오의 한계와 Omni의 부분 편집

기존 생성형 비디오 모델은 프롬프트만으로 보기 좋은 영상을 만들 수 있었지만, 사용자의 세부 의도를 정확하게 통제해 반영하기는 어려웠다 [01:14]
Sora 같은 생성형 비디오 모델도 결과물의 완성도와 별개로, 특정 장면 요소를 정확히 유지하거나 바꾸는 데에는 한계가 있었다고 압축된다 [01:29]
작은 디테일 하나를 고치려 해도 전체 영상을 다시 생성해야 하는 문제가 있었고, 이 경우 원래 의도와 다른 장면이 나올 가능성이 컸다 [01:44]
재생성 방식은 수정이 아니라 새 결과물을 다시 뽑는 방식에 가까워서, 원하는 부분만 고치는 제작 통제력의 필요성이 중요하다 [01:59]

서핑 영상에서 확인된 배경·물리 환경 변환

Google Flow에서는 Gemini Omni Flash를 기반으로 멀티미디어 입력, 캐릭터 고정, 프롬프트 제어 등을 활용한 여러 편집 사례가 드러난다 [02:26]
이 구간에서는 원본 영상을 유지하면서 특정 요소를 추가하거나 배경과 물리 환경을 바꾸는 방식이 주요 사례로 다뤄진다 [02:41]
서핑 원본 영상에서는 카메라가 서퍼를 따라가는 시선과 장면 흐름을 유지한 채, 원래 화면에 없던 백상아리가 물 위로 튀어나오도록 만든다 [02:53]
중요한 포인트는 단순히 상어 이미지를 덧붙이는 것이 아니라, 기존 카메라 움직임과 서핑 장면의 맥락 안에서 새로운 요소가 들어가는 편집으로 설명된다는 점이다 [03:08]

춤추는 캐릭터 영상에서 확인된 객체 일괄 교체

생성된 춤추는 캐릭터 영상에서는 모든 책상만 바로크 양식 원목 스타일로 바꾸고, 나머지 요소는 그대로 두라는 조건이 드러난다 [04:39]
이 사례는 장면 전체를 다시 만드는 것이 아니라, 특정 객체군만 골라 스타일을 바꾸는 부분 편집 능력을 보여주는 방향으로 드러난다 [04:54]
출력 결과에서는 여러 책상이 복고풍 바로크 원목 책상으로 바뀌지만, 캐릭터의 춤 동작과 벽면 구조는 유지된다 [05:32]
따라서 이 장면은 객체 일괄 교체와 장면 일관성 유지가 동시에 가능한지 보여주는 테스트 사례로 압축된다 [05:47]

인플루언서 영상에서 확인된 인물·렌즈 일관성

맨해튼 거리의 여성 인플루언서 브이로그 원본이 먼저 생성되고, 이후 배경만 뉴욕이 아닌 샌프란시스코 금문교로 바꾸는 실험이 계속된다 [06:48]
이 사례의 초점은 인물 자체를 다시 만들지 않고, 배경만 바꿨을 때 얼굴, 의상, 디테일이 얼마나 유지되는지에 있다 [07:03]
같은 원본에서 두 가지 버전이 동시에 생성되며, 배경은 달라지지만 인물의 얼굴과 옷차림, 주요 디테일은 크게 무너지지 않는 것으로 드러난다 [07:15]
이 구간은 AI 영상 편집에서 인물 정체성과 렌즈감, 브이로그 장면의 자연스러움을 유지하는 문제가 중요하다는 점을 보여준다 [07:30]

Flow Agent와 다중 시안·제품 변환 워크플로우

Flow Agent는 한 번에 하나의 명령만 처리하는 도구가 아니라, 여러 단계의 작업을 한 흐름으로 보고 프로젝트 맥락을 이해하는 창작 파트너로 묶인다 [08:40]
브레인스토밍부터 제작과 편집까지 이어지는 과정에서, 사용자가 모든 세부 명령을 직접 쪼개지 않아도 전체 제작 방향을 함께 잡는 역할을 맡는다 [08:55]
대사 작성, 플롯 제안, 한 장면의 여러 버전 생성, 여러 에셋의 배치 편집까지 하나의 워크플로우 안에 들어간다 [09:13]
이 흐름에서는 만들기, 다듬기, 빠른 피드백이 분리된 단계가 아니라 반복적으로 함께 돌아가는 제작 방식으로 압축된다 [09:28]

Flow Agent와 Flow Tools가 단발 생성에서 누적형 제작 플랫폼으로 이동한다

같은 제주풍 콘셉트 안에서도 빈티지, 파스텔 톤, 다른 색감과 음악이 클립별로 다르게 적용되는 사례가 드러난다 [12:02]
짧은 프롬프트만으로 스타일, 인물 주변 요소, 가구, 색감이 함께 변주되며, 단일 결과물보다 여러 방향의 시안을 빠르게 확인하는 흐름이 중요하다 [12:17]
Omni 시연에서는 인물을 유지한 채 배경만 바꾸는 편집이 가능하다는 점이 드러난다 [12:30]
Flow Agent에서는 사용자가 정확한 지시를 세세하게 내리기보다 콘셉트를 제안하면, 시안 전체가 그 방향에 맞게 바뀌는 방식으로 드러난다 [12:45]

제작 장벽은 낮아지고 생성량·컴퓨팅 수요는 폭발적으로 커진다

Gemini Omni는 영상과 이미지를 이해하고 수정하는 엔진으로, Flow Agent는 작업을 계획하고 수행하는 제작 파트너로, Flow Tools는 제작 환경을 확장하는 도구로 결합된다 [14:29]
이 조합은 개별 기능의 나열이 아니라 영상 제작 과정 전체를 하나의 시스템으로 묶는 방향으로 압축된다 [14:44]
과거 생성형 AI는 프롬프트를 넣고 결과물을 다시 뽑는 자판기형 구조에 가까웠지만, Flow는 생성, 수정, 버전 비교, 반복 작업 자동화를 통해 결과물을 계속 다듬는 구조에 가깝다 [14:51]
마지막 논지는 제작자가 원하는 방향을 향해 여러 결과물을 만들고 비교하고 수정하는 “제작팀형 AI 워크플로우”로 이동한다는 점이며, 이에 따라 제작 장벽은 낮아지지만 생성량과 컴퓨팅 수요는 더 커질 수 있다는 것이다 [15:06]

편집자는 사라지기보다 결정의 가치가 커진다

Flow는 결과물을 만들고 수정하고 여러 버전을 비교하며 반복 작업을 자동화해, 원하는 방향으로 결과물을 깎아가는 제작팀에 가까운 방식으로 드러난다 [15:14]
발표자는 “영상 편집자가 필요 없게 된 세상”이라는 해석은 과장에 가깝다고 선을 긋는다 [15:24]
정확한 변화는 전문가의 소멸이 아니라 전문성으로 들어가는 문턱이 낮아진 것이며, 누구나 출발선에 설 수 있게 된다는 점이다 [15:34]
그래서 앞으로는 무엇을 만들지 결정하는 사람의 가치가 더 올라갈 수 있다는 결론으로 계속된다 [15:39]

생성량 폭증은 토큰·전력·칩 경쟁으로 계속된다

편집과 코딩의 장벽이 무너지면 더 많은 사람이 영상과 프로그램을 만들기 시작하고, 세상에 생성되는 결과물의 양이 폭발적으로 늘어난다는 우려가 제기된다 [15:59]
이 증가분은 결국 토큰, 컴퓨팅, 전력 수요로 돌아오게 된다고 보여준다 [16:06]
구글이 처리하는 월간 토큰이 2년 전 9.7조, 작년 480조, 올해 3,200조 수준으로 커졌다는 숫자가 상징적 사례로 드러난다 [16:17]
그래서 구글이 TPU 같은 칩을 더 강력하면서도 전력 효율적으로 만들려는 이유가 여기에 있을 수 있으며, 이 주제는 다음에 이어 다루겠다고 마무리한다 [16:38]

🧾 결론

이번 업데이트의 핵심은 Gemini Omni의 부분 편집 기능 자체만이 아니라, Google Flow가 영상 제작의 전 과정을 담는 AI 크리에이티브 스튜디오로 이동하고 있다는 점이다.
사용자는 영상을 처음부터 다시 뽑지 않고도 원하는 배경, 객체, 분위기, 음악, 제품 중심 구성을 반복적으로 조정할 수 있게 되며, 이는 기존 재촬영·마스킹·전문 편집 비용 구조를 흔들 수 있다.
영상 편집자가 곧바로 대체된다는 결론보다는, 제작 장벽이 낮아지고 더 많은 사람이 출발선에 설 수 있게 되면서 “무엇을 만들지 정하는 능력”의 가치가 커진다는 해석이 더 가깝다.
다만 시연 사례에는 실패한 미니멀 버전도 포함되어 있어, 모든 프롬프트가 안정적으로 원하는 결과를 내는 단계라고 단정하기보다는 빠른 시안 제작과 반복 수정 능력이 강화됐다고 보는 편이 적절하다.

📈 투자·시사 포인트

AI 영상 도구의 경쟁축은 단순 생성 품질에서 부분 편집, 맥락 유지, 다중 시안 생성, 배치 수정, 워크플로우 자동화 같은 제작 플랫폼 역량으로 이동하고 있다.
크리에이터, 광고, 커머스, 브랜드 콘텐츠 영역에서는 같은 원본을 여러 분위기·배경·제품 중심 버전으로 빠르게 변환하는 수요가 커질 가능성이 있다.
영상 내용에서는 생성물 증가가 토큰·컴퓨팅·전력 수요 증가로 이어진다고 설명하며, TPU 같은 추론 인프라와 전력 효율의 중요성을 함께 짚는다.
구글의 월간 처리 토큰 수치와 성장세는 영상 내 언급 기준이며, 투자 판단에 활용하려면 Alphabet 공식 발표, 클라우드·AI 인프라 투자 계획, 실제 Flow 사용량 지표를 별도로 검증해야 한다.
단기적으로는 크레딧 비용과 결과물 품질 편차가 일반 사용자의 반복 생성 속도를 제한할 수 있으므로, 실제 확산 속도는 가격 정책과 사용성 개선에 영향을 받을 수 있다.

⚠️ 불확실하거나 확인이 필요한 부분

영상에서 소개된 Gemini Omni Flash의 부분 편집 성능은 데모 사례 중심으로 설명되었기 때문에, 실제 사용 환경에서도 인물 정체성·렌즈 특성·광원·카메라 무빙이 안정적으로 유지되는지는 별도 테스트가 필요하다.
Flow Agent가 “모든 Flow 사용자에게 풀렸다”는 설명은 영상 기준 정보이므로, 지역·계정 유형·요금제·대기열 여부에 따라 실제 접근 가능 범위가 다른지 확인해야 한다.
영상 하나에 약 15크레딧이 든다는 비용 설명은 구체적인 영상 길이, 모델, 해상도, 반복 생성 조건에 따라 달라질 수 있으므로 공식 요금표 확인이 필요하다.
자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

Google Flow에서 Gemini Omni Flash 또는 Omni 편집 기능이 실제로 제공되는 계정 조건과 지원 지역을 확인한다.
동일한 원본 영상으로 배경만 변경, 특정 객체만 교체, 인물 유지 편집을 각각 테스트해 결과 일관성을 비교한다.
Flow Agent 사용 시 한 번의 작업에 소모되는 크레딧, 반복 생성 비용, 무료·유료 플랜 차이를 정리한다.
데모처럼 여러 시안을 동시에 생성했을 때 실패한 결과와 성공한 결과의 비율을 기록해 실무 활용 가능성을 판단한다.

❓ 열린 질문

Flow의 부분 편집 기능은 실제 영상 제작에서 어느 정도까지 “재촬영 대체”가 가능하고, 어느 지점부터는 여전히 전문 편집자의 개입이 필요한가?
Flow Agent가 여러 시안을 자동으로 만들 때, 사용자는 어떤 기준으로 결과를 평가하고 다시 지시해야 가장 빠르게 원하는 방향에 도달할 수 있는가?