제미나이 옴니와 플래시 3.5 시연, 평가는? (최지웅 유캔랩스 대표)
Quick Summary
제미나이 옴니와 플래시 3.5 시연의 평가는 “영상 생성은 제품·인물 유지력이 좋아졌고, 플래시 3.5는 빠른 구현형 작업에서 강하지만, 최종 품질은 여러 모델 검증과 편집을 거쳐야 한다”로 정리된다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
제미나이 옴니와 플래시 3.5 시연의 평가는 “영상 생성은 제품·인물 유지력이 좋아졌고, 플래시 3.5는 빠른 구현형 작업에서 강하지만, 최종 품질은 여러 모델 검증과 편집을 거쳐야 한다”로 정리된다.
📌 핵심 요점
- 제미나이 옴니는 사진 한 장과 짧은 프롬프트만으로 인물 댄스 영상이나 제품 광고형 영상을 만들 수 있었고, 신발·의자·옷·제품 노출 같은 요소가 비교적 잘 유지되는 모습을 보였다.
- 제품 광고 생성에서는 로고 흔들림이 이전보다 줄고 상업 광고 같은 장면 구성이 가능했지만, 얼굴 변화나 어색함이 남아 있어 한 번에 완성본을 얻기보다 여러 결과를 뽑아 좋은 컷을 편집하는 방식이 현실적이다.
- 자영업자나 소규모 사업자 입장에서는 복잡한 제작 경험이 없어도 한두 줄 요청과 제품 이미지로 간단한 광고 소재를 빠르게 만들 가능성이 커졌고, 시스템이 사용자의 짧은 요청을 광고용 프롬프트로 보강하는 점이 접근성을 높인다.
- 제미나이 3.5 플래시는 코딩 비교에서 빠른 실행 속도와 적극적인 보완 성향을 보였으며, 클로드가 “정확히 시킨 일”에 강하다면 제미나이·안티그래비티는 테마·스타일·추가 기능을 더 붙이는 방향으로 차별화됐다.
- 영상과 코드 생성 모두 벤치마크 순위만으로 판단하기 어렵고, 사용자의 작업 목적에 따라 제미나이, 클로드, 코덱스 등을 역할별로 나눠 쓰며 한 모델의 결과물을 다른 모델이나 테스트 코드로 검증하는 흐름이 중요해졌다.
🧩 배경과 문제 정의
- 구글 I/O 이후 발표된 제미나이 옴니와 제미나이 3.5 플래시가 실제 작업 환경에서 얼마나 달라졌는지, 그리고 기존 모델과 비교했을 때 어떤 결과 차이를 보이는지가 핵심 문제로 제시된다.
- 영상 생성 영역에서는 이미지 한 장이나 짧은 프롬프트만으로 인물 영상, 제품 광고, 상업용 소재를 얼마나 빠르고 그럴듯하게 만들 수 있는지가 중요한 평가 기준이 된다.
- 특히 인물의 외형 유지, 신발·의자·옷 같은 세부 요소의 일관성, 제품 로고 유지, 움직임의 자연스러움, 여러 컷으로 구성된 광고 장면 구현 여부가 실제 활용 가능성과 직접 연결된다.
- 제작 경험이 많지 않은 사용자나 자영업자도 광고 대행 업체 없이 제품 이미지를 각인시키는 영상을 만들 수 있는지가 중요한 변화 지점으로 다뤄진다.
- 개발 영역에서는 제미나이 3.5 플래시가 경량 모델임에도 코덱스, 클로드, GPT 계열과 비교해 속도·결과물·작업 성향 면에서 어느 정도 경쟁력을 보이는지가 논의된다.
- 단순 벤치마크 순위보다 실제 사용자가 반복적으로 맡기는 작업에 어떤 모델이 더 잘 맞는지, 그리고 여러 모델을 역할별로 조합하는 방식이 더 실용적인지에 초점이 맞춰진다.
🕒 시간순 섹션별 상세정리
1. 구글 AI 제품 변화와 실제 비교의 출발점
- 구글 I/O에서 여러 AI 제품 발표가 있었고, 이번 논의는 발표 내용 자체보다 실제 기능 변화와 활용 방식, 다른 모델 대비 결과 차이를 직접 확인하는 데 초점이 맞춰진다 [00:56]
- 구글 플로우와 옴니를 사용한 시연이 시작되며, 개인 계정의 AI 프로 결제 환경에서 영상 생성 결과를 확인하는 흐름으로 계속된다 [01:18]
2. 사진 한 장으로 만든 인물 댄스 영상의 유지력
- 스튜디오에서 찍은 인물 사진 한 장만 입력하고 “케이팝 춤”처럼 단순한 요청을 넣었는데, 이를 바탕으로 짧은 댄스 영상이 생성된다 [01:37]
- 4초 분량의 영상 안에 움직임이 많음에도 신발, 의자, 옷이 비교적 유지되며, 인물 기반 영상 생성의 자연스러움과 정합성이 확인된다 [02:00]
3. 제품 광고 영상 생성과 에이전트 기능 활용
- 동화제약 제품을 소재로 광고 영상을 만드는 시연이 이어지고, 모델과 제품이 함께 등장하거나 음료를 마시는 장면이 다양한 각도와 상황으로 구성된다 [02:54]
- 약 10초짜리 광고 결과물은 익숙한 상업 광고 같은 분위기를 내며, 제품 노출과 장면 전환이 함께 포함된 형태로 만들어진다 [03:16]
4. 한 번의 생성 결과에서 보이는 장점과 한계
- 인물 사진과 제품 조건을 함께 넣어 한 번 생성한 결과에서 제품은 비교적 잘 드러나고, 이전보다 로고가 덜 흔들리는 결과가 나온다 [04:56]
- 다만 생성형 영상은 여전히 뽑기 성격이 남아 있어 한 개 결과물만 쓰기보다는 여러 개를 만든 뒤 괜찮은 컷을 골라 이어 붙이는 방식이 현업 활용에 더 적합하다고 드러난다 [05:32]
5. 초보자 접근성, 실무 활용 가능성, 개발 모델 비교로의 전환
- 자영업자나 소규모 사업자는 광고 대행 업체의 도움 없이도 제품 이미지를 각인시키는 간단한 영상을 직접 만들 가능성이 커졌다고 평가된다 [06:43]
- 사용자가 한두 줄짜리 대략적인 요청만 넣어도 시스템이 광고용 프롬프트를 보강하고, 사용자의 의도를 AI 작업에 맞는 형태로 확장한다 [07:12]
6. 모델별 결과물 차이와 하네스 엔지니어링의 의미
- 같은 “지렁이 게임” 수준의 간단한 프롬프트를 줘도 모델마다 색감, 코드 스타일, 화면 구성이 달라지며, 요청에 빈값이 많을수록 모델 내부 성향이 더 뚜렷하게 드러난다 [10:27]
- 클로드는 검은 바탕과 보라색 계열, GPT는 초록색·노란색 계열처럼 특정 스타일을 자주 쓰는 경향이 있고, 학습 데이터와 코드 작성 방식의 노출 차이가 결과물에 반영될 수 있다고 드러난다 [10:50]
7. 코덱스·클로드·제미나이의 코드량과 작업 성향 비교
- 코덱스, 제미나이, 클로드에는 이미 하네스가 적용돼 있지만, 빈 프롬프트에 가까운 조건에서는 구글 쪽 결과물이 더 화려하고 친절한 느낌을 보인다고 평가된다 [12:08]
- 코드량 비교에서는 코덱스가 700여 줄, 클로드가 약 360줄, 안티그래비티가 약 760줄을 생성해 같은 요청에서도 구현 범위와 덧붙이는 기능량이 크게 달라진다 [12:44]
8. 동시 실행 실험과 제미나이 3.5 플래시의 속도
- 세 제품을 동시에 실행하는 스크립트로 동일 작업을 돌리고, 각 모델의 작업 시간과 결과물을 비교하는 방식으로 코딩 성능을 관찰했다 [13:57]
- 첫 실행에서는 클로드 코드가 41초, 코덱스 하이 모델이 253초, 안티그래비티의 제미나이 3.5 플래시가 70초를 기록해 작업 시간 차이가 크게 벌어졌다 [14:40]
9. “정확히 시킨 일”과 “알아서 더 챙기는 일”의 선택 기준
- 안티그래비티는 테마, 사운드, 프리셋, 스타일링을 많이 붙이는 과하게 부지런한 성향이 있고, 짧은 프롬프트를 쓰는 라이트 유저에게 유리한 방향으로 작동할 수 있다 [16:13]
- 시킨 것만 깔끔하게 처리하는 결과를 선호하면 클로드가 더 맞고, 추가 기능과 보완 요소를 많이 챙기는 결과를 선호하면 안티그래비티가 더 맞는 선택지가 될 수 있다 [16:47]
10. 벤치마크보다 작업 적합성과 다중 모델 검토가 중요해지는 흐름
- 벤치마크 순위는 실제 사용 경험과 다를 수 있으며, 사용자가 직접 돌려 보면서 어떤 작업에서 어떤 AI가 더 잘 맞는지 확인하는 과정이 필요하다고 중요하다 [18:11]
- 벤치마크 1등 모델이라도 사용자가 시키는 일을 잘 못하면 실무 가치는 낮아지고, 결국 자신의 작업 성향과 반복 과제에 맞는 AI를 찾는 것이 핵심이 된다 [18:33]
11. AI 결과물 검증은 LLM 판단과 코드 레벨 평가를 병행한다
- 같은 모델이 만든 결과를 같은 모델이 다시 확인하면 자기 작업을 덜 엄격하게 볼 수 있어, 제미나이와 다른 모델을 섞어 검토하는 방식이 쓰인다 [20:01]
- AI가 결과의 적합성을 판단하는 방식도 있지만, 테스트 코드나 코드 레벨 검증처럼 더 안전하고 명확한 방식도 함께 필요하다고 드러난다 [20:21]
12. 여러 모델을 역할별로 돌려 쓰는 실전 워크플로가 가성비와 품질을 높인다
- 제미나이는 아이디어를 많이 가져오고 제안도 적극적이지만 상태가 들쑥날쑥할 수 있어, 발상 단계에서 활용한 뒤 클로드로 설계 문서를 정리하는 방식이 가능하다 [21:46]
- 클로드가 로직과 설계를 정리하면 코덱스가 코드를 작성하고, 다시 제미나이가 코드를 검토해 보완점을 찾는 순환 구조가 만들어지며, 모델을 역할별로 나눠 쓰는 방식이 실전 워크플로로 드러난다 [22:01]
🧾 결론
- 제미나이 옴니의 영상 생성은 인물 사진 기반 움직임, 제품 노출, 광고형 컷 구성에서 이전보다 실사용 가능성이 커진 것으로 평가된다.
- 다만 생성 결과에는 여전히 뽑기 요소가 있고, 얼굴 변화·어색한 장면·일부 품질 편차가 남아 있어 최종 광고나 콘텐츠에는 편집과 선별이 필요하다.
- 제미나이 3.5 플래시는 “빠르고 꽤 똑똑한 모델”로 정리되며, 복잡한 기획보다 빠른 구현과 초안 생성이 중요한 작업에서 장점이 두드러졌다.
- 모델별 차이는 단순한 우열보다 성향 차이에 가깝다. 클로드는 지시 준수와 정돈된 결과, 제미나이·안티그래비티는 적극적인 보완과 풍부한 기능 추가 쪽에 더 가까운 모습으로 소개됐다.
- 검증이 필요한 내용: 영상에서 언급된 속도 비교와 코드량 비교는 해당 시연 환경과 프롬프트에 따른 결과이므로, 일반적인 모델 성능 순위로 단정하려면 더 많은 반복 실험과 동일 조건 검증이 필요하다.
📈 투자·시사 포인트
- 생성형 AI 영상 도구는 광고 제작의 진입장벽을 낮추고 있어, 소상공인·개인 사업자용 숏폼 광고 제작 시장에서 비용 절감과 제작 속도 향상이 중요한 경쟁 포인트가 될 수 있다.
- 이미지 한 장과 짧은 프롬프트만으로 광고 콘티와 초안을 만들 수 있다면, 광고 대행·콘텐츠 제작사는 완성본 제작보다 아이디어 선별, 편집, 브랜드 일관성 관리 쪽으로 역할이 이동할 가능성이 있다.
- AI 코딩 도구 시장에서는 “가장 똑똑한 모델”뿐 아니라 “빠르게 많이 만들어 주는 모델”, “정확히 지시만 따르는 모델”, “검토에 강한 모델”처럼 역할 분화가 더 중요해질 수 있다.
- 여러 모델을 병렬로 쓰고 서로 검토하게 만드는 워크플로는 단일 모델 구독보다 품질과 비용 효율을 동시에 높이는 방식으로 자리 잡을 가능성이 있다.
- 검증이 필요한 내용: 고가 구독 모델의 실제 가성비, 초기 출시 모델의 성능 안정화 시점, 여러 모델 조합의 생산성 향상 효과는 사용자 작업 유형과 반복 실험에 따라 달라질 수 있다.
⚠️ 불확실하거나 확인이 필요한 부분
- 제미나이 옴니 영상 생성 결과가 “이전보다 로고가 덜 흔들린다”, “영상 생성 성능이 크게 좋아졌다”는 평가는 시연 사례 기준의 관찰로 보이며, 동일 조건에서 반복 실험한 정량 비교인지는 확인이 필요하다.
- 클로드 코드 41초, 코덱스 하이 모델 253초, 안티그래비티 제미나이 3.5 플래시 70초라는 실행 시간은 특정 프롬프트·환경·계정·서버 상태에서 나온 결과이므로 일반 성능 차이로 단정하기 어렵다.
- 코덱스 700여 줄, 클로드 약 360줄, 안티그래비티 약 760줄이라는 코드량 비교는 같은 요청에서의 구현 성향을 보여주지만, 코드 품질·유지보수성·정확도까지 직접 증명하는 지표는 아니다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- 제미나이 옴니 영상 생성은 인물 유지, 제품 로고 유지, 손·얼굴 왜곡, 컷 전환 자연스러움 기준으로 여러 번 반복 생성해 품질 편차를 확인한다.
- 광고용으로 활용할 경우 한 번 생성한 결과를 그대로 쓰기보다 여러 개를 생성한 뒤 좋은 컷만 골라 편집하는 워크플로를 전제로 테스트한다.
- 제품 광고 생성 테스트에서는 제품 정면 이미지, 로고가 잘 보이는 이미지, 인물 참고 이미지를 함께 넣었을 때 결과가 얼마나 안정되는지 비교한다.
- 코딩 작업에서는 클로드, 코덱스, 제미나이 3.5 플래시에 동일 프롬프트를 넣고 실행 시간뿐 아니라 기능 충족도, 코드 가독성, 테스트 통과 여부를 함께 기록한다.
❓ 열린 질문
- 제미나이 옴니가 인물 사진 한 장만으로 만든 영상에서 얼굴·의상·배경을 얼마나 일관되게 유지하는지는 반복 생성 시 어느 정도 편차가 날까?
- 제품 광고 영상에서 로고나 패키지 문구가 실제 상업 활용 가능한 수준으로 안정적으로 유지되는가, 아니면 최종 사용 전 별도 편집이 필수인가?
- 제미나이 3.5 플래시의 속도 이점은 간단한 웹페이지나 게임 구현을 넘어 복잡한 리팩터링, 테스트 작성, 대규모 코드베이스 작업에서도 유지될까?