Nvidia GTC Taipei 2026: Jensen Huang Full Keynote

🖼️ 인포그래픽

Nvidia GTC Taipei 2026: Jensen Huang Full Keynote 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 결론

Nvidia GTC Taipei 2026에서 Jensen Huang은 AI의 핵심 경제 단위가 ‘토큰’으로 바뀌고, 이를 생산하는 AI 팩토리·Vera Rubin·에이전트용 CPU·PC·로봇 플랫폼이 엔비디아의 다음 성장축이라고 제시했다.

📌 핵심 요점

엔비디아는 AI를 단순 모델 경쟁이 아니라 토큰을 생산하는 산업 인프라로 정의했다. 토큰은 데이터가 지식·추론·행동으로 전환되는 단위이며, 토큰 생산이 매출과 GDP로 연결된다는 관점이 키노트 전반의 중심축이다.
에이전틱 AI는 생성형 AI 다음 단계로 제시됐다. 에이전트는 대형 언어모델, 하네스, 메모리, 도구, 런타임을 묶어 관찰·추론·계획·실행을 수행하며, 첫 대규모 적용 분야로 소프트웨어 개발과 기업 업무 자동화가 강조됐다.
Vera Rubin은 단일 GPU가 아니라 에이전트 시대를 위한 전체 시스템으로 소개됐다. GPU, Vera CPU, NVLink, BlueField, 스토리지, 네트워킹, 보안, 냉각, 전력 설계까지 결합된 AI 팩토리용 엔드투엔드 인프라라는 점이 핵심이다.
AI 팩토리의 경쟁력은 칩 가격보다 와트당 토큰 처리량, 가동 속도, 신뢰성, 자산 수명, 총소유비용에 의해 결정된다는 메시지가 반복됐다. 컴퓨트가 매출로 전환되는 구조에서는 전력·냉각·그리드·시뮬레이션까지 포함한 통합 설계가 중요해진다.
엔비디아는 에이전틱 AI가 클라우드와 데이터센터를 넘어 PC, 자율주행차, 휴머노이드, 공장, 기지국, 위성까지 확산된다고 봤다. RTX Spark, Windows 협력, Cosmos 3, Alpamo, Isaac Groot는 이 확장을 보여주는 대표 사례로 제시됐다.

🧩 배경과 문제 정의

AI의 핵심 단위로 토큰이 부각되며, 데이터가 지식·추론·행동으로 바뀌는 흐름이 새로운 산업 기반으로 자리 잡는다.
토큰 기반 AI는 도시 안전, 로봇 학습, 의료, 우주 탐사처럼 복잡한 현실 문제를 다루는 범용 인프라로 확장된다.
타이베이는 엔비디아 생태계의 출발점이자 공급망 중심지로 강조되며, AI 산업 성장이 대만 경제와 직접 연결된다.
생성형 AI 이후의 다음 단계로 에이전틱 AI가 현실화되며, 첫 번째 대규모 적용 분야로 소프트웨어 개발이 제시된다.
에이전트 시대의 컴퓨팅은 GPU만의 문제가 아니라 CPU, 스토리지, 네트워크, 보안, 전력, 냉각, 데이터센터 운영까지 포함하는 전체 시스템 문제로 확장된다.
NVIDIA는 Vera Rubin, RTX Spark, Cosmos, Isaac Groot 등을 통해 클라우드, PC, 로봇, 자율주행, 엣지까지 이어지는 에이전틱 컴퓨팅 플랫폼을 제시한다.

🕒 시간순 섹션별 상세정리

1. 토큰이 AI 인프라의 기본 단위로 자리 잡는다

지능은 토큰을 생성하는 새로운 형태의 공장에서 만들어지며, 토큰은 AI를 구성하는 기본 빌딩 블록으로 정의된다 [00:09]
토큰은 데이터를 지식·추론·행동으로 바꾸며, 인간이 보지 못했던 복잡성 속 패턴을 드러내는 새로운 프런티어를 연다 [00:25]

2. AI 적용 범위가 의료·우주·인류 공동 미래로 확장된다

로봇과 AI는 도움의 손길을 제공하고, 희망과 치료 사이의 간극을 줄이며, 호흡과 심장 건강 같은 의료 영역에 영향을 미친다 [01:31]
토큰 기반 AI는 전례 없는 규모로 새로운 영역을 개척하고, Star Cloud One을 향한 도달과 우주적 확장을 상징한다 [02:05]

3. 타이완 생태계가 엔비디아 AI 공급망의 중심으로 부각된다

GTC Taiwan 무대에 젠슨 황이 등장하고, 가족과 사전 행사 출연진을 언급하며 타이완 현장의 상징성을 강화한다 [03:16]
기조연설은 타이완 전역 70개 watch party와 동시에 연결되며, 단일 행사보다 훨씬 큰 지역 생태계 행사로 확장된다 [04:12]

4. 에이전틱 AI가 도착하고 소프트웨어 개발 생산성이 급증한다

2년 전 생성형 AI 이후의 다음 물결로 제시됐던 에이전틱 AI는 이제 유용한 AI로 현실화됐고, 첫 적용 분야는 소프트웨어 코딩이다 [06:30]
소프트웨어 개발자는 전 세계 3천만~4천만 명 규모의 고부가가치 직업군이며, 학생과 열성 사용자까지 포함하면 훨씬 더 큰 생태계를 이룬다 [06:52]

5. AI 생산성은 소프트웨어 개발자 수요와 경제 산출을 동시에 키운다

3천만 명의 소프트웨어 개발자가 연간 약 3조 달러의 급여를 받으며, 이 인력의 생산 활동이 전 세계 산업과 약 100조 달러 규모의 경제에 영향을 준다 [08:04]
AI로 같은 3조 달러의 급여가 거의 세 배에 가까운 산출을 만들 수 있다면, 생산성 효과는 약 9조 달러 규모로 확대된다 [08:34]

6. 토큰은 수익 단위가 되고 AI 팩토리와 대만 컴퓨트 수요를 밀어 올린다

유용한 AI가 도착했다는 변화는 산업 관점에서 토큰 수요의 폭증으로 이어지며, 토큰은 더 이상 비용만이 아니라 수익성 있는 매출 단위가 된다 [09:39]
토큰 생산이 수익을 만들기 때문에 AI 기업은 더 많은 토큰 생성, 더 많은 AI 팩토리 구축, 더 큰 컴퓨트 공급을 원한다 [09:53]

7. 에이전트 컴퓨팅은 모델·하네스·메모리·도구 사용을 하나로 묶는다

과거 컴퓨팅은 운영체제 위에서 애플리케이션과 코드가 실행되는 구조였지만, 현재의 에이전트 애플리케이션은 하나 이상의 대형 언어모델과 하네스가 결합된 구조로 바뀐다 [11:10]
입력이 들어오면 에이전트는 상황을 이해하고 관찰하며, 추론과 계획을 거쳐 스프레드시트·웹브라우저·데이터 처리 엔진·데이터베이스 같은 도구를 사용한다 [11:39]

8. 의도 입력과 도구 사용이 애플리케이션 중심 사용 방식을 대체한다

프롬프트가 입력되면 코드가 생성되고 결과물이 출력되는 방식이 가능해지며, 코딩 도구를 통해 입력과 산출 사이의 거리가 크게 줄어든다 [13:21]
생성형 작업에서는 검은 배경의 초록 점이 타이베이 101, GTC Taipei 2026, Nvidia 로고로 변형되는 GIF를 프롬프트만으로 만들 수 있다 [13:52]

9. CUDA X 라이브러리는 에이전트가 사용할 과학·공학 도구로 확장된다

CUDA는 20년 전 가속 컴퓨팅을 위한 단일 아키텍처로 출발했고, 약 1,000개의 CUDA X 라이브러리가 과학과 엔지니어링 전반의 돌파구를 만드는 개발 도구가 됐다 [16:12]
CUDA X 라이브러리는 에이전트를 위한 도구로 자리 잡으며, CU Litho는 계산 리소그래피, CU Opt는 의사결정 최적화, QDSS는 희소 선형 해법, AIQ는 문서 기반 심층 리서치에 연결된다 [16:28]

10. 에이전트는 모델·하네스·도구·런타임이 분산된 컴퓨팅 구조로 작동한다

소프트웨어의 컴퓨팅 패턴은 바뀌고 있으며, 에이전트는 분리되고 분산된 컴퓨팅 모델의 극단적인 형태가 된다 [20:09]
에이전트 처리를 위해 여러 종류의 컴퓨터가 동시에 활성화되고, 구성 요소는 모델 하네스, 도구와 스킬, 런타임으로 나뉜다 [20:27]

11. 에이전트의 사고와 도구 사용은 랙·CPU·GPU 자원을 반복적으로 호출한다

대규모 언어모델은 맥락을 처리하고, 환경을 관찰·이해하고, 추론을 거쳐 계획을 만든 뒤 실행하며, 이 과정마다 Grace Blackwell NVL72 랙 전체가 활성화된다 [21:20]
도구를 사용할 때는 CPU가 함께 쓰이고, 도구의 종류는 C 컴파일러, Python, JavaScript, 가속 컴퓨팅까지 넓어진다 [21:41]

12. 에이전트 메모리와 보안·오케스트레이션은 데이터센터와 스토리지 구조를 바꾼다

에이전트의 도구는 CPU·GPU·대규모 언어모델 위에서 실행되고, 보안 하네스는 CPU와 Nvidia BlueField 같은 DPU에서 작동하며, 전체 오케스트레이션은 CPU가 담당한다 [22:33]
가장 어려운 부분 중 하나는 메모리이며, KV 캐싱, 기억할 정보의 선택, 압축을 넘어선 컴팩션, 검색 방식, 구조화·비구조화 데이터, 온톨로지 관계가 모두 얽힌다 [23:02]

13. Vera Rubin은 칩이 아니라 보안까지 포함한 전체 시스템이다

Vera Rubin은 GPU 하나가 아니라 Vera Rubin NVLink72, Vera CPU, 스토리지 시스템, CX9, DOCA 소프트웨어 스택, 보안 프로세서까지 연결된 엔드투엔드 시스템이다 [24:23]
AI 모델의 가치가 높기 때문에 데이터는 저장 중, 이동 중, 사용 중 모두 암호화되어야 하며, 전체 시스템이 confidential computing 원칙을 따른다 [24:46]

14. AI factory 구축은 전력·냉각·그리드까지 포함한 인프라 문제로 확장된다

고객과 파트너가 원하는 것은 단순한 컴퓨터가 아니라 AI factory이며, Nvidia의 기술 범위도 인프라 전체 규모로 확장된다 [25:57]
전력 발전, 냉각 시스템, 그리드 제공자, 산업 기업들이 생태계에 들어오면서 AI 인프라 구축은 칩·랙·네트워크를 넘어선 산업 프로젝트가 된다 [26:17]

15. DSX는 디지털 트윈과 운영 소프트웨어로 구축 전 검증과 운영 자동화를 연결한다

DSX SIM Omniverse blueprint를 사용하면 실제 랙이 설치되기 전에 Vera Rubin AI factory의 레이아웃, 전력, 냉각, 네트워크, 통합 변경을 디지털 트윈에서 검증할 수 있다 [27:24]
공장이 가동되면 DSX OSS가 인프라를 프로비저닝·운영·모니터링·복구하며, 설치된 시스템을 멀티테넌트와 회복탄력성을 갖춘 AI 용량으로 전환한다 [27:51]

16. 전력 최적화와 Omniverse 시뮬레이션이 AI factory의 경제성을 좌우한다

랙 내부 전력 smoothing은 피크 전류와 전력 서지를 줄이고, AI 에이전트들은 냉각과 전력을 계속 조율해 워크로드 수요에 맞춘다 [28:46]
DSX Flex는 실시간 그리드 신호를 읽고 공장 전력을 동적으로 조절해, AI factory가 전력망 부담을 줄이는 유연한 에너지 자산으로 작동하게 한다 [29:04]

17. AI 클라우드 확산과 지역별 인프라 수요

CoreWeave와 Nebius 같은 AI 클라우드 기업은 짧은 기간에 수백억 달러 가치로 성장했고, Cursor, Black Forest Labs, World Labs, Revolut, Shopify 같은 고객들이 이 인프라를 사용한다 [32:00]
NScale은 British Telecom, Google, Thinking Machines 같은 고객을 확보했고, 한국의 Naver Cloud는 Bank of Korea와 Hyundai 같은 지역 고객을 포함해 AI 클라우드 수요를 보여준다 [32:34]

18. AI 팩토리 구축 역량과 ‘컴퓨트=매출’ 논리

AI 클라우드 사업자들은 컴퓨팅 스택, 하드웨어, 소프트웨어, 라이브러리, 제3자 개발자 생태계와의 연결을 필요로 하며, 이 전체 기반이 있어야 AI 클라우드를 실제로 세울 수 있다 [33:42]
AI 클라우드는 소프트웨어 관점에서는 컴퓨터 과학 문제지만, 자산 관점에서는 거대한 공장에 가까워서 단순한 기술 스택만으로는 충분하지 않다 [34:09]

19. 통합 설계가 만드는 가동 속도와 전력당 수익

Nvidia는 슬라이드 수준의 설계가 아니라 전체 인프라를 직접 만들고 연결했으며, 대규모 구축 경험을 통해 초기 토큰 생성, 첫 추론, 훈련 가동까지 걸리는 시간을 줄인다 [35:33]
모든 구성요소를 처음부터 통합 설계하고 전체 시스템을 시뮬레이션하며 Vera Rubin 랙처럼 극단적인 코드·시스템 설계를 적용하기 때문에, 와트당 토큰 처리량이 핵심 경쟁력이 된다 [36:18]

20. 신뢰성·유연성·생태계가 자산 수명과 TCO를 결정한다

대형 데이터센터에는 수많은 움직이는 부품과 수백만 개 케이블이 존재하며, 모든 컴퓨터가 조화롭게 안정적으로 작동해야 하므로 운영 경험과 평균 장애 간격이 매우 중요하다 [37:36]
AI 소프트웨어는 Hopper 시기 이후에도, Ampere 시기 이후에도 완전히 바뀌었고, CNN에서 트랜스포머, 전문가 혼합, 에이전트 시스템으로 빠르게 전환되면서 고정적인 아키텍처의 위험이 커진다 [38:10]

21. AI 수요 폭증과 Vera Rubin 양산 전환

AI가 유용하고 수익성 있는 단계에 들어서면서 전 세계 연산 수요가 급증했고, 컴퓨트 공급 부족이 가장 큰 제약으로 부상했다 [40:13]
대만의 공장과 인력은 AI 팩토리를 세계 곳곳에 세우는 공급망의 중심이 됐고, Vera Rubin은 이 수요에 대응하기 위해 본격 양산 단계에 들어갔다 [40:29]

22. 에이전트형 AI가 요구하는 새로운 슈퍼컴퓨터 구조

대형 언어모델은 답변 생성에 초점이 있었지만, AI 에이전트는 작업 수행, 관찰, 추론, 계획, 도구 사용까지 포함해 훨씬 복잡한 연산 문제를 만든다 [41:47]
에이전트는 방대한 컨텍스트, 작업 메모리, 장기 메모리, 필요 시 생성되는 하위 전문 에이전트를 다뤄야 하며, Vera Rubin은 이 부하를 처리하는 멀티랙 포드 규모 시스템이다 [42:02]

23. Vera Rubin 랙 시스템과 핵심 구성요소

Vera Rubin 컴퓨트 보드는 6조 개 트랜지스터와 1만 8천 개 이상의 부품을 한 보드에 담고, NVL72는 프롬프트·컨텍스트 이해, 추론, 계획을 담당한다 [43:03]
새 모듈형 컴퓨트 구조는 PCB 미드플레인, Superchip, ConnectX-9, BlueField 4 DPU를 케이블 없이 통합해 AI 팩토리 규모의 복원성을 높인다 [43:17]

24. 대만 공급망과 실물 Vera Rubin 공개

Vera Rubin은 5개의 연결된 랙 스케일 시스템으로 구성된 AI 에이전트용 슈퍼컴퓨터이며, 대만 전역 150개 공급망 파트너와 수백 개 사이트가 칩·패키지·시스템·데이터센터를 한계까지 확장했다 [45:14]
Vera Rubin은 AI 실행용을 넘어 에이전트 실행을 목표로 설계됐고, 에이전트의 복잡성 때문에 이를 구동하는 컴퓨터 역시 가장 진보한 시스템이어야 한다는 논리가 계속된다 [46:05]

25. 추론 비용과 NVLink 72의 역할

Grace Blackwell 개발 당시에는 사전학습이 가장 중요한 워크로드였고, 추론은 상대적으로 쉽다는 인식이 있었지만 실제 추론은 곧 매출과 비용을 좌우하는 핵심 작업이 된다 [48:01]
최신 모델은 복잡도가 높고, 빠른 상호작용과 높은 처리량을 동시에 달성해야 하므로 추론 시스템 설계의 난도가 크게 올라간다 [48:23]

26. Vera Rubin 랙 구조와 네트워킹 확장

Vera Rubin은 케이블, 호스, 팬이 보이지 않는 구조로 바뀌고, 양쪽을 연결하는 중앙 PCB 덕분에 이전에 두 시간 걸리던 작업이 5분 수준으로 줄어든다 [49:16]
Vera CPU 트레이와 스토리지 트레이는 Vera CPU 2개, CX9 4개, 대량의 소프트웨어를 포함하며, AI 시스템 내부의 컴퓨트·스토리지·네트워크 기능을 하나의 랙 구조로 묶는다 [49:47]

27. 사람 중심 CPU에서 에이전트 중심 CPU로 전환된다

Vera CPU는 AI 시대를 위한 CPU로 자리 잡으며, 기존 CPU는 사람과 클라우드 임대 경제에 맞춰 초 단위 사용 패턴을 전제로 했다 [51:45]
사람은 CPU를 초 단위로 사용하고 클라우드는 코어 수에 따라 임대 경제를 구성하지만, 에이전트는 도구 호출과 데이터베이스 접근에서 나노초 단위의 응답을 요구한다 [52:07]

28. AI 팩토리 경제성과 Vera CPU 아키텍처

Vera 컴퓨트는 AI 모델 하네스, 오케스트레이션, 도구 사용, 데이터베이스 접근을 처리하고, Vera BlueField 기반 데이터 서버는 매우 빠른 스토리지 시스템으로 에이전트의 메모리 접근을 받는다 [54:06]
스토리지 서버와 CPU는 데이터센터에서 가장 비싼 GPU 중심 영역의 critical path가 되며, 이 병목이 토큰 생산량과 AI 팩토리의 경제성을 직접 제한한다 [54:29]

29. Vera의 핵심 기준은 단일 스레드 성능과 대역폭이다

Vera는 클럭당 10개 명령어를 가져오고 해석하며 실행하는 구조를 내세우고, 높은 IPC가 단일 스레드 성능의 핵심 경쟁력으로 작동한다 [56:08]
CPU 안팎으로 데이터를 이동시키는 대역폭이 중요해지고, 코어당 대역폭과 전체 시스템 대역폭이 에이전트형 AI 환경의 성능 병목을 좌우한다 [56:20]

30. Vera는 PCIe Gen 6, LPDDR5X, 내부 패브릭으로 대역폭 병목을 줄인다

Vera는 PCI Express Gen 6를 처음 적용한 CPU로 소개되고, LPDDR5 계열 메모리에서 1.2TB/s 대역폭을 제공해 외부와 내부 모두에서 기존 고성능 CPU 대비 큰 폭의 대역폭 우위를 내세운다 [57:43]
에이전트 수가 인간 사용자 수보다 훨씬 많아지는 환경에서는 CPU 수요가 급증하고, GPU 옆의 CPU가 느리면 비싼 GPU 자원이 놀게 되어 AI 팩토리의 경제성이 흔들린다 [58:16]

31. 에이전트 루프에 맞춘 Vera의 코어·메모리·패브릭 설계

에이전트형 AI에서는 CPU가 지휘자, GPU가 오케스트라에 가까운 역할을 하며, CPU 병목은 GPU 활용률·토큰 처리량·지연 시간·사용자 경험에 직접 영향을 준다 [1:00:09]
Vera는 에이전트 루프를 위해 NVIDIA 커스텀 데이터센터 CPU 코어와 확장형 coherency fabric을 결합하고, 성능 코어와 대역폭의 균형으로 AI 팩토리 출력 극대화를 겨냥한다 [1:00:36]

32. Vera는 다중 소켓·GPU 연결·AI 스토리지까지 확장되는 성장 축이다

NVIDIA의 2세대 scalable coherency fabric은 88개 Olympus 코어를 단일 모놀리식 메시로 묶고, 코어를 칩렛으로 나누지 않아 전통적 CPU 대비 코어 간 통신을 50% 빠르게 만든다 [1:01:50]
메모리 일관성을 갖춘 NVLink chip-to-chip 연결은 GPU를 Vera 패브릭에 직접 붙이고, 여러 소켓으로 확장해 CPU 간 대규모 대역폭을 확보하는 기반이 된다 [1:02:08]

33. Grace Blackwell 전환 이후 Vera CPU 성능 근거

Grace Blackwell 전환의 가장 큰 위험은 외부 x86 CPU에서 Grace Blackwell로 이동하는 과정이었고, 전환 이후 Grace는 Blackwell 생태계와 사실상 결합된 이름이 됐다 [1:04:01]
기업들의 소프트웨어 스택과 보안 스택이 Grace Blackwell에 최적화되면서 Vera CPU가 들어갈 기반이 넓어졌고, CPU 전환 리스크는 생태계 실행력 문제로 바뀌었다 [1:04:18]

34. 실시간 스트림 처리와 Vera 생태계 확장

뉴욕증권거래소의 실시간 스트림 처리 워크로드에서 Vera CPU는 6배 성능을 보였고, 단일 스레드 실행, 코어 간 대역폭, 외부 대역폭이 성능 차이를 만든다 [1:05:51]
CPU 실제 워크로드에서 x-factor 단위의 성능 개선은 드문 사례이며, Vera는 GPU뿐 아니라 CPU 영역에서도 대규모 성능 전환 가능성을 만든다 [1:06:29]

35. 에이전트용 CPU라는 새 시장

과거 CPU는 인간 사용자를 기준으로 만들어졌지만, 에이전트형 시스템은 성격과 실행 패턴이 달라 기존 CPU와 같은 구조로는 충분하지 않다 [1:07:05]
에이전트 수는 사람보다 훨씬 많아질 수 있고, 에이전트는 대기 시간을 참기 어려운 실행 주체이기 때문에 CPU 수요 규모가 기존 시장보다 커질 가능성이 있다 [1:07:52]

36. 엔터프라이즈 에이전트 운영체제 구성

기업이 에이전트를 서비스하거나 운영하려면 더 똑똑하고 저렴하며 빠른 모델, 전체 흐름을 조율하는 harness, 도구와 스킬, 전체를 붙잡는 runtime이 필요하다 [1:09:27]
CUDA-X 라이브러리 같은 도구는 에이전트가 사용할 스킬이 되고, runtime은 모델·도구·권한·실행 환경을 하나로 묶는 운영체제 역할을 맡는다 [1:09:49]

37. 칩 설계 슈퍼 에이전트와 검증 자동화

칩 설계자는 에이전트의 핵심 사용 사례이며, NVIDIA는 Cadence와 함께 RTL, 아키텍처 다이어그램, 회로도, 사양을 입력으로 받아 수정과 검증을 수행하는 칩 설계 슈퍼 에이전트를 만든다 [1:12:04]
수십만 개의 NVIDIA 칩이 AI 팩토리를 구성하고 프런티어 AI 모델을 구동하지만, 칩과 시스템 설계는 수조 개 트랜지스터와 피코초 단위 동기화가 얽힌 고난도 엔지니어링 문제다 [1:12:54]

38. Codex·ChipStack·Neotron이 결합한 검증 루프

Cadence와 NVIDIA의 설계 검증 에이전트는 Codex가 프로세스를 조율하고, Cadence ChipStack이 Neotron 기반 RTL 검증 루프를 실행하며, NVIDIA OpenShell이 보안을 담당하는 구조다 [1:13:53]
RTL 생성, 테스트벤치 생성, 회귀 테스트, 디버그 전문 서브 에이전트가 결합되면서 시스템이 자체적으로 검증을 추진하고, Cadence Xcelium과 Jasper로 수백 개 시뮬레이션과 형식 검증을 수행한다 [1:14:07]

39. CUDA 가속 도구와 Neotron 3 Ultra 공개

Cadence 시뮬레이터, 검증기, 형식 검증 시스템이 에이전트의 도구가 되며, 에이전트가 즉각적인 답을 요구하기 때문에 Cadence 도구의 CUDA 가속이 중요해진다 [1:15:15]
모델, 하네스, CUDA 가속 라이브러리, 도구, 런타임이 결합되어 Cadence가 자체 워크플로와 전문 지식에 맞춘 독점 슈퍼 에이전트를 만들 수 있는 기반이 형성된다 [1:15:35]

40. 더 빠른 오픈 모델과 엔터프라이즈 에이전트 시장

Neotron 3 Ultra는 SSM 상태 기반 모델과 mixture of experts를 결합한 하이브리드 아키텍처를 사용하며, 빠른 사고와 긴 추론을 같은 비용 안에서 가능하게 하는 방향을 목표로 한다 [1:17:34]
Neotron 3 Ultra는 세계 최고 수준의 오픈 모델들과 비교해 5배 빠르고, 총 FLOPs와 전체 추론 시간 기준 실행 비용이 30% 낮으며, 완전 공개 모델이라는 점을 내세운다 [1:17:57]

41. Windows PC 구조가 만든 개인 컴퓨팅의 출발점

대만의 여러 파트너 기업들이 현대 컴퓨터 산업의 출발점에 가까운 역할을 했고, Nvidia가 등장하기 전부터 PC 산업은 Windows 1·2, Apple 1·2, Windows 3.1 단계로 발전하고 있었다 [1:20:01]
Windows 95는 PC를 기업과 회사 중심 기기에서 소비자 전자제품으로 바꿨고, “모두가 하나쯤 가져야 하는” 개인 기기라는 인식을 만들었다 [1:20:36]

42. Microsoft와 Nvidia가 에이전트 시대의 PC를 다시 설계한다

Microsoft와 Nvidia는 40년 뒤의 PC를 다시 만들려 하며, 지난 3년 동안 PC가 에이전트 시대에 맞게 작동하도록 구조를 재설계해 왔다 [1:21:35]
에이전트라는 새로운 컴퓨팅 패턴은 AI 클라우드와 기업 내부뿐 아니라 개인 PC에서도 실행되고, 사용자를 이해하며 대화·시각 인식·파일 읽기·리서치 같은 작업을 맡는다 [1:22:08]

43. RTX Spark는 AI 에이전트용 개인 컴퓨터 플랫폼을 하드웨어와 OS까지 확장한다

AI 시대의 개인 컴퓨터는 로컬 또는 클라우드 모델과 연결된 네이티브 에이전트를 실행하고, 보안을 위해 샌드박스 안에서 지속적으로 동작하며 작업을 처리하는 구조를 갖는다 [1:23:26]
RTX Spark는 Blackwell RTX GPU, 6,144개 CUDA 코어, 1페타플롭 AI 성능, MediaTek과 협력한 20코어 Grace CPU, NVLink 결합 구조를 하나의 칩에 담는다 [1:23:59]

44. N1X와 RTX Spark 노트북은 기존 소프트웨어와 새 에이전트를 한 장치에서 실행한다

RTX Spark 노트북은 게임 데모와 함께 공개되고, Forza와 새로운 007 게임 같은 그래픽 중심 사례가 먼저 등장해 Nvidia의 기존 강점인 비디오게임 경험과 연결된다 [1:25:20]
N1X는 MediaTek과의 협력으로 만든 칩이며, Nvidia의 33년 소프트웨어 스택이 모두 실행되는 점이 핵심 가치로 드러난다 [1:26:03]

45. RTX Spark에서 로컬 에이전트가 설계 워크플로를 자동화한다

RTX Spark에서 실행되는 로컬 에이전트는 노트북의 도구, 오픈 셸 샌드박스, Hermes harness, 클라우드의 Claude Sonnet을 연결해 주택 설계 작업을 시작한다 [1:28:02]
사이트, 콘셉트, 스케치, 무드보드, 요구사항, 설계 의도가 입력되면서 에이전트가 Rhino를 열고 지형·이격거리·건물 외피를 모델링한다 [1:28:16]

46. Adobe와 생태계 참여로 RTX Spark가 에이전트 친화 PC 플랫폼으로 확장된다

RTX Spark는 에이전트 시대의 PC로 제시되고, 가속 성능과 소프트웨어 역량을 개발자 생태계와 결합해 노트북 경험을 강화한다 [1:29:58]
Adobe는 Photoshop과 Premiere의 핵심 아키텍처를 RTX Spark용으로 재설계하고, 기존에도 빠른 도구를 두 배 빠르게 만드는 방향으로 출시를 준비한다 [1:30:16]

47. Microsoft와 Nvidia의 새 Windows PC 라인업이 개인 AI 컴퓨팅 범위를 넓힌다

RTX Spark가 노트북의 재창조라면, Microsoft와 Nvidia의 새 라인업은 데스크톱·노트북·워크스테이션을 포함해 PC 전체를 다시 설계하는 방향으로 확장된다 [1:31:23]
세 가지 Windows 머신은 Windows 호환성, CUDA, Nvidia AI Tensor Core를 모두 갖추며, Nvidia 플랫폼에서 실행되는 AI 작업을 해당 PC 환경으로 가져온다 [1:31:40]

48. PC는 앱 실행 도구에서 집 안의 AI 슈퍼컴퓨터로 바뀐다

과거의 전화기가 오늘날 통화보다 다양한 일을 처리하는 스마트폰이 된 것처럼, 현재의 PC도 10년 뒤에는 클릭·타이핑·앱 실행 중심 도구와 전혀 다른 의미를 갖게 된다 [1:34:21]
집 안에 홈시어터, 큰 TV, 잔디깎이, 식기세척기가 있는 것처럼, 미래에는 AI 슈퍼컴퓨터가 집 안에서 여러 에이전트와 보조자를 계속 실행하는 장치가 될 수 있다 [1:35:12]

49. 새 PC 제품군과 에이전틱 컴퓨터 확산

PC의 재창조는 스마트폰 등장만큼 큰 변화이며, 엔비디아는 데스크톱·노트북·워크스테이션을 아우르는 새 제품군 로드맵을 세운다 [1:36:06]
세계 PC 산업 전체가 새 PC 라인에 합류하면서, 개인용 컴퓨팅은 에이전틱 AI를 실행하는 플랫폼으로 전환된다 [1:36:37]

50. 물리 AI의 데이터 병목과 로봇 관점 학습

에이전틱 컴퓨터는 장기적으로 수백억에서 수천억 대 규모로 세계 곳곳에서 작동할 수 있지만, 가장 큰 문제는 데이터 부족이다 [1:38:14]
언어 모델 학습 데이터는 사람이 쓰고 읽는 인터넷 언어에 기반하지만, 로봇 AI 데이터는 로봇의 지각과 관점에서 만들어져야 한다 [1:38:35]

51. Cosmos 3와 물리 AI 기반 모델의 역할

Cosmos 3는 물리 AI의 최전선 모델이며, 로봇·공장 자동화·물리 세계와 상호작용하는 모든 시스템의 기반 모델로 쓰인다 [1:40:44]
Cosmos 3는 이해와 추론, 생성, 루프 안 시뮬레이션, 정책 역할까지 수행하며 물리 AI 개발자가 로봇과 환경을 학습시키는 핵심 도구가 된다 [1:40:59]

52. 합성 데이터·시뮬레이션·오픈 모델 스택

개발자는 구현 형태와 사용 사례에 맞춰 Cosmos를 후학습할 수 있으며, VLM으로는 장면을 이해하고 중요한 요소를 식별하고, 월드 모델로는 이미지·텍스트·비디오에서 물리적으로 정확한 합성 영상을 만든다 [1:42:00]
Cosmos는 시뮬레이터로 정책 학습과 평가 루프를 닫고, NVIDIA Omnidreams의 기반으로서 행동 조건에 따라 미래 프레임을 예측한다 [1:42:24]

53. 자율주행 오픈 모델과 Hyperion 배포 생태계

Alpamo2는 자율주행차용 오픈 모델이며, Hyperion을 채택한 자동차 제조사들은 전 세계 자동차의 약 80%를 대표해 대규모 차량 배포 기반을 만든다 [1:44:00]
전 세계 모빌리티 서비스의 약 97%가 엔비디아와 연결되어 있고, Alpamo를 Hyperion 런타임과 Halos 운영체제 위에 배포하면 다양한 서비스 네트워크와 연결될 수 있다 [1:44:35]

54. 자율주행에서 휴머노이드로 확장되는 동일한 시스템 패턴

자율주행차에서 만든 기술은 휴머노이드에도 적용되며, Isaac Groot는 모델, 데이터 생성, 시뮬레이션, 런타임, 운영체제를 포함한 휴머노이드 로봇 스택으로 구성된다 [1:46:21]
클라우드용 agentic system, PC용 agentic system, 자율주행차용 로봇 시스템, 휴머노이드 로봇 시스템은 모두 같은 패턴을 공유하고, 각 경우마다 전체 스택을 수직 통합해 만든다 [1:46:49]

55. Isaac Groot reference humanoid robot의 사양과 연구용 목적

Isaac Groot reference humanoid robot은 완전 통합형 휴머노이드 기준 플랫폼이며, 각 손에 Sharpa가 만든 25자유도, 로봇 전체에 31자유도를 갖춘 6피트 150파운드급 시스템이다 [1:47:53]
이 로봇은 새로운 Thor와 전체 소프트웨어 스택, 데이터 생성 스택, 시뮬레이션 스택, 런타임을 통합해 연구자가 바로 사용할 수 있는 형태로 설계됐다 [1:48:24]

56. 개방형 로봇 개발 파이프라인과 반복되는 agentic computing 구조

Isaac Groot는 오픈 모델, 시뮬레이션·학습 라이브러리, 데이터 생성기, robot computer를 포함한 휴머노이드 오픈 개발 플랫폼이며, 몇 시간이면 연구 준비가 가능한 파이프라인을 목표로 한다 [1:49:05]
개발 흐름은 Isaac Lab에서 시뮬레이션 환경을 설정하고, Isaac Teleop으로 실제 또는 시뮬레이션 로봇의 데모를 캡처한 뒤, Omniverse와 Cosmos로 하나의 데모를 수천 개 합성 데이터로 확장하는 방식이다 [1:49:20]

57. Vera Rubin과 에이전트 인프라 전환

엔비디아의 기업용 AI 툴킷은 에이전트형 플랫폼과 연결되며, AIS와의 접점을 만들고 엔비디아에는 새로운 성장 기회를 만든다 [1:52:02]
Vera Rubin은 Grace Blackwell이 AI 추론 처리를 겨냥했던 것과 달리 에이전트 실행을 위해 만들어졌고, 이미 본격 생산 단계에 들어간다 [1:52:16]

58. 에이전트 컴퓨팅의 PC·로봇·엣지 확산

엔비디아와 마이크로소프트는 새로운 PC 라인을 만들며, 에이전트형 처리 패턴이 개인용 컴퓨팅의 출발점을 바꾼다 [1:53:17]
같은 에이전트 컴퓨팅 패턴은 앞으로 PC뿐 아니라 로봇, 위성, 기지국, 공장, 클라우드, 온프레미스, 엣지까지 확산된다 [1:53:25]

59. 음악으로 압축된 제품 메시지와 마무리 인사

에이전트는 과거 영화 속 존재처럼 오해받았지만 이제 누구나 팀처럼 활용할 수 있는 도구가 되고, 거실에서도 회사를 만들 수 있을 만큼 컴퓨팅 수요가 커진다 [1:54:54]
Vera는 저렴한 토큰, 10배 빠른 추론, 에이전트용 CPU, 50% 빠른 성능, NVLink Fusion을 핵심 메시지로 내세우며 에이전트 컴퓨팅 인프라의 경제성과 확장성을 강조한다 [1:55:09]

🧾 결론

이번 키노트의 핵심은 “AI가 유용해졌고, 유용한 AI는 토큰 수요를 폭발시키며, 토큰 생산 인프라가 새로운 산업 자산이 된다”는 논리다.
엔비디아는 스스로를 GPU 회사에서 시스템 회사, 더 나아가 AI 인프라 회사로 확장해 설명했다. Vera Rubin과 DSX는 이 전환을 상징하는 제품·설계 체계로 제시됐다.
에이전틱 AI는 단순 챗봇이나 코드 생성 도구가 아니라, 모델·하네스·도구·메모리·런타임이 분산 컴퓨팅으로 결합된 새로운 애플리케이션 패턴으로 정의됐다.
대만은 이번 발표에서 단순 개최지가 아니라 엔비디아 AI 공급망의 핵심 파트너로 부각됐다. 칩, 패키징, 시스템, 데이터센터 구축까지 이어지는 공급망의 중요성이 반복적으로 강조됐다.
PC와 로봇 영역에서도 같은 에이전트 컴퓨팅 구조가 반복된다. 엔비디아는 데이터센터용 AI 팩토리뿐 아니라 개인용 AI 컴퓨터와 물리 AI 플랫폼까지 하나의 장기 로드맵 안에 배치했다.

📈 투자·시사 포인트

엔비디아의 성장 논리는 GPU 판매량 자체보다 “토큰 생산 능력”과 “AI 팩토리 경제성”에 맞춰져 있다. 투자 관점에서는 칩 단품 경쟁보다 전체 시스템 처리량, 전력 효율, 네트워킹, 소프트웨어 생태계가 더 중요한 평가 축이 된다.
AI 인프라 수요는 데이터센터 내부의 GPU뿐 아니라 CPU, DPU, 스토리지, 네트워킹, 냉각, 전력망, 디지털 트윈 설계까지 확장된다. 이는 엔비디아 생태계 안팎의 공급망 기업에도 구조적 기회를 만들 수 있다.
Vera CPU의 강조는 에이전트 시대에 CPU 병목이 다시 중요해질 수 있음을 시사한다. 에이전트가 도구 호출, 데이터베이스 접근, 샌드박스 실행, 오케스트레이션을 반복한다면 GPU 주변 컴퓨팅의 가치가 커진다.
RTX Spark와 Windows 협력은 AI PC가 단순한 로컬 추론 장치가 아니라 개인 에이전트 실행 플랫폼으로 재정의될 가능성을 보여준다. 다만 실제 소비자 수요, 가격, 배터리·발열, 앱 생태계 성숙도는 별도 검증이 필요하다.
Cosmos 3, Alpamo, Isaac Groot 발표는 물리 AI와 로봇 시장이 장기 성장축으로 다뤄지고 있음을 보여준다. 다만 휴머노이드와 자율주행의 상용화 속도는 규제, 안전성, 데이터 확보, 실제 배포 비용에 따라 달라질 수 있다.
검증 필요 포인트는 2030년 전 100GW 규모 AI 팩토리 전망, 1GW 시설 비용 800억~1,000억 달러 가능성, Vera CPU의 SQL 3배·스트림 처리 6배 성능, Neotron 3 Ultra의 5배 속도 및 30% 비용 절감 주장이다. 이는 키노트에서 제시된 수치이므로, 투자 판단에는 외부 벤치마크와 고객 도입 사례 확인이 필요하다.

⚠️ 불확실하거나 확인이 필요한 부분

section-detail에는 제품명·모델명·기술명이 다수 등장하지만, 일부 표기는 실제 공식 명칭과 다를 수 있어 확인이 필요합니다. 예를 들어 Neotron, Grok 3 LPX, Alpamo2, Sharpa 등은 영상 내 발화 또는 자동 전사 기반 표기일 가능성이 있으므로 NVIDIA 공식 발표 자료와 대조해야 한다.
Cosmos 3 관련 구간의 타임스탬프가 [100:04]와 [1:40:44]처럼 함께 표기되어 있어, 원본 타임코드 변환 또는 섹션 생성 과정에서 중복·오류가 있었는지 확인이 필요하다.
“대만 GDP가 연간 거의 10% 성장할 수 있다”, “2030년 전 100GW 규모 AI factory”, “1GW 시설 비용 800억~1,000억 달러 가능성” 같은 수치는 발표자의 전망 또는 산업적 주장으로 보이며, 실제 경제 전망이나 확정된 투자 규모로 단정하기 전에 별도 검증이 필요하다.
자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.

✅ 액션 아이템

NVIDIA 공식 GTC Taipei 2026 발표 자료, 보도자료, 제품 페이지를 확인해 Vera Rubin, Vera CPU, RTX Spark, Cosmos, NeMo agentic toolkit 등 주요 명칭과 사양을 검증한다.
영상 내 성능 수치와 경제 수치를 별도 표로 정리하고, 각 수치가 발표자의 전망인지, 데모 결과인지, 공식 벤치마크인지 구분한다.
Neotron, Grok LPX, Alpamo2, Open Shell, Hermes harness 등 자동 전사에서 오기 가능성이 높은 용어를 원본 영상 자막 또는 공식 자료와 대조한다.
“에이전틱 AI → AI factory → Vera Rubin/Vera CPU → PC/로봇 확산” 흐름을 한 장짜리 구조도로 정리해 키노트의 전체 논리를 시각화한다.

❓ 열린 질문

NVIDIA가 말하는 “에이전트를 위한 CPU” 시장은 기존 서버 CPU 시장을 얼마나 대체하고, 얼마나 새로운 수요를 창출하는 방향으로 전개될까요?
AI factory의 수익성이 “토큰 생산량”에 의해 결정된다면, 향후 경쟁력은 GPU 성능보다 전력 효율·가동률·네트워크·스토리지·소프트웨어 스택 중 어디에서 더 크게 갈릴까요?
기업이 자체 에이전트를 운영할 때 가장 큰 병목은 모델 성능, 도구 연결, 보안 정책, 메모리 시스템, 데이터 품질 중 무엇이 될까요?

🖼️ 인포그래픽

🖼️ 4컷 인포그래픽

💡 한 줄 결론

📌 핵심 요점

🧩 배경과 문제 정의

🕒 시간순 섹션별 상세정리

1. 토큰이 AI 인프라의 기본 단위로 자리 잡는다

2. AI 적용 범위가 의료·우주·인류 공동 미래로 확장된다

3. 타이완 생태계가 엔비디아 AI 공급망의 중심으로 부각된다

4. 에이전틱 AI가 도착하고 소프트웨어 개발 생산성이 급증한다

5. AI 생산성은 소프트웨어 개발자 수요와 경제 산출을 동시에 키운다

6. 토큰은 수익 단위가 되고 AI 팩토리와 대만 컴퓨트 수요를 밀어 올린다

7. 에이전트 컴퓨팅은 모델·하네스·메모리·도구 사용을 하나로 묶는다

8. 의도 입력과 도구 사용이 애플리케이션 중심 사용 방식을 대체한다

9. CUDA X 라이브러리는 에이전트가 사용할 과학·공학 도구로 확장된다

10. 에이전트는 모델·하네스·도구·런타임이 분산된 컴퓨팅 구조로 작동한다

11. 에이전트의 사고와 도구 사용은 랙·CPU·GPU 자원을 반복적으로 호출한다

12. 에이전트 메모리와 보안·오케스트레이션은 데이터센터와 스토리지 구조를 바꾼다

13. Vera Rubin은 칩이 아니라 보안까지 포함한 전체 시스템이다

14. AI factory 구축은 전력·냉각·그리드까지 포함한 인프라 문제로 확장된다

15. DSX는 디지털 트윈과 운영 소프트웨어로 구축 전 검증과 운영 자동화를 연결한다

16. 전력 최적화와 Omniverse 시뮬레이션이 AI factory의 경제성을 좌우한다

17. AI 클라우드 확산과 지역별 인프라 수요

18. AI 팩토리 구축 역량과 ‘컴퓨트=매출’ 논리

19. 통합 설계가 만드는 가동 속도와 전력당 수익

20. 신뢰성·유연성·생태계가 자산 수명과 TCO를 결정한다

21. AI 수요 폭증과 Vera Rubin 양산 전환

22. 에이전트형 AI가 요구하는 새로운 슈퍼컴퓨터 구조

23. Vera Rubin 랙 시스템과 핵심 구성요소

24. 대만 공급망과 실물 Vera Rubin 공개

25. 추론 비용과 NVLink 72의 역할

26. Vera Rubin 랙 구조와 네트워킹 확장

27. 사람 중심 CPU에서 에이전트 중심 CPU로 전환된다

28. AI 팩토리 경제성과 Vera CPU 아키텍처

29. Vera의 핵심 기준은 단일 스레드 성능과 대역폭이다

30. Vera는 PCIe Gen 6, LPDDR5X, 내부 패브릭으로 대역폭 병목을 줄인다

31. 에이전트 루프에 맞춘 Vera의 코어·메모리·패브릭 설계

32. Vera는 다중 소켓·GPU 연결·AI 스토리지까지 확장되는 성장 축이다

33. Grace Blackwell 전환 이후 Vera CPU 성능 근거

34. 실시간 스트림 처리와 Vera 생태계 확장

35. 에이전트용 CPU라는 새 시장

36. 엔터프라이즈 에이전트 운영체제 구성

37. 칩 설계 슈퍼 에이전트와 검증 자동화

38. Codex·ChipStack·Neotron이 결합한 검증 루프

39. CUDA 가속 도구와 Neotron 3 Ultra 공개

40. 더 빠른 오픈 모델과 엔터프라이즈 에이전트 시장

41. Windows PC 구조가 만든 개인 컴퓨팅의 출발점

42. Microsoft와 Nvidia가 에이전트 시대의 PC를 다시 설계한다

43. RTX Spark는 AI 에이전트용 개인 컴퓨터 플랫폼을 하드웨어와 OS까지 확장한다

44. N1X와 RTX Spark 노트북은 기존 소프트웨어와 새 에이전트를 한 장치에서 실행한다

45. RTX Spark에서 로컬 에이전트가 설계 워크플로를 자동화한다

46. Adobe와 생태계 참여로 RTX Spark가 에이전트 친화 PC 플랫폼으로 확장된다

47. Microsoft와 Nvidia의 새 Windows PC 라인업이 개인 AI 컴퓨팅 범위를 넓힌다

48. PC는 앱 실행 도구에서 집 안의 AI 슈퍼컴퓨터로 바뀐다

49. 새 PC 제품군과 에이전틱 컴퓨터 확산

50. 물리 AI의 데이터 병목과 로봇 관점 학습

51. Cosmos 3와 물리 AI 기반 모델의 역할

52. 합성 데이터·시뮬레이션·오픈 모델 스택

53. 자율주행 오픈 모델과 Hyperion 배포 생태계

54. 자율주행에서 휴머노이드로 확장되는 동일한 시스템 패턴

55. Isaac Groot reference humanoid robot의 사양과 연구용 목적

56. 개방형 로봇 개발 파이프라인과 반복되는 agentic computing 구조

57. Vera Rubin과 에이전트 인프라 전환

58. 에이전트 컴퓨팅의 PC·로봇·엣지 확산

59. 음악으로 압축된 제품 메시지와 마무리 인사

🧾 결론

📈 투자·시사 포인트

⚠️ 불확실하거나 확인이 필요한 부분

✅ 액션 아이템

❓ 열린 질문

공통 태그

함께 탐색할 태그

관련 문서

Stanford CS153 Frontier Systems

10년도 부족하다" 젠슨황이 찍어준 AI 랠리 다음 무대

깐부 회동의 새 멤버들, 젠슨황의 힌트일까요? - 김덕진 IT커뮤니케이션 연구소 소장

엔비디아 마진, 가이던스 보다 더 큰 문제는

175년 역사 지켜온 CEO의 변심…유리 기업이 판을 바꾼 빅테크 AI 전쟁

[투자 노하우] 메타 컴퓨트에 이어 앤트로픽 자체 칩 생산 논의