YouTube언더스탠딩 : 세상의 모든 지식·2026년 4월 26일·0

로봇 껍데기에 속지 마세요, 돈 여기로 몰립니다 (서울시립대학교 김덕진 겸임교수) (2부)

Quick Summary

로봇 껍데기에 속지 마세요, 돈 여기로 몰립니다 (서울시립대학교 김덕진 겸임교수) (2부)를 중심으로, 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인를 핵심 판단 포인트로 압축 정리한다.

영상 보기

클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.

원본 열기

💡 한 줄 결론

로봇 껍데기에 속지 마세요, 돈 여기로 몰립니다 (서울시립대학교 김덕진 겸임교수) (2부)를 중심으로, 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인를 핵심 판단 포인트로 압축 정리한다.

📌 핵심 요점

  1. 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인식과 판단의 결합에서 갈라진다
  2. 보스턴 다이나믹스와 구글 딥마인드의 협력은 로봇에 더 높은 수준의 지능을 넣는 방향으로 이어졌고, 최근 스팟에 판단 기능이 결합된 산출물이 나왔다
  3. 중요한 변화는 새 로봇 구매가 아니라 이미 공장에서 돌아다니던 스팟에 업데이트를 적용해 성능이 좋아지는 구조다
  4. 화이트보드에 손글씨로 적힌 할 일 목록을 로봇이 눈으로 읽고 순서대로 수행하는 사례는 시각 인식과 행동 계획이 실제 공간에서 연결되는 변화를 보여준다
  5. 인터넷 시대에는 가장 먼저 시작한 기업이 반드시 최종 승자가 되지 않았고, 네이버와 구글 같은 후발주자도 시장을 따라잡거나 주도권을 가져갔다

🧩 배경과 문제 정의

  • 피지컬 AI의 핵심은 로봇 외형보다 시각 인식, 판단, 추론, 행동이 실제 몸체 안에서 결합되는지에 있다.
  • 기존 로봇은 정해진 동작을 반복하거나 원격 제어에 의존했지만, 공장·점검·가정 환경에서는 상황을 보고 스스로 판단하는 능력이 필요하다.
  • 이미 배치된 로봇이 소프트웨어 업데이트로 더 똑똑해질 수 있다면, 로봇 산업의 가치는 하드웨어 판매보다 지능 업그레이드와 운용 자동화 쪽으로 이동한다.

🕒 시간순 섹션별 상세정리

1. 반복 학습에 묶인 기존 로봇의 한계 [00:00]

  • 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인식과 판단의 결합에서 갈라진다.
  • 보스턴 다이나믹스 로봇은 CES 현장에서 움직임을 보여줬지만, 실제로는 사람이 같은 작업을 다섯 시간 동안 수행한 데이터를 따라 하는 방식에 가까웠다.
  • 사람이 실시간으로 지켜보다가 로봇이 이상한 행동을 하면 즉시 고쳐주는 구조였고, 단일 작업 학습에는 유효하지만 여러 작업이 얽힌 공장 환경에는 한계가 남는다.
  • 공장에서 다양한 공정과 연동하려면 별도 학습이 다시 필요하며, 인간이 시범을 보이는 학습만으로는 범용적인 자동화까지 바로 이어지기 어렵다.
  • 보스턴 다이나믹스와 구글 딥마인드의 협력은 로봇에 더 높은 수준의 지능을 넣는 방향으로 이어졌고, 최근 스팟에 판단 기능이 결합된 산출물이 나왔다.
  • 기존 스팟은 원격 조종이나 카메라 관찰 중심으로 움직였지만, 새 변화에서는 주변을 보고 문이 열려 있는지처럼 상태를 추론하는 능력이 들어간다.
  • 공장 안에서 아날로그 게이지를 확인하다가 특정 온도가 비정상적으로 높아진 상황을 감지하면, 사람이 보던 복합 점검 업무 일부를 로봇이 지능적으로 대체할 수 있다.
  • 점검 자동화는 공장 운영자와 유지보수 인력에게 직접적인 영향을 주며, 위험 상황을 더 빠르게 발견할 가능성과 기존 업무 재배치 압력을 동시에 만든다.

2. 기존 로봇을 지능화하는 OTA형 업데이트 [02:20]

  • 중요한 변화는 새 로봇 구매가 아니라 이미 공장에서 돌아다니던 스팟에 업데이트를 적용해 성능이 좋아지는 구조다.
  • 테슬라 차량이 소프트웨어 업데이트로 기능이나 속도가 개선되는 것처럼, 로봇도 하드웨어 교체 없이 자체적인 학습과 판단 능력이 강화될 수 있다.
  • 구글 딥마인드의 Gemini Robotics ER 같은 embodied robotics 기술이 들어가면서, 사람이 눈으로 하던 점검과 판단이 로봇의 시각·추론 시스템으로 옮겨간다.
  • 로봇 가치의 중심은 껍데기와 기계 장치만이 아니라 업데이트 가능한 지능, 현장 데이터, 운용 소프트웨어로 확장된다.
  • 화이트보드에 손글씨로 적힌 할 일 목록을 로봇이 눈으로 읽고 순서대로 수행하는 사례는 시각 인식과 행동 계획이 실제 공간에서 연결되는 변화를 보여준다.
  • 클로드 같은 고성능 AI는 컴퓨터 안에서 작동하지만, 구글의 최근 변화는 그런 추론 능력이 로봇 몸체 안으로 들어가는 방향에 가깝다.
  • 로봇은 대화 관리자와 도구 선택 과정을 거쳐 어떤 물건을 집어야 하는지, 사진을 찍어야 하는지, 데이터를 처리해야 하는지 판단하는 흐름으로 움직인다.
  • 비전-언어-액션 구조가 작동하면 로봇은 단순 명령 실행 장비를 넘어, 보고 이해한 뒤 실제 행동으로 옮기는 피지컬 AI 플랫폼에 가까워진다.

3. 월드 모델 기반 피지컬 AI의 행동 예측 [04:00]

  • 피지컬 AI는 데이터가 충분하지 않은 상황에서도 스스로 장면을 예측하고, 머릿속에서 영상처럼 가능한 행동 결과를 생성하는 방향으로 발전한다.
  • 삐뚤어진 책을 바로 세우는 사례에서는 로봇이 과거처럼 수많은 데이터를 반복 학습하는 대신, 물체를 잡는 방식별 결과를 미리 시뮬레이션하는 구조가 핵심이다.
  • 아직 완벽한 단계는 아니지만, 이런 능력이 챗GPT 모먼트처럼 급격히 확산되면 피지컬 AI의 실용화 속도가 빨라질 수 있다.
  • 구글은 피지컬 AI 영역에서 월드 모델과 추론 능력을 로봇의 몸, 즉 embodied AI와 결합하는 방향을 추진한다.
  • 동시에 스마트폰 안에서 작동하도록 최적화된 AI도 중요한 축으로 다뤄지며, 피지컬 AI와 온디바이스 AI가 서로 다른 결의 기술 흐름을 만든다.
  • 투자 관점에서는 로봇 껍데기보다 AI가 실제 환경을 이해하고 행동으로 연결하는 모델 구조가 더 중요한 판단 기준이 된다.

4. 초기 선도 기업이 끝까지 승자가 되는지에 대한 투자 질문 [05:38]

  • 인터넷 시대에는 가장 먼저 시작한 기업이 반드시 최종 승자가 되지 않았고, 네이버와 구글 같은 후발주자도 시장을 따라잡거나 주도권을 가져갔다.
  • 피지컬 AI와 생성형 AI에서도 같은 패턴이 반복된다면, 현재 앞서가는 기업을 장기 투자 대상으로 볼지 현금을 보유하며 변화를 기다릴지 판단이 어려워진다.
  • 과거 인터파크처럼 초기 주가 상승으로 큰 수익을 낸 사례는 있었지만, 장기적으로는 산업의 승자와 초기 주가 급등 기업이 다를 수 있다는 리스크가 남는다.
  • 오픈AI는 생성형 AI의 대표 선도 기업이지만, 제미나이와 클로드 같은 경쟁 서비스가 빠르게 추격하면서 상장 가능성과 시장 신뢰에 대한 우려가 커진다.
  • 오픈AI 같은 대형 기업의 상장 실패는 개별 기업 문제를 넘어 AI 시장 전체의 거품 논란으로 번질 수 있을 만큼 상징성이 크다.
  • 생성형 AI에서 투자 성과를 낸 쪽은 최상단 서비스만 본 것이 아니라, 전기, GPU, 데이터센터, SSD처럼 AI 작동에 필요한 하부 구조를 함께 파악한 경우다.

5. 피지컬 AI 투자는 기업명보다 밸류체인 구조가 먼저다 [08:01]

  • 피지컬 AI에 돈이 몰릴수록 특정 기업만 따라가는 방식보다 시장이 어떤 레이어로 구성되는지 이해하는 능력이 중요해진다.
  • 챗GPT가 등장했을 때 상장 여부만 본 사람과 밑단의 프레임워크·구조를 공부한 사람이 갈렸듯이, 피지컬 AI도 표면의 로봇보다 기반 구조를 봐야 한다.
  • 전력, 클라우드, 칩, 센서, 플랫폼, 로보틱스, 응용 레이어가 이어지며, 어느 한 지점이 바뀌어도 계속 수혜를 받는 영역이 생길 수 있다.
  • 밸류체인을 이해하면 뉴스의 의미가 달라지고, 단순 화제성보다 어느 레이어에서 돈이 벌리는지 판단할 수 있다.

6. 스킬드 AI 사례는 하드웨어 기업이 범용 두뇌를 찾는 흐름을 보여준다 [09:38]

  • 스킬드 AI는 피지컬 AI 레이어 중 AI 플랫폼 기반에 가까운 회사로, 여러 로봇에 적용될 수 있는 범용 두뇌를 만들려는 방향에 있다.
  • 구광모 회장이 4월 2일 실리콘밸리를 방문해 만난 회사라는 사례는 하드웨어 강점을 가진 기업이 로봇의 두뇌 역할을 외부에서 찾는 흐름으로 해석된다.
  • 하드웨어를 잘 만드는 기업도 뇌 역할을 직접 만들기 어렵다면, 삼성과 구글의 협업처럼 플랫폼·AI 두뇌 기업과 협력할 가능성이 커진다.
  • 지금은 챗GPT 초기처럼 구조, 아키텍처, 기술 흐름을 분석해 어떤 레이어의 기업이 잘될지 가려야 하는 시점이다.

7. 피지컬 AI에서는 구글과 범용 두뇌 스타트업이 유력한 축으로 거론된다 [10:45]

  • 구글은 여전히 피지컬 AI와 인공지능 흐름에서 강한 후보로 평가되며, 보유한 AI 역량과 플랫폼 기반이 로봇 시장에서도 중요하게 작용할 수 있다.
  • 스킬드 AI 같은 범용 두뇌 스타트업은 로봇 하드웨어 위에 올라갈 지능을 담당할 수 있어, 단순 부품 기업과 다른 가치 평가를 받을 수 있다.
  • 중국 기업들이 하드웨어와 부품 영역에서 빠르게 치고 올라오는 상황에서는 두뇌, 플랫폼, 고부가 소프트웨어 레이어의 희소성이 더 커질 수 있다.
  • 피지컬 AI 투자에서는 로봇 완성품보다 어느 기업이 지능, 제어, 플랫폼의 핵심 위치를 차지하는지가 더 중요한 판단 기준이 된다.

8. 휴머노이드 부품 가치는 인간형 완성도보다 실제 작업 요구에 따라 갈린다 [11:20]

  • 액추에이터와 손가락 기술은 휴머노이드의 중요한 부품 영역이지만, 모든 현장에 완벽한 인간형 손이 필요한 것은 아니다.
  • 완벽한 사람 형태의 휴머노이드가 필요한 곳과 특정 작업만 수행하면 되는 곳이 나뉘며, 산업 현장에서는 기능 최적화가 인간형 모방보다 중요할 수 있다.
  • 보스턴다이내믹스 로봇 손가락이 다섯 개가 아니라 네 개였던 사례는 공장 작업에서 인간 손과 동일한 구조가 반드시 필요하지 않다는 점을 보여준다.
  • 실제 사용처가 요구하는 조작 능력에 따라 액추에이터, 손가락 수, 로봇 팔 설계의 가치가 달라지고, 부품 기업의 수혜 범위도 달라질 수 있다.

9. 산업별 로봇 손 구조와 비용 효율 [12:00]

  • 공장용 로봇은 처음부터 작업 효율과 가격을 기준으로 설계되며, 사람 손처럼 다섯 손가락을 갖추는 것보다 필요한 물체를 안정적으로 집는 구조가 더 중요하다.
  • 세 손가락 구조는 집기 성능이 부족했고, 네 손가락 구조는 공장 작업에서 굳이 더 복잡한 손 형태가 필요 없다는 판단으로 이어진다.
  • 의료 영역처럼 섬세한 조작이 필요한 분야에서는 손 자체의 정밀도와 힘 조절이 중요해지며, 같은 로봇 손이라도 산업별 요구 조건이 크게 달라진다.
  • 비용 판단의 핵심은 인간 인건비 대비 대체 효율이며, 디테일한 부품·제어 기술에는 아직 일정 수준의 기술적 해자가 남아 있다.
  • 싱가포르 쪽 일부 회사들은 손가락 기능에 집중해 종이접기 같은 정밀 작업을 시도했고, 특정 기능층마다 경쟁력 있는 기업이 나올 가능성이 있다.
  • 당장 투자 관점에서는 휴머노이드 본체보다 손, 팔, 이동체, 관측 장비처럼 세분화된 피지컬 AI 영역이 더 빠르게 기회를 만들 수 있다.
  • 피지컬 AI는 이동 기반, 관측 기반, 조작 기반, 운용·제어 기반처럼 여러 갈래로 나뉘며, 휴머노이드는 그중 하나의 최종 결합 형태에 가깝다.

10. 관측 기반 피지컬 AI의 조기 상용화 가능성 [13:30]

  • 이동 기반 피지컬 AI에는 자율주행차와 자율 로봇이 포함되며, 관측 기반 피지컬 AI에는 드론·구조·모니터링 로봇이 포함된다.
  • 관측 로봇은 통신이 끊겨도 스스로 추론하며 움직이는 수준으로 발전하고 있고, 송유관처럼 복잡하거나 사람이 들어가기 어려운 공간에서 활용 가치가 커진다.
  • 조작 기반 피지컬 AI는 로봇 팔이나 공장 운용, 스마트빌딩 제어와 연결되며, 사람의 직접 제어 없이도 AI와 결합해 더 강력한 자동화가 가능해진다.
  • 휴머노이드가 본격화되기 전에도 이동·관측·조작·운용 기술이 단계적으로 시장을 열고, 이후 여러 선행 기술이 합쳐지며 휴머노이드로 이어질 가능성이 있다.

11. 추론형 로봇과 관제·경비 활용 사례 [14:47]

  • 구글의 실험 사례에서는 태극기, 바나나 같은 사물과 음악 맥락을 연결해 K팝에 맞는 대상을 고르는 식의 시각·언어·상황 추론이 나타난다.
  • 로봇이 단순히 움직이는 장비를 넘어 보고 판단하는 능력을 갖추면, 야간 순찰과 이상 징후 확인 같은 경비 업무 일부를 대체할 가능성이 커진다.
  • CES에서 본 후지 사례는 자체 로봇을 만들지 않고 유니트리 로봇과 드론형 장비를 가져와 관제 시스템을 구성하는 방식에 가깝다.
  • 로봇은 평소 웰커밍 역할을 하다가 필터링을 통해 의심 상황을 감지하는 구조로 확장될 수 있으며, 하드웨어 제조보다 관제·운용 소프트웨어가 별도 시장을 만들 수 있다.

12. 휴머노이드는 하드웨어보다 디바이스·서비스 분화가 핵심이다 [16:01]

  • 사람의 행동을 대신하거나 보조하는 형태의 디바이스가 등장하면서, 휴머노이드는 단일 제품이 아니라 다양한 서비스 조합으로 갈라질 가능성이 크다.
  • PC가 시간이 지나며 누구나 조립 가능한 범용 제품이 된 것처럼, 휴머노이드 하드웨어도 장기적으로 제조 진입장벽이 낮아질 수 있다.
  • 하드웨어 자체보다 어떤 소프트웨어를 갈아 끼우고 어떤 서비스 모델을 붙이느냐가 시장의 핵심 경쟁력이 될 수 있다.
  • 애플은 경쟁자들이 먼저 실험하고 승자가 보일 때 진입하는 전략을 취하는 듯하며, 이 방식이 효율적인지 방심인지 판단이 갈린다.
  • 테슬라와 구글 등은 먼저 대규모 자원을 투입하며 시장 선점을 노리는 쪽에 가깝고, 초기 시장에서는 1등이 대부분을 가져갈 가능성도 배제하기 어렵다.
  • 같은 현상을 두고도 애플은 기다리는 전략을 선택하고, 다른 기업들은 공격적으로 뛰어드는 전략을 선택한다는 점에서 시장 해석이 다르다.

13. 애플은 생성형 AI에서 자체 전략의 한계를 겪었다 [17:51]

  • 구글의 선제 전략이 더 유리할 수 있다는 판단은 애플이 생성형 AI 영역에서 이미 한 차례 어려움을 겪었다는 해석과 연결된다.
  • 애플은 자체 LLM을 시도했지만 기대만큼 작동하지 않았고, 구글 모델을 임시로 쓰더라도 한 번 탑재된 모델을 나중에 바꾸기는 쉽지 않다.
  • 프라이버시 정책 때문에 LLM 앞뒤에 보완 구조를 붙이는 방식이 필요했지만, 그 구조가 원활히 작동하지 않은 부분이 있었던 것으로 추정된다.
  • 애플은 AI 모델 자체에서 밀려도 압도적인 디바이스 권한을 갖고 있어, 애플 기기와 구글 AI가 함께 이익을 얻는 구도가 생길 수 있다.

14. 초기 AI 시장은 관심도보다 돈의 흐름과 사업 논리가 중요하다 [18:51]

  • 그록처럼 특정 AI 서비스가 갑자기 주목받았다가 뉴스에서 덜 보이는 사례는 초기 시장의 변동성이 크다는 점을 보여준다.
  • 뉴스 노출이 줄었다고 사업 자체가 끝난 것은 아니며, 아직 시장 초창기라 어떤 서비스와 기업이 최종적으로 살아남을지 단정하기 어렵다.
  • 각 기업은 돈이 되는 영역, 자기 비즈니스 모델과 맞는 영역, 대규모 지출을 정당화할 수 있는 영역에 집중하고 있다.
  • 명확한 비즈니스 모델, 캐시카우, 투자 근거 없이 돈을 계속 쓰는 기업은 점점 더 위험해지는 시장 환경에 놓인다.

15. AI로 전문직 실무가 평준화되는 상황 [20:02]

  • AI 확산 이후 일부 전문직 영역에서는 신입 채용이 줄어들고, 로펌에서도 기존 주니어 업무의 필요성이 약해지는 흐름이 나타난다.
  • 법률 서비스의 기술적 업무는 AI가 처리하면서 실력 차이가 비슷해지고, 단순한 법률 지식이나 문서 작업만으로는 차별화가 어려워진다.
  • 변호사 업계에서는 관록 있는 변호사보다도 전관 출신이나 특정 기관 경험자의 대체 불가능성이 더 크게 부각된다.
  • 세무·국세청 출신 변호사처럼 특정 기관 경험과 네트워크를 가진 사람은 AI로 쉽게 대체되기 어렵다.
  • 법률 서비스가 AI로 모두 같아질 것이라는 생각은 단순화된 판단이며, 실제 분쟁에는 상대방과의 관계, 조직 간 경쟁, 사람 간 접촉이 함께 작동한다.
  • 대형 로펌끼리 맞붙는 상황에서도 AI가 밤샘 문서 작업을 대신하면, 승부는 절약된 시간을 사람 관계와 전략적 접촉에 어떻게 쓰는지로 옮겨간다.

16. AI가 만든 효율은 사람의 비효율적 관계 활동으로 이동한다 [21:05]

  • AI가 실무 시간을 줄이면 변호사와 관계자들은 남는 시간에 더 많은 사람을 만나고, 관계를 넓히며, 영향력을 확보하는 활동에 집중하게 된다.
  • 판사나 관련 인물과의 친분, 만남, 비공식적 네트워크 같은 요소가 기술적 실무보다 더 중요한 변수로 떠오를 수 있다.
  • “AI가 만들어 준 시간의 효율을 비효율의 낭만에 써야 한다”는 표현은, 자동화 이후에도 사람의 시간과 관계 활동이 경쟁력의 핵심으로 남는다는 의미다.
  • 단순한 정보 전달만으로는 가치가 충분하지 않고, 사람들은 관계·경험·신뢰가 결합된 활동에서 여전히 차별성을 찾는다.
  • 골프, 술자리, 사우나 같은 오프라인 접촉은 로비만의 문제가 아니라, AI 시대에 더 깊이 고민해야 할 인간적 관계 형성의 사례로 다뤄진다.
  • AI가 전문 업무를 자동화할수록 사람에게 남는 일은 줄어드는 것이 아니라, 더 복잡한 관계 관리와 판단의 영역으로 이동한다.

🧾 결론

  • 로봇 껍데기에 속지 마세요, 돈 여기로 몰립니다 (서울시립대학교 김덕진 겸임교수) (2부)를 중심으로, 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인를 핵심 판단 포인트로 압축 정리한다.
  • 보스턴 다이나믹스와 구글 딥마인드의 협력은 로봇에 더 높은 수준의 지능을 넣는 방향으로 이어졌고, 최근 스팟에 판단 기능이 결합된 산출물이 나왔다
  • AI가 전문 업무를 자동화할수록 사람에게 남는 일은 줄어드는 것이 아니라, 더 복잡한 관계 관리와 판단의 영역으로 이동한다

📈 투자·시사 포인트

  • 중요한 변화는 새 로봇 구매가 아니라 이미 공장에서 돌아다니던 스팟에 업데이트를 적용해 성능이 좋아지는 구조다
  • 반복 운영과 예외 대응이 많은 조직일수록 자동화 ROI를 비교적 빠르게 확인할 가능성이 있다.
  • 공통 워크스페이스, 메모리 구조, API 연동 기반에 대한 투자 필요성이 커질 수 있다.

⚠️ 불확실하거나 확인이 필요한 부분

  • 일부 자막 표현은 자동 추출 특성상 고유명사나 제품명이 부정확할 수 있어 원문 확인이 필요하다.
  • 영상 속 수치와 자동화 범위는 발표자 설명 기반이므로 외부 검증 자료와는 구분해서 봐야 한다.

✅ 액션 아이템

  • 현재 조직의 반복 운영 업무를 목록화하고 자동화 우선순위를 정리한다.
  • 메모리·규칙·툴 사용 문서를 한곳에서 관리할지 역할별로 분리할지 기준을 정한다.
  • 민감 데이터와 일반 업무를 같은 에이전트에 둘지 권한을 분리할지 검토한다.

❓ 열린 질문

  • 이 구조를 다른 조직에 옮길 때 가장 먼저 막히는 데이터/API 병목은 무엇인가?
  • 단일 에이전트와 멀티 에이전트 운영은 어떤 업무 조건에서 각각 더 유리한가?

관련 문서

공통 태그와 주제 흐름을 기준으로 같이 보면 좋은 문서를 이어서 제안합니다.