로봇 껍데기에 속지 마세요, 돈 여기로 몰립니다 (서울시립대학교 김덕진 겸임교수) (2부)
Quick Summary
로봇 껍데기에 속지 마세요, 돈 여기로 몰립니다 (서울시립대학교 김덕진 겸임교수) (2부)를 중심으로, 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인를 핵심 판단 포인트로 압축 정리한다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
💡 한 줄 결론
로봇 껍데기에 속지 마세요, 돈 여기로 몰립니다 (서울시립대학교 김덕진 겸임교수) (2부)를 중심으로, 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인를 핵심 판단 포인트로 압축 정리한다.
📌 핵심 요점
- 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인식과 판단의 결합에서 갈라진다
- 보스턴 다이나믹스와 구글 딥마인드의 협력은 로봇에 더 높은 수준의 지능을 넣는 방향으로 이어졌고, 최근 스팟에 판단 기능이 결합된 산출물이 나왔다
- 중요한 변화는 새 로봇 구매가 아니라 이미 공장에서 돌아다니던 스팟에 업데이트를 적용해 성능이 좋아지는 구조다
- 화이트보드에 손글씨로 적힌 할 일 목록을 로봇이 눈으로 읽고 순서대로 수행하는 사례는 시각 인식과 행동 계획이 실제 공간에서 연결되는 변화를 보여준다
- 인터넷 시대에는 가장 먼저 시작한 기업이 반드시 최종 승자가 되지 않았고, 네이버와 구글 같은 후발주자도 시장을 따라잡거나 주도권을 가져갔다
🧩 배경과 문제 정의
- 피지컬 AI의 핵심은 로봇 외형보다 시각 인식, 판단, 추론, 행동이 실제 몸체 안에서 결합되는지에 있다.
- 기존 로봇은 정해진 동작을 반복하거나 원격 제어에 의존했지만, 공장·점검·가정 환경에서는 상황을 보고 스스로 판단하는 능력이 필요하다.
- 이미 배치된 로봇이 소프트웨어 업데이트로 더 똑똑해질 수 있다면, 로봇 산업의 가치는 하드웨어 판매보다 지능 업그레이드와 운용 자동화 쪽으로 이동한다.
🕒 시간순 섹션별 상세정리
1. 반복 학습에 묶인 기존 로봇의 한계 [00:00]
- 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인식과 판단의 결합에서 갈라진다.
- 보스턴 다이나믹스 로봇은 CES 현장에서 움직임을 보여줬지만, 실제로는 사람이 같은 작업을 다섯 시간 동안 수행한 데이터를 따라 하는 방식에 가까웠다.
- 사람이 실시간으로 지켜보다가 로봇이 이상한 행동을 하면 즉시 고쳐주는 구조였고, 단일 작업 학습에는 유효하지만 여러 작업이 얽힌 공장 환경에는 한계가 남는다.
- 공장에서 다양한 공정과 연동하려면 별도 학습이 다시 필요하며, 인간이 시범을 보이는 학습만으로는 범용적인 자동화까지 바로 이어지기 어렵다.
- 보스턴 다이나믹스와 구글 딥마인드의 협력은 로봇에 더 높은 수준의 지능을 넣는 방향으로 이어졌고, 최근 스팟에 판단 기능이 결합된 산출물이 나왔다.
- 기존 스팟은 원격 조종이나 카메라 관찰 중심으로 움직였지만, 새 변화에서는 주변을 보고 문이 열려 있는지처럼 상태를 추론하는 능력이 들어간다.
- 공장 안에서 아날로그 게이지를 확인하다가 특정 온도가 비정상적으로 높아진 상황을 감지하면, 사람이 보던 복합 점검 업무 일부를 로봇이 지능적으로 대체할 수 있다.
- 점검 자동화는 공장 운영자와 유지보수 인력에게 직접적인 영향을 주며, 위험 상황을 더 빠르게 발견할 가능성과 기존 업무 재배치 압력을 동시에 만든다.
2. 기존 로봇을 지능화하는 OTA형 업데이트 [02:20]
- 중요한 변화는 새 로봇 구매가 아니라 이미 공장에서 돌아다니던 스팟에 업데이트를 적용해 성능이 좋아지는 구조다.
- 테슬라 차량이 소프트웨어 업데이트로 기능이나 속도가 개선되는 것처럼, 로봇도 하드웨어 교체 없이 자체적인 학습과 판단 능력이 강화될 수 있다.
- 구글 딥마인드의 Gemini Robotics ER 같은 embodied robotics 기술이 들어가면서, 사람이 눈으로 하던 점검과 판단이 로봇의 시각·추론 시스템으로 옮겨간다.
- 로봇 가치의 중심은 껍데기와 기계 장치만이 아니라 업데이트 가능한 지능, 현장 데이터, 운용 소프트웨어로 확장된다.
- 화이트보드에 손글씨로 적힌 할 일 목록을 로봇이 눈으로 읽고 순서대로 수행하는 사례는 시각 인식과 행동 계획이 실제 공간에서 연결되는 변화를 보여준다.
- 클로드 같은 고성능 AI는 컴퓨터 안에서 작동하지만, 구글의 최근 변화는 그런 추론 능력이 로봇 몸체 안으로 들어가는 방향에 가깝다.
- 로봇은 대화 관리자와 도구 선택 과정을 거쳐 어떤 물건을 집어야 하는지, 사진을 찍어야 하는지, 데이터를 처리해야 하는지 판단하는 흐름으로 움직인다.
- 비전-언어-액션 구조가 작동하면 로봇은 단순 명령 실행 장비를 넘어, 보고 이해한 뒤 실제 행동으로 옮기는 피지컬 AI 플랫폼에 가까워진다.
3. 월드 모델 기반 피지컬 AI의 행동 예측 [04:00]
- 피지컬 AI는 데이터가 충분하지 않은 상황에서도 스스로 장면을 예측하고, 머릿속에서 영상처럼 가능한 행동 결과를 생성하는 방향으로 발전한다.
- 삐뚤어진 책을 바로 세우는 사례에서는 로봇이 과거처럼 수많은 데이터를 반복 학습하는 대신, 물체를 잡는 방식별 결과를 미리 시뮬레이션하는 구조가 핵심이다.
- 아직 완벽한 단계는 아니지만, 이런 능력이 챗GPT 모먼트처럼 급격히 확산되면 피지컬 AI의 실용화 속도가 빨라질 수 있다.
- 구글은 피지컬 AI 영역에서 월드 모델과 추론 능력을 로봇의 몸, 즉 embodied AI와 결합하는 방향을 추진한다.
- 동시에 스마트폰 안에서 작동하도록 최적화된 AI도 중요한 축으로 다뤄지며, 피지컬 AI와 온디바이스 AI가 서로 다른 결의 기술 흐름을 만든다.
- 투자 관점에서는 로봇 껍데기보다 AI가 실제 환경을 이해하고 행동으로 연결하는 모델 구조가 더 중요한 판단 기준이 된다.
4. 초기 선도 기업이 끝까지 승자가 되는지에 대한 투자 질문 [05:38]
- 인터넷 시대에는 가장 먼저 시작한 기업이 반드시 최종 승자가 되지 않았고, 네이버와 구글 같은 후발주자도 시장을 따라잡거나 주도권을 가져갔다.
- 피지컬 AI와 생성형 AI에서도 같은 패턴이 반복된다면, 현재 앞서가는 기업을 장기 투자 대상으로 볼지 현금을 보유하며 변화를 기다릴지 판단이 어려워진다.
- 과거 인터파크처럼 초기 주가 상승으로 큰 수익을 낸 사례는 있었지만, 장기적으로는 산업의 승자와 초기 주가 급등 기업이 다를 수 있다는 리스크가 남는다.
- 오픈AI는 생성형 AI의 대표 선도 기업이지만, 제미나이와 클로드 같은 경쟁 서비스가 빠르게 추격하면서 상장 가능성과 시장 신뢰에 대한 우려가 커진다.
- 오픈AI 같은 대형 기업의 상장 실패는 개별 기업 문제를 넘어 AI 시장 전체의 거품 논란으로 번질 수 있을 만큼 상징성이 크다.
- 생성형 AI에서 투자 성과를 낸 쪽은 최상단 서비스만 본 것이 아니라, 전기, GPU, 데이터센터, SSD처럼 AI 작동에 필요한 하부 구조를 함께 파악한 경우다.
5. 피지컬 AI 투자는 기업명보다 밸류체인 구조가 먼저다 [08:01]
- 피지컬 AI에 돈이 몰릴수록 특정 기업만 따라가는 방식보다 시장이 어떤 레이어로 구성되는지 이해하는 능력이 중요해진다.
- 챗GPT가 등장했을 때 상장 여부만 본 사람과 밑단의 프레임워크·구조를 공부한 사람이 갈렸듯이, 피지컬 AI도 표면의 로봇보다 기반 구조를 봐야 한다.
- 전력, 클라우드, 칩, 센서, 플랫폼, 로보틱스, 응용 레이어가 이어지며, 어느 한 지점이 바뀌어도 계속 수혜를 받는 영역이 생길 수 있다.
- 밸류체인을 이해하면 뉴스의 의미가 달라지고, 단순 화제성보다 어느 레이어에서 돈이 벌리는지 판단할 수 있다.
6. 스킬드 AI 사례는 하드웨어 기업이 범용 두뇌를 찾는 흐름을 보여준다 [09:38]
- 스킬드 AI는 피지컬 AI 레이어 중 AI 플랫폼 기반에 가까운 회사로, 여러 로봇에 적용될 수 있는 범용 두뇌를 만들려는 방향에 있다.
- 구광모 회장이 4월 2일 실리콘밸리를 방문해 만난 회사라는 사례는 하드웨어 강점을 가진 기업이 로봇의 두뇌 역할을 외부에서 찾는 흐름으로 해석된다.
- 하드웨어를 잘 만드는 기업도 뇌 역할을 직접 만들기 어렵다면, 삼성과 구글의 협업처럼 플랫폼·AI 두뇌 기업과 협력할 가능성이 커진다.
- 지금은 챗GPT 초기처럼 구조, 아키텍처, 기술 흐름을 분석해 어떤 레이어의 기업이 잘될지 가려야 하는 시점이다.
7. 피지컬 AI에서는 구글과 범용 두뇌 스타트업이 유력한 축으로 거론된다 [10:45]
- 구글은 여전히 피지컬 AI와 인공지능 흐름에서 강한 후보로 평가되며, 보유한 AI 역량과 플랫폼 기반이 로봇 시장에서도 중요하게 작용할 수 있다.
- 스킬드 AI 같은 범용 두뇌 스타트업은 로봇 하드웨어 위에 올라갈 지능을 담당할 수 있어, 단순 부품 기업과 다른 가치 평가를 받을 수 있다.
- 중국 기업들이 하드웨어와 부품 영역에서 빠르게 치고 올라오는 상황에서는 두뇌, 플랫폼, 고부가 소프트웨어 레이어의 희소성이 더 커질 수 있다.
- 피지컬 AI 투자에서는 로봇 완성품보다 어느 기업이 지능, 제어, 플랫폼의 핵심 위치를 차지하는지가 더 중요한 판단 기준이 된다.
8. 휴머노이드 부품 가치는 인간형 완성도보다 실제 작업 요구에 따라 갈린다 [11:20]
- 액추에이터와 손가락 기술은 휴머노이드의 중요한 부품 영역이지만, 모든 현장에 완벽한 인간형 손이 필요한 것은 아니다.
- 완벽한 사람 형태의 휴머노이드가 필요한 곳과 특정 작업만 수행하면 되는 곳이 나뉘며, 산업 현장에서는 기능 최적화가 인간형 모방보다 중요할 수 있다.
- 보스턴다이내믹스 로봇 손가락이 다섯 개가 아니라 네 개였던 사례는 공장 작업에서 인간 손과 동일한 구조가 반드시 필요하지 않다는 점을 보여준다.
- 실제 사용처가 요구하는 조작 능력에 따라 액추에이터, 손가락 수, 로봇 팔 설계의 가치가 달라지고, 부품 기업의 수혜 범위도 달라질 수 있다.
9. 산업별 로봇 손 구조와 비용 효율 [12:00]
- 공장용 로봇은 처음부터 작업 효율과 가격을 기준으로 설계되며, 사람 손처럼 다섯 손가락을 갖추는 것보다 필요한 물체를 안정적으로 집는 구조가 더 중요하다.
- 세 손가락 구조는 집기 성능이 부족했고, 네 손가락 구조는 공장 작업에서 굳이 더 복잡한 손 형태가 필요 없다는 판단으로 이어진다.
- 의료 영역처럼 섬세한 조작이 필요한 분야에서는 손 자체의 정밀도와 힘 조절이 중요해지며, 같은 로봇 손이라도 산업별 요구 조건이 크게 달라진다.
- 비용 판단의 핵심은 인간 인건비 대비 대체 효율이며, 디테일한 부품·제어 기술에는 아직 일정 수준의 기술적 해자가 남아 있다.
- 싱가포르 쪽 일부 회사들은 손가락 기능에 집중해 종이접기 같은 정밀 작업을 시도했고, 특정 기능층마다 경쟁력 있는 기업이 나올 가능성이 있다.
- 당장 투자 관점에서는 휴머노이드 본체보다 손, 팔, 이동체, 관측 장비처럼 세분화된 피지컬 AI 영역이 더 빠르게 기회를 만들 수 있다.
- 피지컬 AI는 이동 기반, 관측 기반, 조작 기반, 운용·제어 기반처럼 여러 갈래로 나뉘며, 휴머노이드는 그중 하나의 최종 결합 형태에 가깝다.
10. 관측 기반 피지컬 AI의 조기 상용화 가능성 [13:30]
- 이동 기반 피지컬 AI에는 자율주행차와 자율 로봇이 포함되며, 관측 기반 피지컬 AI에는 드론·구조·모니터링 로봇이 포함된다.
- 관측 로봇은 통신이 끊겨도 스스로 추론하며 움직이는 수준으로 발전하고 있고, 송유관처럼 복잡하거나 사람이 들어가기 어려운 공간에서 활용 가치가 커진다.
- 조작 기반 피지컬 AI는 로봇 팔이나 공장 운용, 스마트빌딩 제어와 연결되며, 사람의 직접 제어 없이도 AI와 결합해 더 강력한 자동화가 가능해진다.
- 휴머노이드가 본격화되기 전에도 이동·관측·조작·운용 기술이 단계적으로 시장을 열고, 이후 여러 선행 기술이 합쳐지며 휴머노이드로 이어질 가능성이 있다.
11. 추론형 로봇과 관제·경비 활용 사례 [14:47]
- 구글의 실험 사례에서는 태극기, 바나나 같은 사물과 음악 맥락을 연결해 K팝에 맞는 대상을 고르는 식의 시각·언어·상황 추론이 나타난다.
- 로봇이 단순히 움직이는 장비를 넘어 보고 판단하는 능력을 갖추면, 야간 순찰과 이상 징후 확인 같은 경비 업무 일부를 대체할 가능성이 커진다.
- CES에서 본 후지 사례는 자체 로봇을 만들지 않고 유니트리 로봇과 드론형 장비를 가져와 관제 시스템을 구성하는 방식에 가깝다.
- 로봇은 평소 웰커밍 역할을 하다가 필터링을 통해 의심 상황을 감지하는 구조로 확장될 수 있으며, 하드웨어 제조보다 관제·운용 소프트웨어가 별도 시장을 만들 수 있다.
12. 휴머노이드는 하드웨어보다 디바이스·서비스 분화가 핵심이다 [16:01]
- 사람의 행동을 대신하거나 보조하는 형태의 디바이스가 등장하면서, 휴머노이드는 단일 제품이 아니라 다양한 서비스 조합으로 갈라질 가능성이 크다.
- PC가 시간이 지나며 누구나 조립 가능한 범용 제품이 된 것처럼, 휴머노이드 하드웨어도 장기적으로 제조 진입장벽이 낮아질 수 있다.
- 하드웨어 자체보다 어떤 소프트웨어를 갈아 끼우고 어떤 서비스 모델을 붙이느냐가 시장의 핵심 경쟁력이 될 수 있다.
- 애플은 경쟁자들이 먼저 실험하고 승자가 보일 때 진입하는 전략을 취하는 듯하며, 이 방식이 효율적인지 방심인지 판단이 갈린다.
- 테슬라와 구글 등은 먼저 대규모 자원을 투입하며 시장 선점을 노리는 쪽에 가깝고, 초기 시장에서는 1등이 대부분을 가져갈 가능성도 배제하기 어렵다.
- 같은 현상을 두고도 애플은 기다리는 전략을 선택하고, 다른 기업들은 공격적으로 뛰어드는 전략을 선택한다는 점에서 시장 해석이 다르다.
13. 애플은 생성형 AI에서 자체 전략의 한계를 겪었다 [17:51]
- 구글의 선제 전략이 더 유리할 수 있다는 판단은 애플이 생성형 AI 영역에서 이미 한 차례 어려움을 겪었다는 해석과 연결된다.
- 애플은 자체 LLM을 시도했지만 기대만큼 작동하지 않았고, 구글 모델을 임시로 쓰더라도 한 번 탑재된 모델을 나중에 바꾸기는 쉽지 않다.
- 프라이버시 정책 때문에 LLM 앞뒤에 보완 구조를 붙이는 방식이 필요했지만, 그 구조가 원활히 작동하지 않은 부분이 있었던 것으로 추정된다.
- 애플은 AI 모델 자체에서 밀려도 압도적인 디바이스 권한을 갖고 있어, 애플 기기와 구글 AI가 함께 이익을 얻는 구도가 생길 수 있다.
14. 초기 AI 시장은 관심도보다 돈의 흐름과 사업 논리가 중요하다 [18:51]
- 그록처럼 특정 AI 서비스가 갑자기 주목받았다가 뉴스에서 덜 보이는 사례는 초기 시장의 변동성이 크다는 점을 보여준다.
- 뉴스 노출이 줄었다고 사업 자체가 끝난 것은 아니며, 아직 시장 초창기라 어떤 서비스와 기업이 최종적으로 살아남을지 단정하기 어렵다.
- 각 기업은 돈이 되는 영역, 자기 비즈니스 모델과 맞는 영역, 대규모 지출을 정당화할 수 있는 영역에 집중하고 있다.
- 명확한 비즈니스 모델, 캐시카우, 투자 근거 없이 돈을 계속 쓰는 기업은 점점 더 위험해지는 시장 환경에 놓인다.
15. AI로 전문직 실무가 평준화되는 상황 [20:02]
- AI 확산 이후 일부 전문직 영역에서는 신입 채용이 줄어들고, 로펌에서도 기존 주니어 업무의 필요성이 약해지는 흐름이 나타난다.
- 법률 서비스의 기술적 업무는 AI가 처리하면서 실력 차이가 비슷해지고, 단순한 법률 지식이나 문서 작업만으로는 차별화가 어려워진다.
- 변호사 업계에서는 관록 있는 변호사보다도 전관 출신이나 특정 기관 경험자의 대체 불가능성이 더 크게 부각된다.
- 세무·국세청 출신 변호사처럼 특정 기관 경험과 네트워크를 가진 사람은 AI로 쉽게 대체되기 어렵다.
- 법률 서비스가 AI로 모두 같아질 것이라는 생각은 단순화된 판단이며, 실제 분쟁에는 상대방과의 관계, 조직 간 경쟁, 사람 간 접촉이 함께 작동한다.
- 대형 로펌끼리 맞붙는 상황에서도 AI가 밤샘 문서 작업을 대신하면, 승부는 절약된 시간을 사람 관계와 전략적 접촉에 어떻게 쓰는지로 옮겨간다.
16. AI가 만든 효율은 사람의 비효율적 관계 활동으로 이동한다 [21:05]
- AI가 실무 시간을 줄이면 변호사와 관계자들은 남는 시간에 더 많은 사람을 만나고, 관계를 넓히며, 영향력을 확보하는 활동에 집중하게 된다.
- 판사나 관련 인물과의 친분, 만남, 비공식적 네트워크 같은 요소가 기술적 실무보다 더 중요한 변수로 떠오를 수 있다.
- “AI가 만들어 준 시간의 효율을 비효율의 낭만에 써야 한다”는 표현은, 자동화 이후에도 사람의 시간과 관계 활동이 경쟁력의 핵심으로 남는다는 의미다.
- 단순한 정보 전달만으로는 가치가 충분하지 않고, 사람들은 관계·경험·신뢰가 결합된 활동에서 여전히 차별성을 찾는다.
- 골프, 술자리, 사우나 같은 오프라인 접촉은 로비만의 문제가 아니라, AI 시대에 더 깊이 고민해야 할 인간적 관계 형성의 사례로 다뤄진다.
- AI가 전문 업무를 자동화할수록 사람에게 남는 일은 줄어드는 것이 아니라, 더 복잡한 관계 관리와 판단의 영역으로 이동한다.
🧾 결론
- 로봇 껍데기에 속지 마세요, 돈 여기로 몰립니다 (서울시립대학교 김덕진 겸임교수) (2부)를 중심으로, 화이트보드에 적힌 할 일을 눈으로 읽고 순서대로 수행하는 수준까지 피지컬 AI가 발전하고 있으며, 로봇의 지능은 단순 이동보다 인를 핵심 판단 포인트로 압축 정리한다.
- 보스턴 다이나믹스와 구글 딥마인드의 협력은 로봇에 더 높은 수준의 지능을 넣는 방향으로 이어졌고, 최근 스팟에 판단 기능이 결합된 산출물이 나왔다
- AI가 전문 업무를 자동화할수록 사람에게 남는 일은 줄어드는 것이 아니라, 더 복잡한 관계 관리와 판단의 영역으로 이동한다
📈 투자·시사 포인트
- 중요한 변화는 새 로봇 구매가 아니라 이미 공장에서 돌아다니던 스팟에 업데이트를 적용해 성능이 좋아지는 구조다
- 반복 운영과 예외 대응이 많은 조직일수록 자동화 ROI를 비교적 빠르게 확인할 가능성이 있다.
- 공통 워크스페이스, 메모리 구조, API 연동 기반에 대한 투자 필요성이 커질 수 있다.
⚠️ 불확실하거나 확인이 필요한 부분
- 일부 자막 표현은 자동 추출 특성상 고유명사나 제품명이 부정확할 수 있어 원문 확인이 필요하다.
- 영상 속 수치와 자동화 범위는 발표자 설명 기반이므로 외부 검증 자료와는 구분해서 봐야 한다.
✅ 액션 아이템
- 현재 조직의 반복 운영 업무를 목록화하고 자동화 우선순위를 정리한다.
- 메모리·규칙·툴 사용 문서를 한곳에서 관리할지 역할별로 분리할지 기준을 정한다.
- 민감 데이터와 일반 업무를 같은 에이전트에 둘지 권한을 분리할지 검토한다.
❓ 열린 질문
- 이 구조를 다른 조직에 옮길 때 가장 먼저 막히는 데이터/API 병목은 무엇인가?
- 단일 에이전트와 멀티 에이전트 운영은 어떤 업무 조건에서 각각 더 유리한가?