ArticleNick Lichtenberg·2026년 5월 13일·0

Lloyd Blankfein just put his finger on why even Goldman Sachs is wary of AI agents

Quick Summary

로이드 블랭크페인은 AI 에이전트의 핵심 위험이 ‘인간보다 똑똑해지는 것’이 아니라, 대규모 금융기관이 그 판단이 맞는지 충분히 검증하기 어렵다는 데 있다고 지적했다.

Lloyd Blankfein just put his finger on why even Goldman Sachs is wary of AI agents 관련 대표 이미지

🖼️ 인포그래픽

Lloyd Blankfein just put his finger on why even Goldman Sachs is wary of AI agents 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

Lloyd Blankfein just put his finger on why even Goldman Sachs is wary of AI agents 내용을 설명하는 본문 이미지

💡 한 줄 요약

로이드 블랭크페인은 AI 에이전트의 핵심 위험이 ‘인간보다 똑똑해지는 것’이 아니라, 대규모 금융기관이 그 판단이 맞는지 충분히 검증하기 어렵다는 데 있다고 지적했다.

📌 핵심 요약

  • 골드만삭스 전 CEO이자 선임회장인 로이드 블랭크페인은 AI에 대한 우려의 초점을 초지능이나 무기화가 아니라, 금융기관이 AI의 판단과 결과를 검증하기 어려운 구조적 문제에 맞췄다.
  • 그는 과거 거래 현장에서는 실수가 즉시 드러났지만, 지금은 소프트웨어가 보이지 않는 내부 과정으로 수만 건의 거래를 수행할 수 있어 오류가 훨씬 빠르고 크게 확산될 수 있다고 설명했다.
  • 기사에서는 2010년 플래시 크래시와 2012년 나이트 캐피털 손실 사례를 들어, 기계 속도와 자동화가 금융시장에서 이미 대규모 손실을 일으킨 전례가 있음을 짚었다.
  • 여러 조사와 보고서는 금융권이 이미 AI와 자율 에이전트를 빠르게 도입하고 있지만, 회계 정확성, 설명 가능성, 사용 현황 파악, 감사 가능성, 거버넌스 측면에서는 신뢰와 통제가 뒤처져 있음을 보여준다.
  • 골드만삭스와 주요 은행들은 AI 도구를 전사적으로 확산하고 있지만, 일정 기준 이상의 자율 실행에는 여전히 인간 승인선을 두고 있으며, 블랭크페인은 새 시스템을 충분히 병행 검증한 뒤 전환해야 한다는 기존 금융권의 신중한 방식을 강조했다.

🧩 주요 포인트

  1. 골드만삭스 전 CEO이자 선임회장인 로이드 블랭크페인은 AI에 대한 우려의 초점을 초지능이나 무기화가 아니라, 금융기관이 AI의 판단과 결과를 검증하기 어려운 구조적 문제에 맞췄다.
  2. 그는 과거 거래 현장에서는 실수가 즉시 드러났지만, 지금은 소프트웨어가 보이지 않는 내부 과정으로 수만 건의 거래를 수행할 수 있어 오류가 훨씬 빠르고 크게 확산될 수 있다고 설명했다.
  3. 기사에서는 2010년 플래시 크래시와 2012년 나이트 캐피털 손실 사례를 들어, 기계 속도와 자동화가 금융시장에서 이미 대규모 손실을 일으킨 전례가 있음을 짚었다.
  4. 여러 조사와 보고서는 금융권이 이미 AI와 자율 에이전트를 빠르게 도입하고 있지만, 회계 정확성, 설명 가능성, 사용 현황 파악, 감사 가능성, 거버넌스 측면에서는 신뢰와 통제가 뒤처져 있음을 보여준다.
  5. 골드만삭스와 주요 은행들은 AI 도구를 전사적으로 확산하고 있지만, 일정 기준 이상의 자율 실행에는 여전히 인간 승인선을 두고 있으며, 블랭크페인은 새 시스템을 충분히 병행 검증한 뒤 전환해야 한다는 기존 금융권의 신중한 방식을 강조했다.

🧠 상세 정리

1. 블랭크페인이 짚은 AI 위험의 본질

기사는 로이드 블랭크페인이 AI를 우려하는 이유를 초지능이나 자율무기 같은 극단적 시나리오가 아니라, 훨씬 현실적인 검증 문제로 설명한다. 그는 골드만삭스에서 수십 년간 위험을 관리하며 1987년 증시 붕괴, 닷컴 버블 붕괴, 2008년 금융위기, 금융위기 이후 규제 재편을 지켜본 인물로 소개된다. 그런 그가 AI에 대해 주목한 지점은 ‘AI가 인간보다 똑똑해져 인간을 지배한다’는 공포가 아니라, 기관이 AI의 결과가 맞는지 확인할 능력을 충분히 갖추지 못했다는 점이다. 특히 큰 금융기관에서는 작은 숫자 오류도 치명적일 수 있기 때문에, 검증 불가능성은 단순한 기술적 불편이 아니라 운영 리스크의 핵심으로 제시된다.

2. 보이지 않는 내부 과정과 대규모 실행의 위험

블랭크페인은 기술이 뒤에서 빠르게 작동하지만, 사용자는 그 판단 과정 전체를 가까이 들여다보기 어렵다고 말했다. 과거 거래 현장에서는 누군가 실수를 하면 주변 사람들이 즉각 알아차렸고, 아주 작은 실수에도 거래실 분위기가 조용해질 만큼 오류가 노출되는 구조가 있었다. 그러나 이제는 소프트웨어 하나가 수만 건의 거래를 실행할 수 있으며, 그 과정이 인간의 실시간 감시 범위를 벗어날 수 있다. 기사가 강조하는 위험은 AI가 독립적 의지를 갖는다는 점이 아니라, 인간이 개입하기 전에 잘못된 판단이 대량 실행될 수 있다는 점이다. 이는 금융권이 AI를 폭넓게 쓰면서도 핵심 권한을 완전히 넘기지 못하는 이유로 연결된다.

3. 속도와 레버리지가 결합될 때 생기는 금융 리스크

기사의 첫 번째 큰 논점은 금융산업에서 속도가 곧 레버리지로 작동한다는 점이다. 빠른 거래는 올바른 판단일 때 수익을 확대하지만, 잘못된 거래일 때는 손실도 같은 속도로 확대한다. 사람이 개입하기 전에 수천 개 포지션에 걸쳐 잘못된 거래가 실행되면, 오류는 단일 실수에 머물지 않고 시스템적 손실로 번질 수 있다. 블랭크페인이 말한 ‘70,000건의 거래’ 문제는 이런 맥락에서 이해된다. AI 에이전트가 더 자율적이고 더 빠르게 여러 결정을 연결할수록, 통제되지 않은 속도는 효율성의 원천인 동시에 금융기관이 가장 두려워해야 할 위험 증폭 장치가 된다.

4. 과거 자동화 사고가 보여준 전조

기사는 이 위험이 단순한 가정이 아니라고 설명하며 두 가지 과거 사례를 든다. 2010년 플래시 크래시는 알고리즘 거래가 몇 분 만에 시장가치 약 1조 달러를 일시적으로 증발시킨 사건으로 제시된다. 2012년 나이트 캐피털 사태에서는 소프트웨어 결함으로 회사가 45분 만에 4억4천만 달러를 잃었고, 사실상 회사가 무너지는 결과로 이어졌다. 이 두 사건은 현재 세대의 AI 에이전트보다 10년 이상 앞선 일이지만, 자동화와 기계 속도가 금융시장에서 어떤 파급을 낳을 수 있는지 이미 보여준 사례다. 기사는 최신 AI 에이전트가 당시 시스템보다 더 빠르고 자율적이며, 중간 인간 확인 없이 결정을 연쇄할 수 있다는 점에서 위험이 더 복잡해졌다고 본다.

5. 자율 에이전트가 만드는 새로운 연쇄 실패 가능성

기사에 따르면 2026년 3월 딜로이트가 MIT AI Risk Database를 분석한 결과, 은행 분야에서만 자율적 또는 에이전트형 행동에서 발생할 수 있는 위험이 350개 이상 식별됐다. 이 중 상당수는 기존 프레임워크로 충분히 다뤄지지 않는 것으로 설명된다. 예를 들어 하나의 환각 출력이 연결된 시스템 전반으로 확산될 수 있고, 결제 라우팅 에이전트가 사람이 알아차리기 전에 자금을 잘못 배분할 수 있으며, 재귀적 에이전트 루프가 클라우드 비용을 여섯 자릿수까지 끌어올릴 수도 있다. 미국은행가협회가 2025년 12월 ‘737 맥스 순간’을 경고했다는 대목도 같은 문제의식이다. 자동화에 대한 과신이 공적 신뢰와 규제 책임을 앞질러 충돌할 수 있다는 경고다.

6. 조사 수치가 드러낸 낮은 신뢰와 높은 사용률

기사의 다음 흐름은 블랭크페인의 직감이 여러 데이터와 맞물린다는 점을 보여준다. 2026년 1월 Wakefield Research 조사에서는 CFO 중 AI가 독자적으로 정확한 회계 데이터를 제공한다고 완전히 신뢰하는 비율이 14%에 그쳤다. 그러나 같은 기업들 대부분은 이미 AI 도구를 사용하고 있었다. 응답자의 97%는 정확성을 위해 인간 감독이 여전히 중요하다고 답했고, 다수는 이미 환각 또는 부정확한 AI 출력 사례를 겪었다. 이 수치는 금융기관이 AI를 거부하고 있는 것이 아니라, 사용은 빠르게 늘리면서도 결과를 완전히 신뢰하지는 못하는 이중적 상황을 보여준다. 즉 도입 속도와 신뢰 수준 사이의 간극이 기사 전체의 핵심 긴장으로 제시된다.

7. 설명 가능성, 감사 가능성, 감독 데이터의 부족

CFA Institute의 2025년 설명 가능한 AI 관련 보고서는 AI 기반 시스템이 데이터 출처와 의사결정 로직의 제한된 투명성 때문에 감독상 어려움을 만든다고 지적한 것으로 소개된다. 별도의 2026년 1월 LinkedIn 분석도 감독기관이 AI가 어디서 어떻게 사용되는지에 대한 일관되고 세밀한 데이터를 갖고 있지 않다고 평가했다. 또한 기존 모델 리스크 관리 체계는 전통적 검증, 모니터링, 감사 가능성 측면에서 도전을 받고 있다고 설명된다. 이는 블랭크페인이 말한 ‘맞는지 테스트할 수 있는 능력’의 부족을 제도와 운영 차원으로 확장한 논점이다. AI 에이전트의 문제는 단순히 성능이 부족하다는 것이 아니라, 누가 어떤 판단을 어떤 근거로 했는지 추적하고 책임지는 구조가 충분히 마련되지 않았다는 데 있다.

8. 도입은 빠르지만 거버넌스는 뒤처진 금융권

기사에서는 금융권의 AI 도입 속도가 이미 매우 빠르다고 설명한다. 2026년 1분기 기준 선도 핀테크 기업의 92%가 최소 하나의 자율 에이전트를 핵심 프로덕션에 통합한 것으로 제시된다. 같은 시기 100만 달러를 넘는 거래에는 인간 인증을 요구하는 ‘가드레일 프로토콜’ 표준화가 서둘러 진행됐다는 내용도 나온다. 2025년 MIT Technology Review Insights 조사에서는 에이전트형 AI를 이미 사용하는 기업의 은행 임원 70%가 거버넌스 체계가 배포 속도보다 훨씬 뒤처져 있다고 답했다. 이는 업계가 AI 활용의 이점을 놓치지 않으려 하면서도, 통제 장치가 충분히 성숙하기 전에 핵심 업무에 기술이 들어가고 있는 현실을 보여준다.

9. 골드만삭스식 신중함과 인간 승인선

블랭크페인은 골드만삭스가 과거 시스템 전환을 할 때 기존 시스템과 새 시스템을 수년간 병행 운영한 뒤 완전히 전환했다고 말했다. 그는 새 방식으로 가기 전에 같은 일을 여러 번 반복하고, 마지막 수십 번을 완벽히 수행해야 했다고 설명했다. 기사는 이런 태도가 AI 배포 물결을 이끄는 ‘빠르게 움직이는’ 문화와 충돌한다고 본다. 실제로 골드만삭스는 4만6천 명이 넘는 직원에게 AI 어시스턴트를 배포했고, JPMorgan과 Citi도 대규모 AI 활용 사례와 직원 사용을 확대하고 있다. 하지만 주요 은행들은 일정 기준을 넘는 자율 실행에는 여전히 인간 승인을 요구한다. 결국 업계는 AI를 거의 모든 곳에 확산하고 있지만, 블랭크페인이 우려한 대량 거래 오류가 실제로 발생할 수 있는 핵심 지점에서는 아직 최종 통제권을 넘기지 않고 있다.

🧾 핵심 주장 / 시사점

  • AI 에이전트의 금융 리스크는 ‘지능의 위협’보다 ‘검증과 책임의 부재’에 더 가깝다. 특히 대규모 기관에서는 결과가 맞는지 설명하고 재현하고 감사할 수 있어야 하므로, 성능 향상만으로는 신뢰 문제가 해결되지 않는다.
  • 금융권의 AI 도입은 이미 되돌리기 어려울 만큼 빠르게 진행되고 있지만, 핵심 실행 권한에는 인간 승인선이 남아 있다. 이는 업계가 AI의 생산성은 인정하면서도 자율 실행의 손실 증폭 가능성을 여전히 중대하게 보고 있음을 보여준다.
  • 블랭크페인의 병행 운영 철학은 AI 에이전트 도입에도 중요한 기준이 된다. 새 시스템이 몇 번 잘 작동했다는 이유가 아니라, 반복적 검증과 실패 시나리오 점검을 통과한 뒤에야 중요한 권한을 맡길 수 있다는 메시지다.

✅ 액션 아이템

  • AI 판단·결과 검증의 병목을 숨은 내부 과정이 거래를 확대하는 경로와 연결해 대량 거래 전파 관점에서 점검한다.
  • 회계 정확성·설명 가능성·사용 현황 파악·감사 가능성·거버넌스 항목별로 정량 기준을 정해 인간 승인선과 병행 검증 조건을 분리한다.
  • 골드만삭스와 주요 은행의 방식처럼 일정 임계치 이상 자율 실행은 제한하고, 전환 순서를 사전에 정의한다.

❓ 열린 질문

  • 수만 건 거래를 동시 처리하는 소프트웨어에서 오류가 실질 손실로 전이되는 임계점은 어떻게 규정되는가?
  • 회계 정확성·설명 가능성·사용 현황 파악·감사 가능성 지표가 상충할 때 어떤 근거로 우선순위를 정할 것인가?
  • 블랭크페인이 강조한 병행 검증 후 전환이 실제 운영에서는 어느 단계에서 비용과 속도 부담을 키울 가능성이 큰가?

관련 문서

공통 태그와 주제 흐름을 기준으로 같이 보면 좋은 문서를 이어서 제안합니다.