[한글자막] AI가 AI를 만드는 재귀적 자기 개선이 가능할까요?
Quick Summary
AI가 AI를 만드는 재귀적 자기 개선은 이미 자동 연구 실험에서 일부 가능성이 보이지만, 곧바로 지능 폭발로 이어지는 마법이 아니라 비용·자원·평가·보안 문제가 얽힌 어려운 피드백 루프다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
AI가 AI를 만드는 재귀적 자기 개선은 이미 자동 연구 실험에서 일부 가능성이 보이지만, 곧바로 지능 폭발로 이어지는 마법이 아니라 비용·자원·평가·보안 문제가 얽힌 어려운 피드백 루프다.
📌 핵심 요점
- 재귀적 자기 개선(RSI)은 AI가 더 나은 AI를 만들고, 그 결과가 다시 다음 개선을 가속하는 루프를 뜻하지만, 영상은 이를 hype와 실제 기술 진전으로 나누어 봐야 한다고 설명한다.
- Karpathy의 Auto Research와 fractal search 실험은 LLM이 코드 작성, 훈련 실행, 결과 평가, 반복 개선을 수행하며 제한된 형태의 AI 연구 자동화에 접근할 수 있음을 보여준다.
- Mandelbrot 함수 근사 실험에서는 초기 신경망 접근보다 hash grid 기반 최적화가 더 좋은 결과를 냈고, 이는 AI 에이전트가 objective가 명확한 문제에서 반복 실험을 통해 성능을 끌어올릴 수 있음을 시사한다.
- 다만 현재 사례는 강한 RSI가 아니라 약한 RSI에 가깝다. 기반 언어모델 자체를 인간 도움 없이 직접 개선하는 완전 자동 루프는 아직 실현된 상태라기보다 향후 프런티어 AI 기업들이 시도할 수 있는 구조로 제시된다.
- RSI의 핵심 병목은 데이터, GPU, 에너지, 데이터센터, 비용, 평가 지표, local minimum, 벤치마크 포화, 보안 리스크이며, 특히 자기복제와 목표 조작 가능성은 강한 샌드박스와 인간 통제가 필요한 이유로 제시된다.
🧩 배경과 문제 정의
- 재귀적 자기 개선(RSI)은 AI가 더 나은 AI를 만들고, 그 결과가 다시 개선 능력을 강화하는 순환 가능성에서 출발한다.
- Anthropic과 OpenAI를 둘러싼 상장·신모델 hype 속에서 RSI가 실제 기술 진전인지, 과장된 서사인지 구분필요가 있다.
- Karpathy의 Auto Research와 자체 fractal search 실험은 현재 AI agent가 코드 실행, 결과 평가, 반복 개선을 통해 연구 자동화에 어느 정도 접근했는지를 보여주는 사례다.
- RSI는 마법적인 폭발이라기보다 비용·위험·한계가 따르는 피드백 루프이며, 가능성과 난이도, 보안 리스크를 함께 살펴봐야 한다.
🕒 시간순 섹션별 상세정리
1. RSI 개념과 hype를 분리해야 하는 출발점
- 재귀적 자기 개선은 AI가 더 똑똑한 AI를 만들고, 그 AI가 다시 더 나은 AI를 만드는 반복 루프로, 이론상 지능 폭발로 이어질 수 있다 [00:25]
- RSI는 오래된 컴퓨터·SF 개념이지만, 최근 Anthropic의 새 모델과 OpenAI·Anthropic 상장 기대 속에서 현실화된 기술처럼 다뤄지며 hype가 커지고 있다 [00:40]
2. Auto Research와 fractal search의 실험 목표
- Karpathy의 Auto Research는 LLM이 다른 LLM, 구체적으로는 NanoGPT를 반복적으로 프로그래밍·훈련·최적화하게 만드는 실험이다 [01:08]
- Auto Research는 밤새 실행되며 원래 알고리즘의 개선점을 찾아냈고, RSI를 축소한 장난감 버전의 proof of concept로 볼 수 있다 [01:36]
3. Mandelbrot 문제는 무한 복잡성을 가진 함수 근사 benchmark다
- fractal search는 RSI 자체가 아니라, 언어모델로 머신러닝 모델을 최적화하는 실험이며 오래된 neural Mandelbrot 문제를 대상으로 한다 [03:16]
- 신경망은 데이터셋을 바탕으로 목표 함수를 근사하는 수학적 함수이고, 함수 근사는 머신러닝·딥러닝·언어모델의 핵심 기반이다 [03:36]
4. agent loop는 실험 설계부터 평가까지 자동화하지만 신뢰성에 의존한다
- Claude Code로 만든 lightweight framework는 Python script와 prompt file을 이용해 AI agent를 끝없는 recursive research loop에 넣고, Karpathy의 Auto Research 구조를 거의 그대로 따른다 [05:30]
- agent는 Mandelbrot set을 맞추는 model과 training algorithm이 담긴 solution class를 작성하며, neural network가 아니더라도 성능이 좋으면 허용된다 [05:43]
5. 장시간 autonomous run은 hash grid 중심의 meta-optimization으로 계속된다
- Claude Code와 Codex의 goal 기능은 자연어 목표를 주면 달성했다고 판단할 때까지 계속 작업하는 방식이라, “stop” 전까지 반복 실행되는 실험에 적합하다 [07:47]
- Claude 4.8 Opus, GPT 5.5, Claude Fable은 총 약 10시간 동안 unsafe mode로 실행됐고, human approval 없이 자율적으로 실험을 이어갔다 [08:17]
6. RSI는 마법이 아니라 비용과 한계를 가진 bootstrapping이다
- RSI는 영구기관처럼 무언가를 무에서 만들어내는 듯 보이지만, 실제로는 역설이 아니라 피드백 루프와 bootstrapping의 문제다 [09:47]
- crane climbing은 더 높은 crane이나 helicopter 없이 자기 상단을 들어 올려 새 segment를 끼워 넣는 과정이며, 물리 법칙을 어기지 않는다 [10:11]
7. 약한 RSI와 강한 RSI의 기준
- Anthropic이 Claude Code로 Claude Code를 만들고, AI 알고리즘이 GPU 최적화에 쓰이는 사례는 있지만, 이는 인간 기여에 크게 의존하는 간접적 자기 개선이다 [12:01]
- 강한 RSI는 인간 도움 없이 AI가 더 똑똑한 자신을 직접 만드는 완전 자동 자기 개선이며, 현재는 과학소설에 가깝지만 여러 기업이 이 방향을 준비하고 있다 [12:35]
8. 강한 RSI 실험의 가상 구조
- Darwin Godel Machine은 에이전트가 자기 프롬프트와 스크립트 등 에이전트 프레임워크를 수정하지만, 기반 언어모델 자체는 건드리지 않는 얕은 재귀적 자기 개선이다 [13:23]
- 강한 RSI의 전체 버전은 기반 언어모델까지 포함한 모든 개선 요소를 통제해야 하며, 데이터센터의 모델과 여러 Claude Code 에이전트가 다음 세대 모델을 만드는 구조로 상상할 수 있다 [13:50]
9. 폭발적 개선을 막는 자원 병목
- RSI는 오후 한나절 만에 인간 전체보다 똑똑해지는 foom 시나리오보다 훨씬 어렵고, 병목·장애물·의존성 때문에 폭발적 가속이 쉽게 막힌다 [15:05]
- 인간은 데이터센터와 발전소를 짓고 인프라를 유지하며 고품질 인간 데이터를 공급한다; 특히 데이터는 알고리즘, 프롬프트, 에이전트 프레임워크보다 더 큰 제약으로 작동한다 [15:27]
10. 정체와 우회 경로가 공존하는 개선 지형
- 지능에도 자연스러운 수용 한계가 있을 수 있으며, 가용 자원을 소진하거나 개선 지점이 줄어들면 발전은 폭발이 아니라 점근선처럼 둔화된다 [17:01]
- Fractal Search 실험에서는 초기 몇 차례 큰 진전 뒤 수익 체감이 나타났고, Claude Opus는 약 7시간 뒤 더 할 일이 없다고 판단했지만 실제로는 추가 개선 여지가 남아 있었다 [17:13]
11. 개선 목표와 평가 지표의 한계
- 재귀적 자기 개선에는 무엇을 위해 개선할 것인지라는 철학적 문제가 따르며, 지능 전체를 포괄하는 단일 지표를 만들기는 어렵다 [19:43]
- 벤치마크, IQ 테스트, 수학 시험, 프로그래밍 과제는 현재 연구소들이 쓰는 출발점이 될 수 있지만, 지표 자체가 잘못된 행동을 유도할 위험도 있다 [19:59]
12. 장시간 에이전트와 후속 AI의 위험
- 장시간 개방형 작업에는 넓은 권한과 낮은 승인 장벽이 필요하며, 개인 장비에서 샌드박스 없이 실행할 경우 편의성 때문에 보안 기준이 느슨해질 위험이 커진다 [21:53]
- 에이전트가 관리자 권한 없이 안전 규칙을 따르더라도, 긴 세션에서는 프로젝트를 어지럽히거나 예상 밖의 변경을 남길 수 있으므로 샌드박스 격리가 필요하다 [22:19]
13. 자기보존보다 더 위험한 자기복제 목표
- AI 안전 논의에서 도구적 목표는 최종 목표를 달성하기 위해 생기는 하위 목표이며, 자기보존은 자신이 사라지면 목표 수행도 불가능하다는 점에서 위험한 도구적 목표가 된다 [24:05]
- 자기개선 AI는 더 나은 자기 복사본을 만들기 위해 자기복제를 수행해야 하며, 복제자가 등장하면 복제 자체를 위해 다른 가치를 희생하는 방향으로 최적화될 수 있다 [24:37]
14. 실험 결과와 해시 그리드 성능
- 실험에서 각 에이전트는 일부 개선점을 찾아냈고, 특히 Fable은 성능 정체 구간을 넘어서는 결과를 보였다 [26:05]
- 최종 최적화 해법은 해시 그리드였으며, 이는 AI가 처음부터 발명한 것이 아니라 인간이 작성한 논문에 기반한 방식이었다 [26:13]
15. 자동 최적화의 불투명성과 비용 한계
- 최종 코드는 효율을 위해 최적화되면서 사람이 읽고 이해하기 어려워졌고, 자동 최적화 결과물은 가독성보다 성능을 우선해 내부 작동이 불투명해진다 [28:01]
- 재귀적 자기 개선에서는 모델 자체뿐 아니라 모델을 실행하는 코드까지 인간이 이해하기 어려워질 수 있으며, 이는 별도의 안전 문제로 계속된다 [28:18]
16. AI 연구 적용 가능성과 남은 개선 여지
- 자동 연구는 AI 연구 자체에 직접 적용될 수 있고, RSI가 실제로 가능하며 폭발적일 수 있음을 보여주지만, 현재 단계에서 가장 먼저 드러나는 제약은 비용 폭증이다 [29:38]
- Anthropic은 토큰 판매와 기업 가치 상승이라는 이해관계를 갖고 있지만, 몇 년 전에는 없던 능력이 실제로 나타났고 그 능력의 최대 수혜자 역시 Anthropic이다 [29:51]
🧾 결론
- 영상의 결론은 RSI가 불가능한 공상도 아니고, 곧바로 인간을 초월하는 폭발적 사건도 아니라는 쪽에 가깝다. 이미 자동 연구와 모델 최적화 루프는 작동하지만, 그 성과는 제한된 문제와 명확한 평가 지표에 크게 의존한다.
- 강한 RSI의 기준은 AI가 인간 개입 없이 자기 자신 또는 다음 세대 AI를 직접 개선하는 것이다. 현재의 Auto Research나 fractal search는 그 방향을 보여주는 proof of concept이지만, 기반 모델 전체를 스스로 개선하는 단계에는 이르지 못한다.
- RSI가 진전되더라도 가장 먼저 드러나는 제약은 비용과 인프라다. 영상 속 실험에서도 몇 시간의 에이전트 실행에 상당한 토큰 비용이 들었고, 현실의 대규모 AI 개선은 데이터센터·전력·고품질 데이터 같은 물리적 자원에 묶인다.
- 안전 측면에서는 장시간 자율 에이전트, 평가 지표 조작, 프로젝트 환경 훼손, 자기보존·자기복제 목표의 강화가 주요 위험으로 제시된다. 따라서 대규모 RSI 실험은 인터넷과 분리된 강한 샌드박스, 감시, 인간의 최종 목표 통제가 필요하다.
- 검증이 필요한 내용으로는 Anthropic·OpenAI 상장 기대, 특정 모델 공개 버전의 능력 약화, 기업이 재귀적 우위를 독점하려 할 수 있다는 해석이 있다. 이는 영상 내 주장·추정으로 제시된 부분이므로 별도 확인 없이 사실로 단정하기 어렵다.
📈 투자·시사 포인트
- AI 연구 자동화는 단순 생산성 향상을 넘어 모델·훈련 코드·최적화 알고리즘 개선까지 확장될 수 있다. 장기적으로는 프런티어 AI 기업의 연구 속도와 비용 구조를 바꾸는 핵심 변수가 될 수 있다.
- 투자 관점에서 중요한 병목은 모델 성능 자체만이 아니라 데이터, GPU 활용 효율, 데이터센터 확장, 전력, 자동 평가 가능한 과제의 범위다. RSI가 실제 성과를 내려면 소프트웨어 개선과 물리 인프라 확장이 함께 필요하다.
- objective가 명확한 영역에서는 AI 에이전트의 반복 실험 능력이 강하게 작동할 수 있다. 반대로 평가 지표가 모호하거나 쉽게 게임될 수 있는 분야에서는 자동화 성과를 과대평가할 위험이 크다.
- 보안과 거버넌스는 비용이 아니라 핵심 경쟁 조건이 될 가능성이 있다. 장시간 자율 에이전트와 자기개선 루프를 운용하는 기업일수록 샌드박스, 권한 관리, 평가 지표 설계, 목표 통제 능력이 중요해진다.
- 영상 기준으로는 RSI 관련 hype를 그대로 투자 논리로 받아들이기보다, 실제 자동 연구 성과, 비용 대비 개선 폭, 인프라 병목, 안전 통제 수준을 함께 확인하는 접근이 필요하다.
⚠️ 불확실하거나 확인이 필요한 부분
- 영상에서 언급된 Anthropic·OpenAI의 상장 기대, 신모델 hype, 기업 전략에 관한 해석은 외부 보도와 공식 발표로 별도 확인이 필요하다.
- Claude 4.8 Opus, GPT 5.5, Claude Fable이라는 모델명·버전·실험 비용은 영상 내 설명 기준이므로, 실제 공개 모델명과 과금 기준이 일치하는지 검증해야 한다.
- Fable 공개 버전이 언어모델 개발 능력에서 약화됐고, 이것이 회사의 재귀적 우위 독점 전략일 수 있다는 주장은 추정에 가깝다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- RSI 논의를 “약한 RSI”와 “강한 RSI”로 분리해 평가한다. 인간이 설계·선택·배포에 개입하는 자동화와, AI가 모델 자체까지 완전 자율 개선하는 경우를 구분한다.
- 장시간 AI agent 실험을 할 때는 샌드박스, 권한 제한, 인터넷 접근 제한, 승인 단계, 로그 기록을 기본 조건으로 둔다.
- 자동 연구 실험에는 hidden validation set, 평가 함수 보호, benchmark 조작 방지 규칙, 결과 재현 절차를 포함한다.
- 비용 폭주를 막기 위해 토큰 예산, GPU 사용량, 최대 실행 시간, 중단 기준, 성능 개선 최소 임계값을 사전에 정한다.
❓ 열린 질문
- 강한 RSI가 성립하려면 AI가 어느 범위까지 통제해야 하는가? 프롬프트와 에이전트 코드만 바꾸는 수준으로 충분한가, 아니면 기반 모델·데이터·학습 인프라까지 포함해야 하는가?
- 자동 평가가 어려운 연구 문제에서도 Fractal Search와 같은 agent loop가 유의미한 성과를 낼 수 있을까?
- 재귀적 자기 개선의 병목은 알고리즘보다 데이터·compute·전력·물리적 인프라 쪽에서 더 먼저 나타날까?