ai-agent-safety 태그 문서 3개 | 우성짱의 문서

우성짱의 문서

Tag3건YouTube 1Article 2

#ai-agent-safety

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#agent-threat-amplification공동문서 1 · 연관도 58%#agent-trust-design공동문서 1 · 연관도 58%#anthropic-context-engineering공동문서 1 · 연관도 58%#cooperative-ai-foundation공동문서 1 · 연관도 58%#ecosystem-safety-standards공동문서 1 · 연관도 58%#framework-deep-dive공동문서 1 · 연관도 58%#human-role-elevation공동문서 1 · 연관도 58%#independent-safety-research공동문서 1 · 연관도 58%#multi-agent-risk공동문서 1 · 연관도 58%#openai-agent-team공동문서 1 · 연관도 58%

Google DeepMind is worried about what happens when millions of agents start to interact

Article2026년 6월 13일

Google DeepMind is worried about what happens when millions of agents start to interact

구글 딥마인드는 수많은 AI 에이전트가 온라인에서 서로 지시하고 협력할 때 생길 새로운 안전 위험을 연구하기 위해 외부 연구 생태계 조성에 나섰다.

MIT Technology Review

#google-deepmind #rohin-shah #schmidt-sciences #cooperative-ai-foundation

Trustworthy agents in practice

Article2026년 6월 4일

Trustworthy agents in practice

AI 에이전트는 챗봇을 넘어 도구 사용과 반복적 의사결정으로 실제 업무를 수행하지만, 그 유용성만큼 인간 통제, 목표 정렬, 프롬프트 인젝션 방어, 투명성·프라이버시를 함께 설계해야 한다.

#anthropic #claude-code #claude-cowork #claude-desktop

프롬프트 엔지니어링은 끝났습니다: 이제 ''''하네스''''의 시대입니다

YouTube2026년 4월 1일

프롬프트 엔지니어링은 끝났습니다: 이제 ''''하네스''''의 시대입니다

AI 에이전트가 실수했을 때 프롬프트를 고칠 게 아니라, 그 실수가 구조적으로 불가능해지도록 시스템을 고치는 것 —하네스 엔지니어링이 바로 그것이다.

실밸개발자

#ai-agent-safety #software-engineering #llm-ops #human-role-elevation