Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#agent-failure-modes
Tag2건Article 2

#agent-failure-modes

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#ibm-research공동문서 2 · 연관도 82%#agent-benchmarking공동문서 1 · 연관도 71%#api-chaining공동문서 1 · 연관도 71%#benchmark-deep-dive공동문서 1 · 연관도 71%#benchmark-diagnosis공동문서 1 · 연관도 71%#execution-trace-evaluation공동문서 1 · 연관도 71%#failure-vector-diagnosis공동문서 1 · 연관도 71%#gemini-3-flash공동문서 1 · 연관도 71%#itbench공동문서 1 · 연관도 71%#multi-source-reasoning공동문서 1 · 연관도 71%
IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST
Article2026년 4월 21일

IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST

IBM Research와 UC Berkeley는 ITBench 실행 추적에 MAST 실패 분류법을 적용해 엔터프라이즈 IT 자동화 에이전트가 단순히 실패했는지가 아니라 어디서, 왜, 어떤 방식으로 무너지는지를 진단했다.

huggingface.co
#itbench#ibm-research#uc-berkeley#gemini-3-flash
Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents
Article2026년 3월 31일

Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents

VAKRA는 기업형 환경에서 에이전트가 API, 문서, 대화 맥락, 정책 제약을 넘나들며 다단계 추론과 도구 사용을 실제 실행 궤적으로 수행할 수 있는지 평가하는 실행 중심 벤치마크다.

huggingface.co
#vakra#hugging-face#ibm-research#rest-bird