Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#execution-trace-evaluation
Tag1건Article 1

#execution-trace-evaluation

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#agent-benchmarking공동문서 1 · 연관도 100%#api-chaining공동문서 1 · 연관도 100%#benchmark-deep-dive공동문서 1 · 연관도 100%#multi-source-reasoning공동문서 1 · 연관도 100%#rest-bird공동문서 1 · 연관도 100%#technical-blog-summary공동문서 1 · 연관도 100%#tool-use-evaluation공동문서 1 · 연관도 100%#vakra공동문서 1 · 연관도 100%#agent-failure-modes공동문서 1 · 연관도 71%#ibm-research공동문서 1 · 연관도 58%
Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents
Article2026년 3월 31일

Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents

VAKRA는 기업형 환경에서 에이전트가 API, 문서, 대화 맥락, 정책 제약을 넘나들며 다단계 추론과 도구 사용을 실제 실행 궤적으로 수행할 수 있는지 평가하는 실행 중심 벤치마크다.

huggingface.co
#vakra#hugging-face#ibm-research#rest-bird