Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#ai-agent-evaluation
Tag2건Article 2

#ai-agent-evaluation

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#agent-evalkit공동문서 1 · 연관도 71%#aws-technical-blog공동문서 1 · 연관도 71%#code-level-remediation공동문서 1 · 연관도 71%#crete공동문서 1 · 연관도 71%#eval-driven-improvement공동문서 1 · 연관도 71%#expert-correction-data공동문서 1 · 연관도 71%#faithfulness-over-fluency공동문서 1 · 연관도 71%#llm-as-judge공동문서 1 · 연관도 71%#open-source-toolkit공동문서 1 · 연관도 71%#product-engineering-note공동문서 1 · 연관도 71%
Building self-improving tax agents with Codex
Article2026년 6월 13일

Building self-improving tax agents with Codex

OpenAI와 Thrive Holdings는 Crete 회계사들의 실제 세무 업무, 전문가 피드백, 프로덕션 추적 데이터, 맞춤 평가를 결합해 시간이 갈수록 정확도가 개선되는 Codex 기반 Tax AI를 구축했다.

OpenAI
#codex#crete#openai#thrive-holdings
Evaluate AI agents systematically with Agent-EvalKit
Article2026년 6월 11일

Evaluate AI agents systematically with Agent-EvalKit

Agent EvalKit은 최종 응답만 보는 평가의 한계를 넘어, AI 에이전트의 도구 호출·중간 상태·근거 충실성까지 추적해 코드 수준 개선으로 연결하는 오픈소스 평가 도구입니다.

Amazon Web Services
#agent-evalkit#amazon-bedrock#amazon-web-services#strands-agents-sdk