Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#d3code
Tag1건Article 1

#d3code

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#annotation-design공동문서 1 · 연관도 100%#benchmark-reproducibility공동문서 1 · 연관도 100%#dices공동문서 1 · 연관도 100%#human-disagreement공동문서 1 · 연관도 100%#human-evaluation공동문서 1 · 연관도 100%#ml-reproducibility공동문서 1 · 연관도 100%#rater-count-design공동문서 1 · 연관도 100%#toxicity-dataset공동문서 1 · 연관도 100%#width-depth-tradeoff공동문서 1 · 연관도 100%#ai-benchmarking공동문서 1 · 연관도 71%
Building better AI benchmarks: How many raters are enough?
Article2026년 3월 31일

Building better AI benchmarks: How many raters are enough?

Google Research는 인간 평가자 간 불일치를 무시하지 않는 재현성 높은 AI 벤치마크를 만들기 위해, 평가 항목 수와 항목당 평가자 수의 최적 균형을 찾는 프레임워크와 시뮬레이터를 제시했다.

research.google
#d3code#dices#google-research#toxicity-dataset