Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#economic-task-evaluation
Tag1건Article 1

#economic-task-evaluation

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#ai-model-evaluation공동문서 1 · 연관도 100%#expert-assessed-benchmarking공동문서 1 · 연관도 100%#expert-blind-comparison공동문서 1 · 연관도 100%#gdpval공동문서 1 · 연관도 100%#real-world-benchmarks공동문서 1 · 연관도 100%#work-output-benchmark공동문서 1 · 연관도 100%#benchmark-introduction공동문서 1 · 연관도 71%#o4-mini공동문서 1 · 연관도 71%#research-announcement공동문서 1 · 연관도 41%#gpt-4o공동문서 1 · 연관도 33%
Measuring the performance of our models on real-world tasks
Article2025년 9월 25일

Measuring the performance of our models on real-world tasks

OpenAI는 실제 경제 활동에서 수행되는 지식노동 과제를 기준으로 AI 모델 성능을 측정하는 새 평가 체계 GDPval을 소개했다.

openai.com
#gdpval#openai#gpt-4o#o4-mini