Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#inference-budget-matters
Tag1건YouTube 1

#inference-budget-matters

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#agentic-scaffolding공동문서 1 · 연관도 100%#ai-safety-evals공동문서 1 · 연관도 100%#budget-based-evals공동문서 1 · 연관도 100%#noam-brown공동문서 1 · 연관도 100%#researcher-interview공동문서 1 · 연관도 100%#gpt-3공동문서 1 · 연관도 71%#frontier-model-evaluation공동문서 1 · 연관도 58%#podcast-interview공동문서 1 · 연관도 58%#test-time-compute공동문서 1 · 연관도 58%#frontier-models공동문서 1 · 연관도 50%
Why Traditional Benchmarks Fail Modern AI Models with OpenAI Research Scientist Noam Brown
YouTube2026년 6월 26일

Why Traditional Benchmarks Fail Modern AI Models with OpenAI Research Scientist Noam Brown

Traditional Benchmarks는 Modern AI Models의 실제 능력을 충분히 설명하지 못하며, 이제 모델 평가는 단일 점수가 아니라 테스트 타임 컴퓨트, 비용, 시간, 스캐폴딩을 함께 보는 방식으로 바뀌어야 한다.

No Priors: AI, Machine Learning, Tech, & Startups
#frontier-model-evaluation#test-time-compute#ai-safety-evals#agentic-scaffolding