Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#offline-online-alignment
Tag1건Article 1

#offline-online-alignment

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#a-b-test공동문서 1 · 연관도 100%#ab-testing공동문서 1 · 연관도 100%#eval-funnel공동문서 1 · 연관도 100%#evaluation-methodology공동문서 1 · 연관도 100%#experiment-guardrails공동문서 1 · 연관도 100%#judge-calibration공동문서 1 · 연관도 100%#llm-judge공동문서 1 · 연관도 100%#online-experimentation공동문서 1 · 연관도 100%#recommender-quality공동문서 1 · 연관도 100%#llm-evaluation공동문서 1 · 연관도 71%
Better Experiments with LLM Evals — A funnel, not a fork
Article2026년 6월 15일

Better Experiments with LLM Evals — A funnel, not a fork

Spotify Engineering은 LLM 평가를 A/B 테스트의 대체재가 아니라, 실험 전 후보를 걸러내고 실험 후 판단 기준을 보정하는 ‘평가 퍼널’로 사용해야 한다고 설명한다.

Matilda Ankargren (Senior Data Scientist) and Mårten Schultzberg (Senior Manager/Staff Data Scientist)
#llm#spotify#llm-judge#spotify-engineering