Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#open-llm-leaderboard
Tag1건Article 1

#open-llm-leaderboard

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#arabic-language-models공동문서 1 · 연관도 100%#aragen공동문서 1 · 연관도 100%#benchmark-design공동문서 1 · 연관도 100%#blind-testset-rotation공동문서 1 · 연관도 100%#chatbot-arena공동문서 1 · 연관도 100%#fact-utility-evaluation공동문서 1 · 연관도 100%#generative-benchmarking공동문서 1 · 연관도 100%#human-verified-benchmark공동문서 1 · 연관도 100%#leaderboard-methodology공동문서 1 · 연관도 100%#zeroing-rule공동문서 1 · 연관도 100%
Rethinking LLM Evaluation with 3C3H: AraGen Benchmark and Leaderboard
Article2024년 12월 4일

Rethinking LLM Evaluation with 3C3H: AraGen Benchmark and Leaderboard

AraGen은 아랍어 LLM을 대상으로 사실성·사용성을 함께 평가하기 위해 3C3H 척도, 동적 블라인드 평가 주기, 인간 검증 데이터셋을 결합한 생성형 벤치마크와 리더보드다.

huggingface.co
#llm#aragen#chatbot-arena#hugging-face