Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#browsecomp
Tag2건YouTube 1Article 1

#browsecomp

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#browsing-tool-insufficiency공동문서 1 · 연관도 71%#compression-fidelity-risk공동문서 1 · 연관도 71%#context-compression-reliability공동문서 1 · 연관도 71%#context-retrieval-quality공동문서 1 · 연관도 71%#information-retrieval공동문서 1 · 연관도 71%#llm-benchmark-interpretation공동문서 1 · 연관도 71%#long-context-reasoning공동문서 1 · 연관도 71%#mrcr-v2공동문서 1 · 연관도 71%#persistent-web-search공동문서 1 · 연관도 71%#verification-asymmetry공동문서 1 · 연관도 71%
BrowseComp: a benchmark for browsing agents
Article2025년 4월 10일

BrowseComp: a benchmark for browsing agents

OpenAI의 BrowseComp는 웹 탐색 에이전트가 찾기 어렵지만 검증 가능한 정보를 얼마나 끈기 있고 전략적으로 찾아내는지 평가하기 위한 1,266문항 규모의 고난도 벤치마크다.

openai.com
#browsecomp#openai#simpleqa#deep-research
생각이 깊어 실수하는 클로드, 시킬 것과 시키지 말 것 (강수진 박사)
YouTube2026년 3월 9일

생각이 깊어 실수하는 클로드, 시킬 것과 시키지 말 것 (강수진 박사)

최신 AI 모델의 승부는 컨텍스트 윈도우 크기 자체보다, 긴 맥락에서 필요한 단서를 얼마나 정확히 압축·검색·자기검증해 정답으로 연결하느냐에 달려 있다. 실전 기준으로는 제미나이의 간결한 탐색력, 오퍼스의 깊은 자기검증, 소넷의 가성비형 추론을 문제 유형별로 구분해 써야 한다.

티타임즈TV
#browsecomp#prompt-library#context-compression-reliability#frontier-model-evaluation