browsecomp 태그 문서 2개 | 우성짱의 문서

Tag2건YouTube 1Article 1

#browsecomp

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

Article2025년 4월 10일

BrowseComp: a benchmark for browsing agents

OpenAI의 BrowseComp는 웹 탐색 에이전트가 찾기 어렵지만 검증 가능한 정보를 얼마나 끈기 있고 전략적으로 찾아내는지 평가하기 위한 1,266문항 규모의 고난도 벤치마크다.

openai.com

#browsecomp #openai #simpleqa #deep-research

YouTube2026년 3월 9일

생각이 깊어 실수하는 클로드, 시킬 것과 시키지 말 것 (강수진 박사)

최신 AI 모델의 승부는 컨텍스트 윈도우 크기 자체보다, 긴 맥락에서 필요한 단서를 얼마나 정확히 압축·검색·자기검증해 정답으로 연결하느냐에 달려 있다. 실전 기준으로는 제미나이의 간결한 탐색력, 오퍼스의 깊은 자기검증, 소넷의 가성비형 추론을 문제 유형별로 구분해 써야 한다.

티타임즈TV

#browsecomp #prompt-library #context-compression-reliability #frontier-model-evaluation