Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#inference-time-scaling
Tag4건YouTube 1Article 3

#inference-time-scaling

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#actor-runner-architecture공동문서 1 · 연관도 50%#amazon-ec2공동문서 1 · 연관도 50%#aws-accelerated-computing공동문서 1 · 연관도 50%#browsing-tool-insufficiency공동문서 1 · 연관도 50%#cheap-verification-tasks공동문서 1 · 연관도 50%#ec2-p5공동문서 1 · 연관도 50%#ec2-p6공동문서 1 · 연관도 50%#foundation-model-infrastructure공동문서 1 · 연관도 50%#inference-serving-economics공동문서 1 · 연관도 50%#information-retrieval공동문서 1 · 연관도 50%
Trading off compute in training and inference
Article2026년 6월 22일

Trading off compute in training and inference

Epoch AI는 훈련 컴퓨트와 추론 컴퓨트가 일정 범위에서 서로 대체될 수 있으며, 특히 대규모 배포 모델에서는 추론 비용 최적화와 고성능 소규모 사용 사이의 균형이 중요하다고 분석한다.

Pablo Villalobos
#epoch-ai#gpt-3#gpt-4#pablo-villalobos
Building Blocks for Foundation Model Training and Inference on AWS
Article2026년 5월 14일

Building Blocks for Foundation Model Training and Inference on AWS

이 글은 파운데이션 모델의 확장이 사전학습 중심에서 사후학습·추론 시점 연산까지 넓어지면서, AWS 위에서 가속 컴퓨트·저지연 네트워크·분산 스토리지·오픈소스 운영 스택이 어떻게 함께 설계되어야 하는지 설명한다.

huggingface.co
#amazon-ec2#ec2-p5#ec2-p6#nvidia-h100
BrowseComp: a benchmark for browsing agents
Article2025년 4월 10일

BrowseComp: a benchmark for browsing agents

OpenAI의 BrowseComp는 웹 탐색 에이전트가 찾기 어렵지만 검증 가능한 정보를 얼마나 끈기 있고 전략적으로 찾아내는지 평가하기 위한 1,266문항 규모의 고난도 벤치마크다.

openai.com
#browsecomp#openai#simpleqa#deep-research
다들 죽기살기 모드" (실리콘밸리)
YouTube2026년 3월 5일

다들 죽기살기 모드" (실리콘밸리)

대형언어모델의 경쟁은 아직 끝나지 않았지만, 앞으로의 승부는 모델을 무작정 더 크게 만드는 데 있지 않고 사전학습·강화학습·추론 확장 중 어떤 계산을 어떤 제품에 배치해야 가장 높은 성능 대비 수익을 만들 수 있는지에 달려 있다.

비즈까페
#actor-runner-architecture#energy-infrastructure#capex-cycle#energy-security