Caleb Writes Code 문서 2개 | 우성짱의 문서

Author2건YouTube 2

Caleb Writes Code

이 작성자와 연결된 문서를 한곳에서 모아보고, 관련 태그를 따라 같은 맥락의 문서를 이어서 탐색할 수 있습니다.

자주 함께 등장한 태그

#language-modeling #neural-network-training #next-token-prediction #gpt-from-scratch #bigram-to-gpt #loss-driven-learning #context-limitations #andrej-karpathy #bigram-language-model #shakespeare-corpus #softmax #technical-explainer

YouTube2026년 6월 18일

Karpathy Bigram explained in 10min..

Karpathy Bigram은 GPT로 가기 전, 다음 토큰 예측과 손실 최소화가 어떻게 언어 모델 학습의 기본 원리가 되는지 보여주는 가장 단순한 출발점이다.

Caleb Writes Code

#language-modeling #neural-network-training #next-token-prediction #gpt-from-scratch

YouTube2026년 3월 4일

Qwen 3.5 Small explained..

Qwen 3.5 소형 모델의 핵심 가치는 경량화 자체가 아니라 제한된 하드웨어에서 더 높은 지능을 실용적으로 제공해, 오프라인·프라이버시·엣지 배치 시장을 실제 사업 기회로 바꾸는 데 있습니다. 앞으로 경쟁 우위는 가장 큰 모델을 가진 곳보다, 가장 작은 자원 조건에서 가장 쓸 만한 성능을 내는 곳에서 더 자주 나올 가능성이 큽니다.

Caleb Writes Code

#alibaba #energy-infrastructure #privacy-design #edge-ai-inference