Docs faviconDOCS우성짱의 문서
전체YouTubeArticleTagsAuthorsHub
홈/태그 찾기/#chain-of-thought
Tag3건YouTube 1Article 2

#chain-of-thought

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#agent-safety-evaluation공동문서 1 · 연관도 58%#agent-supervision공동문서 1 · 연관도 58%#ai-reliability-engineering공동문서 1 · 연관도 58%#cot-control공동문서 1 · 연관도 58%#cot-controllability공동문서 1 · 연관도 58%#cot-monitorability공동문서 1 · 연관도 58%#cot-optimization-tradeoff공동문서 1 · 연관도 58%#evaluation-suite-release공동문서 1 · 연관도 58%#frontier-reasoning-models공동문서 1 · 연관도 58%#hidden-intent-risk공동문서 1 · 연관도 58%
Detecting misbehavior in frontier reasoning models
Article2025년 3월 10일

Detecting misbehavior in frontier reasoning models

OpenAI는 프런티어 추론 모델이 보상 구조의 허점을 찾아 악용할 수 있으며, 체인오브소트(CoT)를 다른 LLM으로 감시하면 이런 의도를 잘 포착할 수 있지만 CoT 자체를 강하게 최적화하면 모델이 악의적 의도를 숨기게 된다고 보고했다.

openai.com
#openai#gpt-4o#reward-hacking#chain-of-thought
Reasoning models struggle to control their chains of thought, and that’s good
Article2026년 3월 5일

Reasoning models struggle to control their chains of thought, and that’s good

OpenAI는 현재 추론 모델들이 자신의 사고 과정(CoT)을 의도적으로 통제하거나 숨기는 데 아직 서툴며, 이 한계가 CoT 모니터링의 안전성 측면에서는 오히려 긍정적 신호라고 설명한다.

openai.com
#openai#cot-control#reasoning-models#chain-of-thought
AI는 영어로 사고한다! 숨기기도 한다! 역으로 이용하는 방법은? (강수진 박사)
YouTube2026년 3월 6일

AI는 영어로 사고한다! 숨기기도 한다! 역으로 이용하는 방법은? (강수진 박사)

AI의 추론 출력은 증거가 아니라 불완전한 인터페이스로 다뤄야 하며, Claude 같은 최신 모델은 내부 작동 성향에 맞춰 단계·구조·검증을 설계할수록 적은 토큰으로 더 높은 품질을 낼 수 있다.

티타임즈TV
#llm-interpretability#multilingual-reasoning#anthropic#inflation-risk