이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.
연관 태그
NVIDIA XR AI는 AR 안경과 XR 기기에서 현실 세계를 인식하고 기업 지식과 도구를 활용해 실시간으로 행동을 돕는 멀티모달 AI 에이전트 개발 프레임워크를 공개 베타로 제공한다.
이 글은 ChatGPT 결과 차이가 지능이나 도구 자체보다 역할·목표·대상·형식·제약을 분명히 주는 프롬프트 구조에서 나온다고 설명한다.
Susam Pal은 Wander Console에 넣었던 via= 추천 출처 쿼리 문자열 기능이 URL을 깨뜨리고 웹의 referrer 통제와 사용자 의도를 우회한다는 이유로 제거했으며, 앞으로는 다른 사람의 URL을 그대로 로드하겠다고 결론낸다.
생성형 AI는 빠르게 커지고 있지만, 지금 쓰이는 사용자 수·토큰 수·성장 비교 지표만으로는 실제 제품 가치와 사용 방식, 시장 변화를 제대로 설명하기 어렵다는 글입니다.
원문은 데스크톱 AI 에이전트와 오픈소스 대안 OpenCoworker를 소개한 뒤, Anthropic의 Claude Mythos 5·Claude Fable 5 출시, 성능, 안전장치, 데이터 보관 정책, 논란을 상세히 다룬다.
Stripe는 에이전트가 코드 작성뿐 아니라 인프라 프로비저닝과 서비스 연결까지 수행하도록 Projects를 확장하고, Hermes·Factory Droids·Warp 통합, 16개 신규 제공자, 비용·환경 제어 기능을 추가했다.
공개된 원문은 ‘중국 메모리 업체와 마이크로소프트의 중국 모델 활용 유인’을 제목과 짧은 문제 제기로 제시하지만, 실제 분석 본문은 Stratechery Plus 구독자 영역에 가려져 있다.
vLLM은 KV 캐시를 작은 페이지로 관리하고 스케줄러가 토큰 예산을 배분함으로써, 단일 사용자 중심의 llama.cpp와 달리 GPU 위에서 다수의 동시 요청을 처리하도록 설계된 LLM 추론 엔진이다.
구글은 Pixel의 Gemini Nano v3에 별도 드래프터 없이 동결된 모델 위에 Multi Token Prediction 헤드를 덧붙여 온디바이스 추론 속도와 메모리 효율을 높이는 방식을 소개했다.
Firecrawl의 /agent는 URL 지정이나 사이트별 스크래핑 코드 없이 프롬프트만으로 웹 전반을 검색·탐색·클릭하고 구조화된 데이터를 수집하도록 설계된 연구 프리뷰 기능입니다.
MIT Sloan 글은 AI를 사람을 대체하는 자동화 도구가 아니라 인간의 판단·전문성·새로운 과업 수행 능력을 키우는 방향으로 설계해야 한다고 설명한다.
스탠퍼드 연구진은 교육측정학의 문항응답 원리를 스케일링 법칙에 적용해, 대형 언어모델 성능 예측에 필요한 계산량을 크게 줄이는 아이템 응답 스케일링 법칙을 제안했다.
Epoch AI는 사전학습 언어모델에서 같은 성능에 필요한 컴퓨트가 약 8개월마다 절반으로 줄었지만, 지난 10년의 성능 향상은 알고리즘 혁신보다 컴퓨트와 데이터 확장의 영향이 더 컸다고 분석한다.
이 글은 AI 에이전트를 ‘직원’이나 ‘동료’로 부르는 브랜딩이 인간의 책임감과 검토 능력을 약화시키며, AI는 사람을 대체하는 존재가 아니라 인간 역량을 보완하는 도구로 설계돼야 한다고 주장한다.
Cloudflare는 AI 에이전트가 계정 가입·브라우저 인증 없이 Wrangler의 temporary 옵션으로 즉시 배포하고 60분 안에 사람이 계정을 소유권 이전할 수 있는 임시 계정 기능을 공개했다.
글은 GLM 5.2가 오픈 웨이트 모델이 코딩 하네스 안에서 범용 에이전트로 신뢰할 만한 단계에 처음 도달했음을 보여 주는 전환점이라고 평가한다.
Anthropic은 과학자들이 문헌 분석, 데이터·계산 작업, 시각화·원고 작성, 재현 가능한 검증까지 한 환경에서 수행할 수 있도록 설계한 AI 워크벤치 Claude Science를 베타로 공개했다.
테크크런치 에쿼티 팟캐스트는 오픈AI가 브로드컴과 함께 개발하는 맞춤형 추론 칩 ‘할라페뇨’를 중심으로, 빅테크가 엔비디아 단일 의존을 줄이려는 흐름과 그 밖의 주요 기술·투자 이슈를 다뤘다.
AWS GovCloud(US)의 보안·규정 준수 경계 안에서 OpenAI GPT OSS와 NVIDIA Nemotron 오픈웨이트 모델을 Amazon Bedrock으로 호출할 수 있게 됐다는 안내입니다.
이 글은 LLM 에이전트가 기존 소프트웨어처럼 예측·감시되기 어렵기 때문에, 프로덕션 대화 트레이스 자체를 관찰하고 인간 평가와 LLM 평가를 결합해 지속적으로 품질을 개선해야 한다고 설명한다.
NVIDIA는 통신사가 과제 단위 자동화를 넘어, 합성 데이터·통신 특화 모델·보안 런타임·가속 시뮬레이션을 결합해 안전하게 운영 자율성을 확대하는 경로를 제시했습니다.
ScarfBench는 기업용 자바 애플리케이션의 프레임워크 마이그레이션에서 AI 코딩 에이전트가 실제로 빌드·배포·동작 보존까지 해내는지를 평가하는 공개 벤치마크입니다.
OpenAI와 Broadcom은 LLM 추론에 최적화한 OpenAI의 첫 인텔리전스 프로세서 ‘Jalapeño’를 공개하며, 모델·제품·인프라까지 직접 최적화하는 풀스택 전략을 칩 단계로 확장했다.