applications 태그 문서 23개 | 우성짱의 문서

Tag23건Article 23

#applications

이 태그와 연결된 문서를 한곳에서 모아보고, 함께 자주 등장하는 연관 태그까지 이어서 탐색할 수 있습니다.

연관 태그

#semiconductors공동문서 19 · 연관도 46%#agent-routing공동문서 8 · 연관도 43%#agent-deployment공동문서 9 · 연관도 43%#llm공동문서 21 · 연관도 37%#compute공동문서 2 · 연관도 29%#gpu공동문서 2 · 연관도 29%#context-compression공동문서 8 · 연관도 29%#service-design공동문서 8 · 연관도 25%#agent-memory공동문서 8 · 연관도 24%#capex-cycle공동문서 10 · 연관도 24%

Article2026년 6월 16일

Hands Free, AIs Forward: NVIDIA XR AI Brings Agents to AR Glasses

NVIDIA XR AI는 AR 안경과 XR 기기에서 현실 세계를 인식하고 기업 지식과 도구를 활용해 실시간으로 행동을 돕는 멀티모달 AI 에이전트 개발 프레임워크를 공개 베타로 제공한다.

David Chu

#nvidia #ai-architecture #multimodal #agent-routing

Article2026년 6월 14일

What Experts Ask ChatGPT vs What Beginners Ask: The Shocking Difference

이 글은 ChatGPT 결과 차이가 지능이나 도구 자체보다 역할·목표·대상·형식·제약을 분명히 주는 프롬프트 구조에서 나온다고 설명한다.

mosamtech.medium.com

#service-design #context-compression #prompt-library #llm

Article2026년 5월 9일

I Will Not Add Query Strings to Your URLs - Susam Pal

Susam Pal은 Wander Console에 넣었던 via= 추천 출처 쿼리 문자열 기능이 URL을 깨뜨리고 웹의 referrer 통제와 사용자 의도를 우회한다는 이유로 제거했으며, 앞으로는 다른 사람의 URL을 그대로 로드하겠다고 결론낸다.

susam.net

#privacy-design #semiconductors #applications #compute

Article2025년 6월 9일

AI metrics — Benedict Evans

생성형 AI는 빠르게 커지고 있지만, 지금 쓰이는 사용자 수·토큰 수·성장 비교 지표만으로는 실제 제품 가치와 사용 방식, 시장 변화를 제대로 설명하기 어렵다는 글입니다.

Benedict Evans

#inflation-risk #llm #semiconductors #applications

Article2026년 6월 12일

Mythos Begets Fable, Cursor's Composer 2.5, Agents Building Agents

원문은 데스크톱 AI 에이전트와 오픈소스 대안 OpenCoworker를 소개한 뒤, Anthropic의 Claude Mythos 5·Claude Fable 5 출시, 성능, 안전장치, 데이터 보관 정책, 논란을 상세히 다룬다.

deeplearning.ai

#kimi-k2-5 #anthropic #cursor #privacy-design

Article2026년 6월 11일

Stripe Projects adds new agent integrations, more providers, and custom developer controls

Stripe는 에이전트가 코드 작성뿐 아니라 인프라 프로비저닝과 서비스 연결까지 수행하도록 Projects를 확장하고, Hermes·Factory Droids·Warp 통합, 16개 신규 제공자, 비용·환경 제어 기능을 추가했다.

stripe.com

#service-design #agent-routing #llm #semiconductors

Article2026년 6월 23일

Memory Chips and China, Microsoft and Chinese Models

공개된 원문은 ‘중국 메모리 업체와 마이크로소프트의 중국 모델 활용 유인’을 제목과 짧은 문제 제기로 제시하지만, 실제 분석 본문은 Stratechery Plus 구독자 영역에 가려져 있다.

stratechery.com

#china #service-design #agent-memory #capex-cycle

Article2026년 6월 14일

vLLM Internalised: The Mechanics of Modern LLM Inference

vLLM은 KV 캐시를 작은 페이지로 관리하고 스케줄러가 토큰 예산을 배분함으로써, 단일 사용자 중심의 llama.cpp와 달리 GPU 위에서 다수의 동시 요청을 처리하도록 설계된 LLM 추론 엔진이다.

medium.com

#ai-architecture #agent-memory #capex-cycle #retrieval-index

Article2026년 6월 26일

Accelerating Gemini Nano models on Pixel with frozen Multi-Token Prediction

구글은 Pixel의 Gemini Nano v3에 별도 드래프터 없이 동결된 모델 위에 Multi Token Prediction 헤드를 덧붙여 온디바이스 추론 속도와 메모리 효율을 높이는 방식을 소개했다.

research.google

#ai-architecture #agent-deployment #agent-memory #context-compression

Article2026년 7월 5일

Introducing /agent: Gather Data Wherever It Lives on the Web

Firecrawl의 /agent는 URL 지정이나 사이트별 스크래핑 코드 없이 프롬프트만으로 웹 전반을 검색·탐색·클릭하고 구조화된 데이터를 수집하도록 설계된 연구 프리뷰 기능입니다.

Eric Ciarla

#agent-routing #context-compression #prompt-library #llm

Article2026년 7월 5일

Pro-worker AI, explained

MIT Sloan 글은 AI를 사람을 대체하는 자동화 도구가 아니라 인간의 판단·전문성·새로운 과업 수행 능력을 키우는 방향으로 설계해야 한다고 설명한다.

mitsloan.mit.edu

#service-design #semiconductors #applications #compute

Article2026년 7월 5일

New Approach to Scaling Laws Could Change How AI Models Are Trained

스탠퍼드 연구진은 교육측정학의 문항응답 원리를 스케일링 법칙에 적용해, 대형 언어모델 성능 예측에 필요한 계산량을 크게 줄이는 아이템 응답 스케일링 법칙을 제안했다.

hai.stanford.edu

#privacy-design #ai-architecture #llm #semiconductors

Article2026년 7월 5일

Algorithmic progress in language models

Epoch AI는 사전학습 언어모델에서 같은 성능에 필요한 컴퓨트가 약 8개월마다 절반으로 줄었지만, 지난 10년의 성능 향상은 알고리즘 혁신보다 컴퓨트와 데이터 확장의 영향이 더 컸다고 분석한다.

Anson Ho

#model-scaling #ai-architecture #capex-cycle #llm

Article2026년 6월 29일

AI agents are not your “coworkers”

이 글은 AI 에이전트를 ‘직원’이나 ‘동료’로 부르는 브랜딩이 인간의 책임감과 검토 능력을 약화시키며, AI는 사람을 대체하는 존재가 아니라 인간 역량을 보완하는 도구로 설계돼야 한다고 주장한다.

technologyreview.com

#anthropic #capex-cycle #change-management #organizational-redesign

Article2026년 6월 19일

Temporary Cloudflare Accounts for AI agents

Cloudflare는 AI 에이전트가 계정 가입·브라우저 인증 없이 Wrangler의 temporary 옵션으로 즉시 배포하고 60분 안에 사람이 계정을 소유권 이전할 수 있는 임시 계정 기능을 공개했다.

blog.cloudflare.com

#agent-deployment #llm #semiconductors #applications

Article2026년 6월 22일

GLM-5.2 is the step change for open agents

글은 GLM 5.2가 오픈 웨이트 모델이 코딩 하네스 안에서 범용 에이전트로 신뢰할 만한 단계에 처음 도달했음을 보여 주는 전환점이라고 평가한다.

Nathan Lambert

#anthropic #privacy-design #agent-routing #capex-cycle

Article2026년 7월 5일

Claude Science, an AI workbench for scientists

Anthropic은 과학자들이 문헌 분석, 데이터·계산 작업, 시각화·원고 작성, 재현 가능한 검증까지 한 환경에서 수행할 수 있도록 설계한 AI 워크벤치 Claude Science를 베타로 공개했다.

anthropic.com

#anthropic #agent-routing #workflow-automation #llm

Article2026년 6월 26일

OpenAI's Jalapeño chip is Big Tech's spiciest move away from Nvidia

테크크런치 에쿼티 팟캐스트는 오픈AI가 브로드컴과 함께 개발하는 맞춤형 추론 칩 ‘할라페뇨’를 중심으로, 빅테크가 엔비디아 단일 의존을 줄이려는 흐름과 그 밖의 주요 기술·투자 이슈를 다뤘다.

techcrunch.com

#anthropic #broadcom #nvidia #openai

Article2026년 7월 1일

Run NVIDIA Nemotron and OpenAI GPT OSS models on Amazon Bedrock in AWS GovCloud (US)

AWS GovCloud(US)의 보안·규정 준수 경계 안에서 OpenAI GPT OSS와 NVIDIA Nemotron 오픈웨이트 모델을 Amazon Bedrock으로 호출할 수 있게 됐다는 안내입니다.

aws.amazon.com

#nvidia #openai #service-design #ai-architecture

Article2026년 6월 15일

Agent Observability: How to Monitor and Evaluate LLM Agents in Production

이 글은 LLM 에이전트가 기존 소프트웨어처럼 예측·감시되기 어렵기 때문에, 프로덕션 대화 트레이스 자체를 관찰하고 인간 평가와 LLM 평가를 결합해 지속적으로 품질을 개선해야 한다고 설명한다.

langchain.com

#privacy-design #agent-routing #api-llm-llm #llm

Article2026년 6월 23일

NVIDIA Brings Trusted, 24/7 AI Agents to Telecom Operations

NVIDIA는 통신사가 과제 단위 자동화를 넘어, 합성 데이터·통신 특화 모델·보안 런타임·가속 시뮬레이션을 결합해 안전하게 운영 자율성을 확대하는 경로를 제시했습니다.

Lilac Ilan

#anthropic #nvidia #privacy-design #service-design

Article2026년 6월 30일

ScarfBench: Benchmarking AI Agents for Enterprise Java Framework Migration

ScarfBench는 기업용 자바 애플리케이션의 프레임워크 마이그레이션에서 AI 코딩 에이전트가 실제로 빌드·배포·동작 보존까지 해내는지를 평가하는 공개 벤치마크입니다.

huggingface.co

#service-design #agent-deployment #llm #semiconductors

Article2026년 6월 24일

OpenAI and Broadcom unveil LLM-optimized inference chip

OpenAI와 Broadcom은 LLM 추론에 최적화한 OpenAI의 첫 인텔리전스 프로세서 ‘Jalapeño’를 공개하며, 모델·제품·인프라까지 직접 최적화하는 풀스택 전략을 칩 단계로 확장했다.

openai.com

#broadcom #openai #privacy-design #ai-architecture