Here's what an agent report people actually read looks like

🖼️ 인포그래픽

Here's what an agent report people actually read looks like 내용을 설명하는 본문 이미지

🖼️ 4컷 인포그래픽

💡 한 줄 요약

AI 에이전트 리포트는 “무엇을 했는지”를 길게 설명하기보다, 첫 화면에서 사용자가 내려야 할 결정과 추천 기본값을 바로 제시해야 실제로 읽힌다.

📌 핵심 요약

저자는 매일 2,000단어짜리 AI 에이전트 리포트를 받다가, 정작 “내가 무엇을 결정해야 하는지”가 보이지 않는 문제를 발견했다.
HTML 리포트는 가독성을 개선했지만, 더 본질적인 문제인 “결정 요청의 명확성”까지 해결하지는 못했다.
저자가 제안하는 새 리포트 계약은 PR 리뷰처럼 결정, 변경점, 근거, 리스크, 다음 행동을 첫 화면에 정리하는 방식이다.
X Manager 리포트는 현재 7가지 체크리스트를 통과해야 하며, 특히 “사용자에게 다음에 무엇을 요구하는가”를 명확히 쓰는 것이 핵심이다.
이 구조는 텍스트 리포트뿐 아니라 이미지 생성, 고객지원 분류, 이력서 검토, 이메일 triage, GitHub 알림 처리 등 반복적 검토 업무에도 적용될 수 있다.
저자의 핵심 thesis는 에이전트 출력물이 정보 더미가 아니라 “몇 초 안에 답할 수 있는 결정 패키지”가 되어야 한다는 것이다.

🧩 주요 포인트

에이전트 리포트의 첫 화면은 사용자가 내려야 할 결정과 추천 기본값을 즉시 보여줘야 한다.
긴 배경 설명, 작업 과정, 사고 흔적은 중요할 수 있지만 첫 화면의 우선순위는 아니다.
PR 리뷰 형식은 에이전트 리포트 설계에 좋은 참고 모델이 된다.
좋은 리포트는 근거 출처, 변경점, 실패 가능성, 상세 자료 위치, 다음 요청을 함께 제공해야 한다.
이미지 생성에서도 “최고의 하나를 기다리는 방식”보다 “여러 후보 중 선택하는 방식”이 더 나은 사용자 경험을 만든다.
반복 실행되고 사람의 검토가 필요한 업무라면 대부분 “결정 + 추천 기본값 + 상세 근거 위치” 구조로 재설계할 수 있다.

🧠 상세 정리

1. 문제는 긴 리포트가 아니라 결정이 보이지 않는 리포트다

저자는 아침에 휴대폰을 열었을 때 AI 어시스턴트가 보낸 2,000단어짜리 업데이트를 받는 장면으로 글을 시작한다. 에이전트가 전날 무엇을 했고, 무엇을 봤고, 어디서 막혔는지 자세히 설명하지만, 첫 화면에는 사용자가 무엇을 해야 하는지가 보이지 않는다. 결국 사용자는 끝까지 읽지 않고 아래로 스크롤하다가, 명확한 행동 요청을 찾지 못한 채 더 피곤해진다. 이 문제는 저자가 실제로 사용하던 X Manager에서도 반복됐다. X Manager는 일정에 따라 X 타임라인을 확인하고, 답글을 체크하고, 주요 계정을 추적하고, 게시물 초안을 만드는 에이전트다. 하루에 한 번 Telegram으로 약 2,000단어의 보고서를 보냈지만, 저자는 어느 순간 “첫 번째 AI가 보낸 내용을 두 번째 AI에게 요약시켜야겠다”고 느꼈다. 이 경험은 에이전트가 많은 일을 하는 것과, 사용자가 바로 판단할 수 있는 결과물을 주는 것은 다르다는 점을 드러낸다.

2. HTML 리포트는 가독성을 높였지만 결정 문제를 해결하지 못했다

저자는 이전에 에이전트의 전달 형식을 Telegram의 긴 Markdown 메시지에서, 한 줄 알림과 브라우저에서 열 수 있는 HTML 리포트로 바꿨다고 설명한다. 며칠간 운영해본 결과는 좋았다. 눈으로 긴 메시지를 처리해야 하는 부담이 줄었고, 리포트 자체는 읽기 쉬워졌다. 하지만 더 깊은 문제가 남았다. HTML은 “읽기 편한 형식”을 제공했을 뿐, “내가 무엇을 결정해야 하는가”라는 질문에는 답하지 못했다. 저자의 관점에서 에이전트 리포트의 핵심은 단순한 가독성이 아니다. 리포트가 사용자의 다음 판단을 얼마나 빠르게 구조화해주는지가 더 중요하다. 따라서 전달 매체를 바꾸는 것만으로는 충분하지 않고, 리포트의 계약 자체를 바꿔야 한다.

3. 첫 화면의 역할은 결정과 추천 기본값을 제시하는 것이다

저자가 새롭게 세운 규칙은 단순하다. 리포트의 첫 화면은 두 가지를 말해야 한다. 첫째, 사용자가 어떤 결정을 내려야 하는가. 둘째, 에이전트가 추천하는 기본값은 무엇인가. 나머지 배경, 과정, 세부 근거는 아래로 내려가도 된다. 이 구조가 중요한 이유는 에이전트가 오래 실행될수록 더 많은 맥락을 만들어내기 때문이다. 20분 동안 실행된 에이전트는 아름답고 풍부한 컨텍스트 묶음을 만들 수 있다. 하지만 그 컨텍스트가 사용자의 결정을 대신 정리해주지 않는다면, 가장 어려운 단계는 여전히 사람에게 남는다. 저자의 thesis는 여기서 분명해진다. 에이전트의 산출물은 “작업 기록”이 아니라 “결정 요청”이어야 한다.

4. PR 리뷰 형식은 에이전트 리포트의 좋은 참조 모델이다

저자는 프로그래머들이 사용하는 Pull Request 형식을 에이전트 리포트의 참고 모델로 제시한다. PR은 리뷰어에게 전달되는 짧은 워크시트에 가깝다. 이 변경을 승인해야 하는가, 거절해야 하는가, 수정 요청을 해야 하는가. 무엇이 바뀌었는가. 어떤 테스트나 근거가 있는가. 어떤 조건에서 문제가 생길 수 있는가. 리뷰어가 어떤 행동을 해야 하는가. 저자는 자신의 에이전트 리포트도 이와 비슷해야 한다고 본다. 다섯 가지 필드가 잘 정리되어 있으면 사용자는 5초 안에 무엇을 해야 하는지 알 수 있다. 전체 리포트를 읽을지 여부는 그 다음 문제다. 이 비유는 기존의 “보고서” 중심 방식과의 차이를 잘 보여준다. 기존 리포트가 에이전트의 활동 내역을 설명하는 데 집중했다면, PR형 리포트는 사용자의 검토와 승인, 선택, 보류, 정보 제공을 중심으로 설계된다.

5. X Manager의 7가지 체크리스트는 리포트 계약을 구체화한다

저자는 현재 X Manager 리포트가 통과해야 하는 7가지 체크리스트를 제시한다. 첫째, 무엇을 결정해야 하는지 opening line에 정확히 쓴다. 예를 들어 “오늘 14시에 이 트윗 초안을 게시할까요?”처럼 구체적인 질문이어야 한다. 둘째, 추천 기본값을 하나 제시한다. 비슷한 옵션 다섯 개를 던지는 것은 결정을 다시 사용자에게 떠넘기는 것과 같다고 본다. 셋째, 지난 실행 이후 무엇이 바뀌었는지 설명한다. 넷째, 각 주장에 어떤 파일, 실행 기록, 시간 범위, 스크린샷, 외부 링크 같은 근거가 있는지 밝혀야 한다. 다섯째, 추천이 틀릴 수 있는 조건을 적는다. 여섯째, 상세 자료가 오래 남을 수 있는 위치에 있어야 한다. 단순히 채팅창에만 있으면 안 된다. 일곱째, 마지막 줄에서 사용자가 무엇을 답해야 하는지 알려야 한다. 저자는 특히 마지막 항목이 작아 보이지만 가장 큰 변화를 만든다고 말한다.

6. 좋은 에이전트 출력은 몇 초 안에 답할 수 있는 질문으로 압축된다

저자는 이 글 자체가 자신의 주장에 대한 사례라고 말한다. X Manager에게 글 준비를 맡겼더니, 정오쯤 온 리포트의 첫 화면에는 세 가지 옵션이 있었다. A는 PR 비유를 글의 중심축으로 삼는 것, B는 7가지 체크리스트를 실용 도구로 넣는 것, C는 오늘 아무것도 쓰지 않는 것이었다. 저자는 3초 만에 A와 B를 선택하고 다른 일을 하러 갔다. 이 사례에서 중요한 점은 에이전트가 단순히 자료를 모은 것이 아니라, 자료를 사용자가 즉시 선택할 수 있는 질문으로 포장했다는 것이다. “많이 조사했으니 봐달라”가 아니라 “이 선택지 중 무엇을 할까요?”라고 묻는 방식이다. 저자의 관점에서 유용한 에이전트 출력은 사용자가 몇 초 안에 답할 수 있는 결정 단위로 작업을 압축한다.

7. 이미지 생성에서도 원리는 같다: 하나를 기다리지 말고 후보군에서 고른다

저자는 텍스트 리포트의 논리가 이미지 생성에도 그대로 적용된다고 말한다. 과거에는 에이전트에게 “가장 좋은 이미지 하나”를 만들게 했지만 결과가 만족스럽지 않았다. 이미지를 보고 프롬프트를 고쳐 다시 생성하거나, 직접 처리해야 하는 경우가 많았다. 이제는 X Manager 파이프라인이 이미지 생성 단계를 Codex의 이미지 생성 도구에 넘기고, 한 번에 10~12장의 이미지를 만든다. 직렬로 생성되기 때문에 빠르지는 않지만, 사용자는 그동안 글을 쓰거나 다른 cron 작업 결과를 처리하거나 커피를 마실 수 있다. 몇 분 뒤 outbound 디렉터리에 zip 파일이 생기면, 사용자는 그중 하나를 고르면 된다. 경험의 중심이 “맞을지도 모르는 하나를 기다리기”에서 “눈앞의 후보 세트 중 고르기”로 바뀐다.

8. 반복적 검토 업무는 같은 구조로 재설계할 수 있다

저자는 이 구조가 텍스트 리포트와 이미지 생성에만 머물지 않는다고 본다. 반복 실행되고 사람의 검토가 필요한 작업이라면 대부분 적용 가능하다. 고객지원이나 피드백 triage에서는 “즉시 환불이 필요한 건 3건, FAQ로 보낼 수 있는 건 5건, escalation 판단이 필요한 건 1건”처럼 첫 화면을 구성할 수 있다. 이력서 검토에서는 “상위 3명은 인터뷰 가치가 있고, 5명은 role fit 확인이 필요하며, 나머지는 기본 skip”으로 정리할 수 있다. 이메일 triage, GitHub나 Linear 알림 backlog, 개인 금융이나 청구 이상 탐지에도 같은 방식이 적용된다. 핵심은 매번 같다. 사용자가 내려야 할 결정은 무엇인지, 추천 기본값은 무엇인지, 나머지 상세 근거는 어디에 있는지다. 저자는 이렇게 쓰인 에이전트 리포트라면 실제로 열어보게 된다고 결론짓는다.

🧾 핵심 주장 / 시사점

에이전트 리포트의 품질은 정보량보다 “사용자가 바로 결정할 수 있게 만드는가”로 평가해야 한다.
첫 화면에는 작업 과정이 아니라 결정 요청, 추천 기본값, 다음 행동이 와야 한다.
PR 리뷰 형식은 에이전트 리포트를 설계할 때 유용한 실용적 프레임워크가 될 수 있다.
“상세 자료는 durable artifact에 두고, 채팅에는 결정 요약만 둔다”는 방식은 반복 업무에서 사용자의 인지 부담을 줄인다.
이미지 생성처럼 비텍스트 작업에서도 에이전트는 단일 결과물을 강요하기보다 후보군과 추천안을 제시하는 검토 구조를 만들 수 있다.

✅ 액션 아이템

X Manager 리포트의 첫 화면에 “결정할 항목”과 “추천 기본값”이 항상 포함되는지 점검한다.
기존 Telegram 또는 HTML 리포트에 PR형 필드인 변경점, 근거, 리스크, 리뷰어 액션을 추가한다.
이미지 생성 파이프라인에서 10~12개 후보를 묶어 제공하고, 에이전트가 추천 후보 번호를 함께 태그하도록 개선한다.
고객지원, 이력서 검토, inbox triage, GitHub/Linear 알림 중 반복 검토 업무 하나를 골라 “결정 + 기본값 + 상세 리포트 위치” 구조로 재작성한다.

❓ 열린 질문

에이전트가 추천 기본값을 제시할 때, 사용자가 신뢰할 수 있을 만큼의 근거를 첫 화면에 얼마나 포함해야 할까?
여러 옵션이 실제로 동등하게 보이는 상황에서도 에이전트는 반드시 하나의 기본값을 추천해야 할까?
HTML 리포트, 채팅 알림, durable artifact 사이에서 어떤 정보가 각각 어디까지 들어가야 가장 효율적일까?

🖼️ 인포그래픽

🖼️ 4컷 인포그래픽

💡 한 줄 요약

📌 핵심 요약

🧩 주요 포인트

🧠 상세 정리

1. 문제는 긴 리포트가 아니라 결정이 보이지 않는 리포트다

2. HTML 리포트는 가독성을 높였지만 결정 문제를 해결하지 못했다

3. 첫 화면의 역할은 결정과 추천 기본값을 제시하는 것이다

4. PR 리뷰 형식은 에이전트 리포트의 좋은 참조 모델이다

5. X Manager의 7가지 체크리스트는 리포트 계약을 구체화한다

6. 좋은 에이전트 출력은 몇 초 안에 답할 수 있는 질문으로 압축된다

7. 이미지 생성에서도 원리는 같다: 하나를 기다리지 말고 후보군에서 고른다

8. 반복적 검토 업무는 같은 구조로 재설계할 수 있다

🧾 핵심 주장 / 시사점

✅ 액션 아이템

❓ 열린 질문

공통 태그

함께 탐색할 태그

관련 문서

I tried letting my scheduled agents deliver only HTML, and I'm not going back

276 Use Cases of Hermes Agent — What the Community is Building in 2026

How to Become a Hermes Agent Operator

My OpenClaw System Is Out of Control

EP 88. 비결은 없다

Hermes as an Onchain Analyst