[시즌 3][유료 광고] Bright Data 쉬운 데이터 수집 + 간단 분석(코워크 사용)(쿠팡 데이터 수집)(이미지가 있는 워드 보고서까지)
Quick Summary
Bright Data와 코워크를 결합하면 쿠팡 데이터 수집의 차단·구조 복잡성을 줄이고, 상세 데이터 정리와 이미지 포함 워드 보고서까지 한 흐름으로 연결할 수 있다.
영상 보기
클릭 전까지는 가벼운 미리보기만 먼저 불러옵니다.
🖼️ 인포그래픽
🖼️ 4컷 인포그래픽
💡 한 줄 결론
Bright Data와 코워크를 결합하면 쿠팡 데이터 수집의 차단·구조 복잡성을 줄이고, 상세 데이터 정리와 이미지 포함 워드 보고서까지 한 흐름으로 연결할 수 있다.
📌 핵심 요점
- 쿠팡처럼 일반 코드 크롤링이 어려운 이커머스 사이트에서는 상품 링크 수집, 상세 페이지 접근, 이미지·리뷰 데이터 확보가 주요 병목으로 제시됐다.
- 전체 워크플로는 브라이트 데이터 MCP와 Unlocker로 상품 URL을 모으고, Bright Data Scrapers에서 상세 데이터를 수집한 뒤, 스냅샷 ID를 코워크로 불러와 분석하는 구조다.
- 영상에서는 쿠팡 클렌징·필링 카테고리 랭킹순 1·2페이지에서 120개 상품 URL을 모으고, CSV를 Scrapers에 업로드해 URL 기반 상세 수집을 진행했다.
- 수집된 데이터는 상품명, 평점, 리뷰 수, 이미지 링크 등을 포함하며, 코워크에서 CSV 정리, 중복 제거, 리뷰 수 기준 정렬, 대시보드 시각화로 이어졌다.
- 최종적으로 상품군별 리뷰·평점·경쟁 구도를 확인하고, 이미지가 포함된 워드 보고서까지 자동화해 마케팅·기획 실무 보고 흐름을 단축하는 사례를 보여줬다.
🧩 배경과 문제 정의
- 쿠팡처럼 일반적인 코드 기반 크롤링이 잘 작동하지 않는 이커머스 사이트에서는 상품 링크 수집, 상세 페이지 접근, 이미지·리뷰 데이터 확보가 병목이 되기 쉽다.
- 이커머스 데이터를 바탕으로 전략을 세워야 하는 마케터와 기획자에게는 사이트 구조 변경이나 차단 대응에 드는 부담을 줄이는 수집 방식이 중요하다.
- 이 흐름에서 브라이트 데이터는 차단 우회, 상세 데이터 수집, 스냅샷 기반 다운로드를 맡고, 코워크는 수집 이후의 정리·분석·시각화와 보고서 생성을 담당한다.
🕒 시간순 섹션별 상세정리
- 쿠팡 수집의 난점과 실무 활용 맥락
- 쿠팡은 일반적인 코드만으로는 데이터 수집이 쉽지 않은 사이트이며, 브라이트 데이터를 활용하면 차단 대응과 복잡한 페이지 구조 처리를 대신 맡길 수 있다 [00:19]
- 이번 작업의 핵심은 고도화된 분석보다, 수집이 어려운 데이터를 손쉽게 확보한 뒤 간단한 분석 단계로 이어가는 전체 흐름을 보여주는 데 있다 [00:31]
- 비용 효율과 작업 역할 분리
- 쿠팡 상품 페이지는 텍스트와 이미지 구성이 복잡해 테스트 비용이 커지며, 바이브 코딩 툴만으로 끝까지 수집하려면 월 20달러 수준의 사용량으로는 현실성이 낮다 [01:16]
- 브라이트 데이터는 1,000건 수집당 약 1.5달러 구조이므로, 수집 작업을 외부 도구에 맡기면 코딩 툴에서 소모되는 토큰을 크게 줄일 수 있다 [01:47]
- 전체 워크플로와 수집 단계 설계
- 프로젝트 폴더의 환경 파일에는 브라이트 데이터 API 키가 필요하며, Scrapers 기능을 이용해 쿠팡 개별 상품 링크를 기반으로 데이터를 수집한다 [02:37]
- 상품 상세 정보를 수집하려면 먼저 쿠팡 개별 상품 URL 목록이 필요하고, 이 목록은 브라이트 데이터 MCP와 Unlocker를 활용해 확보한다 [03:01]
- 쿠팡 카테고리 링크에서 120개 상품 URL 확보
- 쿠팡의 클렌징·필링 카테고리 랭킹순 페이지를 기준으로, 1페이지와 2페이지에서 각각 60개씩 총 120개 상품 링크를 수집하는 것을 목표로 한다 [03:59]
- 프롬프트에는 카테고리 페이지에서 총 120개의 상품 URL을 추출해 CSV 파일로 저장하고, 필요 시 브라이트 데이터 Unlocker를 사용하라는 조건을 포함한다 [04:12]
- Scrapers에서 URL 기반 상세 데이터 수집
- 준비된 CSV에는 쿠팡 카테고리에서 확보한 120개 상품 링크가 담겨 있으며, 이 파일을 Bright Data Scrapers 기능의 입력값으로 사용한다 [06:14]
- Scrapers Library에서 쿠팡을 검색하면 Scrapers와 Datasets가 구분되는데, 이미 수집된 데이터를 구매하는 Datasets가 아니라 직접 수집하는 Scrapers를 선택한다 [06:32]
- 스냅샷 다운로드, 데이터 정리, 대시보드 전환
- 수집이 끝나면 스냅샷 ID를 복사하고, 코워크에서 Bright Data API 키가 포함된 환경 파일이 있는 프로젝트 폴더를 열어 후속 다운로드를 준비한다 [08:20]
- 스냅샷 ID의 데이터를 CSV로 저장하라고 요청하면, 코워크가 API 키를 사용해 데이터를 내려받고 기존 URL 목록과 별도로 120개 상품 상세 데이터 CSV를 생성한다 [09:02]
- 대시보드 분석과 이미지 포함 워드 보고서 자동화
- CSV 기반 상품 데이터를 활용해 팀장 보고용 워드 문서를 만들 수 있으며, 이미지를 함께 넣으면 화장품의 패키징과 외형까지 보고서에서 비교할 수 있다 [12:27]
- Show Me 기능은 총 리뷰, 평균 평점, 분야 수, 그래프를 대시보드 형태로 보여주며, 보고서에서 확인해야 할 요소들을 시각화된 분석 화면으로 압축한다 [12:38]
- 마케팅·기획 활용 가치와 최종 결과 확인
- 데이터 수집에서 분석까지 이어지는 이 과정은 마케터와 기획자에게 유용하며, 도서 시장 분석처럼 실무 기획 업무에서도 유사한 시장 조사 흐름이 필요하다 [14:19]
- 일반적인 바이브 코딩 작업만으로는 가져오기 어려운 데이터도 Bright Data를 활용하면 수집이 쉬워지고, 이를 바탕으로 분석과 보고서 작성까지 자연스럽게 연결할 수 있다 [14:43]
- 최종 워드 보고서 확인과 활용 권유
- 생성된 보고서 결과를 확인하며, 세 페이지로 제한하려던 요청은 시간이 오래 걸려 페이지 수 제한 없이 진행했다고 설명한다 [15:09]
- 완성본은 제품 이미지까지 포함된 형태로 정리되어 있어 보고서 제작 시간을 크게 줄일 수 있다고 평가한다 [15:19]
- Bright Data 기능을 활용해 데이터 수집, 보고서 작성, 데이터 정리까지 한 흐름으로 진행했다고 전체 과정을 정리한다 [15:25]
- 시청자에게 그냥 넘기지 말고 직접 써 보기를 권하며, 계속 유용한 영상으로 돌아오겠다고 마무리한다 [15:46]
- Bright Data 워크샵 추가 안내
- 영상 마무리 후 Bright Data에서 25일 워크샵이 진행된다는 소식을 덧붙이며 간단히 소개한다 [15:51]
- 상세 설명에 링크를 넣겠다고 하며, 다양한 세션이 궁금한 사람은 서울 파나스 호텔 행사 참여를 고려해 보라고 안내한다 [16:01]
- 행사 어젠다도 확인해 보고, 영어로 된 내용은 한글로 번역해 살펴보면 된다고 덧붙인다 [16:15]
🧾 결론
- 이 영상의 핵심은 “분석을 잘하는 법”보다 “수집하기 어려운 쿠팡 데이터를 어떻게 안정적으로 가져와 분석 가능한 형태로 바꾸는가”에 있다.
- Bright Data는 차단 우회, 쿠팡 상세 페이지 수집, 스냅샷 제공을 담당하고, 코워크는 다운로드된 데이터를 정리·분석·시각화·보고서화하는 역할로 분리된다.
- 단순한 URL 목록 수집에서 끝나는 것이 아니라, 리뷰 수·평점·상품군·이미지까지 포함한 보고 자료로 확장되는 점이 실무 활용 포인트다.
- 영상에서는 120개 URL 수집, Scrapers 실행, 스냅샷 다운로드, CSV 정리, 대시보드 확인, 이미지 포함 워드 보고서 생성까지 하나의 작업 흐름으로 연결했다.
- 검증 필요 사항: 실제 적용 전에는 Bright Data의 현재 과금, 쿠팡 대상 Scrapers 지원 상태, 수집 성공률, 사이트 정책 및 데이터 활용 범위를 별도로 확인해야 한다.
📈 투자·시사 포인트
- 이커머스 시장 조사 업무에서는 데이터 수집 자체가 병목이 되기 쉬우므로, 수집 인프라와 분석 도구를 분리하는 방식이 생산성 향상에 유리할 수 있다.
- 마케터·기획자 입장에서는 상품명, 리뷰 수, 평점, 이미지 데이터를 빠르게 확보하면 카테고리 기회 탐색, 경쟁 상품 비교, 보고서 제작 속도를 높일 수 있다.
- 영상 사례에서는 스크럽·필링이 수요 대비 경쟁이 적은 영역으로 분류되고, 닥터지 상품이 리뷰 상위에 반복 등장하는 흐름이 관찰됐다.
- 이미지 링크까지 수집되면 텍스트 중심 분석을 넘어 패키징, 상품 외형, 카테고리별 시각 비교가 가능해져 보고서 설득력이 높아질 수 있다.
- 비용 측면에서는 수집을 Bright Data에 맡기고 코워크에는 분석·정리 작업을 맡기는 방식이 코딩 도구의 토큰 사용량과 반복 테스트 부담을 줄이는 전략으로 제시됐다.
⚠️ 불확실하거나 확인이 필요한 부분
- Bright Data의 “1,000건당 약 1.5달러” 비용은 영상 시점의 설명이므로, 실제 적용 전 현재 요금제·국가·수집 대상·사용량 기준을 별도로 확인해야 한다.
- 쿠팡 클렌징·필링 카테고리에서 120개 URL을 수집했지만, 정리 후 고유 상품이 6개로 줄어든 결과는 해당 시점·랭킹 페이지·중복 처리 방식에 따라 달라질 수 있다.
- “비건 상품은 리뷰가 거의 없어 수요나 인기도가 낮다”는 해석은 영상 내 샘플 데이터 기준의 분석이므로, 전체 시장 결론으로 단정하려면 더 넓은 카테고리와 기간별 데이터 검증이 필요하다.
- 자막 기반 정리: 타임스탬프가 있는 자막을 기준으로 정리했으며, 고유명사·수치·인용은 원문 확인 필요 시 별도 검증한다.
- 영상 속 주장: 발표자의 해석·전망·비교는 확인된 외부 사실이 아니라 영상 속 주장으로 분리해 읽는다.
- 검증 필요: 수치, 기업 실적, 정책·시장 전망은 발행 전 최신 자료로 별도 검증이 필요하다.
✅ 액션 아이템
- Bright Data 계정에서 현재 Scrapers 요금, 쿠팡 수집 가능 범위, 1,000건당 과금 기준을 다시 확인한다.
- 쿠팡 카테고리 URL 수집용 프롬프트를 재사용 가능하게 정리하고, CSV 헤더가
url형식으로 저장되는지 확인한다. - Bright Data MCP와 Unlocker 설정 시 API 토큰이 설정 파일에 정상 반영되는지 확인하고, 앱 재시작 후 연결 상태를 테스트한다.
- Scrapers에서
Collect by URL방식으로 샘플 URL을 먼저 실행해 상품명·평점·리뷰 수·이미지 링크가 정상 수집되는지 검증한다.
❓ 열린 질문
- 쿠팡의 랭킹순 페이지에서 동일 상품이 반복 노출된 원인은 옵션 상품, 광고 노출, 페이지네이션 중복, 또는 수집 로직 중 어느 쪽에 가까운가요?
- Bright Data Scrapers로 수집 가능한 쿠팡 데이터 항목은 상품명·평점·리뷰 수·이미지 외에 가격, 배송 정보, 판매자, 옵션 정보까지 안정적으로 포함되나요?
- 코워크에서 만든 대시보드와 워드 보고서는 반복 실행 시 동일한 형식으로 재생성할 수 있는 자동화 워크플로로 저장 가능한가요?