쇼핑몰 크롤링

2020. 7. 8. 17:21·프로그래밍 & 개발 환경/Python
728x90

크롤링 사이트 : https://jolse.com 

 

JOLSE

Korean Cosmetics Online Beauty Shop

jolse.com

robots.txt

대상 페이지 선정

메뉴 : SKINCARE -> Moisturizer ->Toners & Mists

https://jolse.com/category/toners-mists/1019/

 

SKINCARE - Toners & Mists

Toners & Mists

jolse.com

제품 이름 찾기

더보기
import urllib.request
import bs4
url = "https://jolse.com/category/toners-mists/1019/"
html = urllib.request.urlopen(url)
bs_obj = bs4.BeautifulSoup(html, "html.parser")
ul = bs_obj.find("ul",{"class":"prdList grid4"})
description = ul.findAll("div",{"class":"description"})
for name in description:
    p_name = name.find("p",{"class":"name"})
    product_name = p_name.find("span")
    print(product_name)

[그림1] 제품 이름 찾기 예제 출력

span 제거하고 깔끔하게 출력

더보기
import urllib.request
import bs4
url = "https://jolse.com/category/toners-mists/1019/"
html = urllib.request.urlopen(url)
bs_obj = bs4.BeautifulSoup(html, "html.parser")
ul = bs_obj.find("ul",{"class":"prdList grid4"})
description = ul.findAll("div",{"class":"description"})
for name in description:
    p_name = name.findAll("span")
    print("{}".format(p_name[0].text))

[그림2] 제품 이름 찾기 span 제거 예제 출력

제품명, 정가, 세일가 찾기

더보기
# 쇼핑몰 삼품, 가격, 할인가격 찾기
# 쇼핑몰 상품 찾기
import urllib.request
import bs4
url = "https://jolse.com/category/toners-mists/1019/"
html = urllib.request.urlopen(url)
bs_obj = bs4.BeautifulSoup(html, "html.parser")
ul = bs_obj.find("ul",{"class":"prdList grid4"})
description = ul.findAll("div",{"class":"description"})
for name in description:
    p_name = name.findAll("span")
    if len(p_name) == 6:
        print("세일이 있는 상품 : {},{},{}".format(p_name[0].text,p_name[2].text,p_name[5].text))
    else:
        print("세일이 없는 상품 : {},{}".format(p_name[0].text, p_name[2].text))

[그림3] 제품명, 정가, 세일가격 찾는 예제 출력

728x90
저작자표시 비영리 변경금지 (새창열림)
'프로그래밍 & 개발 환경/Python' 카테고리의 다른 글
  • Python - Python Regular Expression Quick Guide
  • Python - str lib
  • Python 크롤링
  • Python XML, JSON
포장빵
포장빵
IT공부 및 프로그래밍
  • 포장빵
    포장빵의 IT
    포장빵
  • 전체
    오늘
    어제
    • AI 학습 노트 (113)
      • 기초 수학 (4)
        • 선형대수 (0)
        • 확률통계 (4)
        • 미적분 (0)
        • 최적화 이론 (0)
      • AI & 딥러닝 (1)
        • 이론 (0)
        • 컴퓨터 비전 (0)
        • 자연어 처리 (0)
        • 생성AI (0)
        • 강화학습 (0)
      • 데이터과학 (70)
        • R (47)
        • ADSP (21)
      • 연구 & 자료 (15)
        • 논문 (6)
        • 수료증 (3)
      • 프로그래밍 & 개발 환경 (22)
        • Python (22)
        • 개발도구 (0)
        • 알고리즘 (0)
      • 면접 자료 (1)
  • 블로그 메뉴

    • 링크

    • 공지사항

    • 인기 글

    • 태그

      Python 크롤링 기초
      stylegan2
      R 도수분포표
      R 원 그래프 퍼센트
      지수분포
      시퀀스형
      자료의 종류
      CV
      확률
      yolov10
      통계량에 의한 자료 분석
      단순선형 회귀분석
      상관분석
      시계열 모형
      논문
      매핑형(딕셔너리)
      str lib
      Coursera 1
      R 원 그래프
      확률 분포
      python 주요 데이터 타입
      주성분 분석(PCA)
      k-means clustering
      yolov9
      Python Regular Expression Quick Guide
      none타입
      베르누이분포
      다차원 척보법
      Coursera Python Data Structures
      k-평균 군집
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.3
    포장빵
    쇼핑몰 크롤링
    상단으로

    티스토리툴바