Python 주요 데이터 타입
·
프로그래밍 & 개발 환경/Python
1. 숫자형(Numeric)숫자형 데이터 타입은 수치 계산을 위한 기본적인 타입으로, 여러 종류의 숫자를 표현하고 처리할 수 있다.숫자형은 정수, 실수, 복소수 세 가지 주요 타입읍로 나뉘며, 불리언(Boolean) 타입도 정수의  특수한 형태로 볼 수 있다. 1.1 정수(Int)정수 타입은 소수점이 없는 숫자를 표현한다.Python 3에서 정수는 (가상)메모리가 허용하는 한 무한대의 크기를 가질 수 있다.크기 제한이 없어 매우 큰 수 처리 가능 임의 정밀도 산술(arbitrary-precision arithmetic)임의 정밀도 산술은 숫자의 크기가 미리 정해진 비트 수에 제한되지 안혹, 필요에 따라 동적으로 확장될 수 있는 방식메모리가 허용하는 한 숫자가 얼마나 커지든 정확한 값을 저장하고 계산할 수..
Python - Python Regular Expression Quick Guide
·
프로그래밍 & 개발 환경/Python
출처 : https://www.coursera.org/learn/python-network-data/supplement/2WnqH/python-regular-expression-quick-guide Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, ..
Python - str lib
·
프로그래밍 & 개발 환경/Python
# String Library str.capitalize() # abc -> Abc , ABC -> Abc 첫글자만 대문자로 str.center(width[, fillchar]) # str.endswith(suffix[,start[, end]]) # str.find(sub[, start[, end]]) # 문자열 안에 원하는 조건에 해당하는 글자 찾기. 찾아서 존재한다면 True, 없다면 False 혹은 해당하는 문자의 위치를 찾는데 사용하기도 한다. str.lstrip([chars]) # greet = ' Hello Bob ' 일 경우 lstrip()사용하면 'Hello Bob ' 왼쪽 문자열 공백 제거 str.replace(old, new[, count]) # old = bog, new = jane ..
쇼핑몰 크롤링
·
프로그래밍 & 개발 환경/Python
크롤링 사이트 : https://jolse.com JOLSE Korean Cosmetics Online Beauty Shop jolse.com 대상 페이지 선정 메뉴 : SKINCARE -> Moisturizer ->Toners & Mists https://jolse.com/category/toners-mists/1019/ SKINCARE - Toners & Mists Toners & Mists jolse.com 제품 이름 찾기 더보기 import urllib.request import bs4 url = "https://jolse.com/category/toners-mists/1019/" html = urllib.request.urlopen(url) bs_obj = bs4.BeautifulSoup(htm..
Python 크롤링
·
프로그래밍 & 개발 환경/Python
크롤링(crwaling) : 인터넷에서 데이터를 수집하여 받아오는 것 크롤러 : 크롤링을 하는 프로그램 파싱(parsing) : 데이터에서 필요한 내용만 추출하는 것 urllib 패키지 인터넷에서 데이터를 받아 오늘 기능들이 들어 있다. BeautifulSoup 모듈 데이터를 추출(파싱)하는데 필요한 기능들이 들어 있다. 크롤링 시작 전 반드시 해당 사이트 url/robots.txt를 확인할 것 robots.txt : 인터넷에서 데이터를 수집하여 받아오는 것 robots.txt에서 반드시 확인할 3가지 User-agent : 다음 규칙이 적용되는 로봇의 이름 Disallow : 차단할 URL 경로 Allow : 차단 된 상위 디렉토리의 하위 디렉토리에 있는 URL경로이며 차단 해제 할 디렉토리 네이버의 ..
Python XML, JSON
·
프로그래밍 & 개발 환경/Python
XML이란 - XML(eXensible Markup Language)은 확장적인 마크업 언어라는 뜻으로, 데이터의 구조와 의미를 설명하는 태그를 사용하여 어떤 데이터의 속성과 값을 표현하는 언어다. 즉, 시작 태그와 종료 태그 사이에 어떤 값이 있고, 그 값은 태그의 이름으로 만들어진 속성에 대한 값이 된다. XML의 구조 더보기 홍길동 11111111 22 컴퓨터공학 남성 XML 문서 - XML로 정보를 표현할 때 가장 기본적인 방법은 트리 형태로 표현하는 것이다. 이는 HTML과 완전히 같으며 모든 태그 기반의 언어가 지닌 공통적인 특징이다. 간단한 딕셔너리로 표현 더보기 {books:[{book:{author:carson,price:31.95,pubdate:05/01/2001}]}}] JSON의 개..