Python BeautifulSoup 설치 및 개요
·
프로그래밍 & 개발 환경/Python
BeautifulSoup 모듈 개요 - BeautifulSoup 모듈은 일종의 래퍼(wrapper)로, 기존 파싱 기능이 있는 다른 라이브러리를 쉽게 사용할 수 있도록 한다. 전통적인 파이썬 XML 파서(XML parser)에는 lxml과 html5lib 등이 있으며, BeautifulSoup 모듈은 이를 차용하여 데이터를 쉽고 빠르게 처리한다. BeautifulSoup 설치 - anaconda 설치 시 PATH 설정을 클릭했다면 cmd 창에서 명령어를 입력해도 가능하다. 하지만 PATH 설정을 클릭하지 않았다면 anaconda prompt 창에서 명령어를 입력해야 한다. 명령어 더보기 conda create -n python_mooc python=3.7 conda install lxml conda in..
Python 웹 컴포넌트
·
프로그래밍 & 개발 환경/Python
웹의 개념 월드 와이드 웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 이용하여 사람들과 정보를 공유할 수 있도록 거미줄처럼 엮인 공간이다. 월드 와이드 웹을 줄여 웹(web)이라고 한다. 웹 컴포넌트 : HTML과 HTTP HTML HTML(Hyper Text Markup Language)은 웹상의 정보를 구조적으로 표현하기 위한 언어다. 태그(tag)는 꺾쇠 괄호 로 둘러싸여 있고, 그 안에 정보에 대한 의미를 적는다. 그리고 그 의미가 끝나는 부분에 슬래시(/)를 사용하여 해당 태그를 종료한다. 더보기 # 예시 Hello, World # 제목 요소, 값은 Hello, World HTTP HTTP(Hypertext Transaction Protocol)는 인터넷에서 컴퓨터 간에 정보를..
Python CSV
·
프로그래밍 & 개발 환경/Python
CSV(Comma Separate Values)는 콤마(,)를 기준으로 나누어진 값이고 이해하면 된다. csv 파일은 어디서나 사용할 수 있도록 텍스트 데이터를 사용한다. 위의 데이터를 보면, 제일 상단에 필드(filed), 헤더(header) 또는 열 이름(column name)이라고 부르는 텍스트 데이터가 입력되었다. 각 데이터는 콤마로 나누어진다. 두 번째 줄부터는 각 필드의 실제 데이터가 있는데, 각 행위 데이터가 인슴턴스라고 이해하면 된다. 이러한 데이터를 행(row), 튜플(tuple), 인스턴스(instance)등으로 부른다. 데이터의 분류는 분류 기준이 되는 문자에 따라 TSV(Tab SeparateValues), SSV(Single-blank Separate Values) 등으로 구분한다..
Python 파일 다루기
·
프로그래밍 & 개발 환경/Python
파일의 개념 파일(file)은 컴퓨터를 실행할 때 가장 기본이 되는 단위다. 아이콘을 클릭하여 프로그램을 실행하는 것이 아니라, 실제로는 아이콘과 연결된 파일이 실행되는 구조다. 아이콘에서 마우스 오른쪽 버튼을 클릭하고, 속성을 선택하면 다음과 같은 화면을 볼 수 있다. 컴퓨터에서 파리의 종류는 다양하지만, 기본적으로 바이너리 파일(binary file)과 텍스트 파일(text file), 두 가지로 분류할 수 있다. 파이썬에서는 텍스트 파일을 다루기 위해 open() 함수를 사용한다. 더보기 # 형식 f = open("파일명", "파일 열기 모드") f.close() 파일 읽기 더보기 f = open("test.txt", "r", encoding ="utf-8") # test.txt 파일을 읽기 모드로..
Python 딕셔너리
·
프로그래밍 & 개발 환경/Python
딕셔너리(dictionary) : 전화번호부와 같이 키(key)와 값(value) 형태로 데이터를 저장하는 자료구조다. 파이썬에서 딕셔너리의 선언은 중괄호 {}를 사용하여 키와 값의 쌍으로 구성하면 된다. 형식 : 딕셔너리 변수 = {키1 : 값1, 키2 : 값2, 키:3 : 값3, ...} 더보기 student_info = {20140012:'Janhyeok', 20140059 : 'Jiyong', 20150234: 'JaeHong', 20140058 : 'Wonchul'} print(student_info) 해당 변수에서 특정 값을 호출하는 방법 해당 값의 키를 대괄호 []안에 넣어 호출할 수 있다. 변수의 자료형을 정확히 모르고 호출한다면, 리스트로 오해한다. 더보기 student_info = {2..
Python 튜플
·
프로그래밍 & 개발 환경/Python
튜플(tuple)은 리스트와 같은 개념이지만, 데이터를 변경할 수 없는 자료구조다. 더보기 t = (1,2,3) # 튜플의 선언은 () , 리스트는 대괄호[] print(t+t, t*2) print(len(t)) 리스트에서 사용하는 연산, 인덱싱, 슬라이싱이 모두 동일하게 적용된다. 위의 코드처럼 튜플 간의 덧셈, 곱셈, len()과 같은 리스트형 데이터에 사용하는 함수 모두 사용가능 ** 튜플과 리스트이 유일하면서도 큰 차이점이 있다면, 튜플의 값은 마음대로 변경할 수 없다는 것이다. 만약 튜플의 값을 변경하고 싶다면 다음과 같은 오류가 발생한다. 더보기 t[1] = 5 튜플은 언제 사용하는가? - 프로그래밍을 하다 보면 자신이 하나의 함수만 만들고, 다른 사람이 그 함수의 결과값을 사용해야 하는 경우..