XML이란 - XML(eXensible Markup Language)은 확장적인 마크업 언어라는 뜻으로, 데이터의 구조와 의미를 설명하는 태그를 사용하여 어떤 데이터의 속성과 값을 표현하는 언어다. 즉, 시작 태그와 종료 태그 사이에 어떤 값이 있고, 그 값은 태그의 이름으로 만들어진 속성에 대한 값이 된다. XML의 구조 더보기 홍길동 11111111 22 컴퓨터공학 남성 XML 문서 - XML로 정보를 표현할 때 가장 기본적인 방법은 트리 형태로 표현하는 것이다. 이는 HTML과 완전히 같으며 모든 태그 기반의 언어가 지닌 공통적인 특징이다. 간단한 딕셔너리로 표현 더보기 {books:[{book:{author:carson,price:31.95,pubdate:05/01/2001}]}}] JSON의 개..
IT
BeautifulSoup 모듈 개요 - BeautifulSoup 모듈은 일종의 래퍼(wrapper)로, 기존 파싱 기능이 있는 다른 라이브러리를 쉽게 사용할 수 있도록 한다. 전통적인 파이썬 XML 파서(XML parser)에는 lxml과 html5lib 등이 있으며, BeautifulSoup 모듈은 이를 차용하여 데이터를 쉽고 빠르게 처리한다. BeautifulSoup 설치 - anaconda 설치 시 PATH 설정을 클릭했다면 cmd 창에서 명령어를 입력해도 가능하다. 하지만 PATH 설정을 클릭하지 않았다면 anaconda prompt 창에서 명령어를 입력해야 한다. 명령어 더보기 conda create -n python_mooc python=3.7 conda install lxml conda in..
웹의 개념 월드 와이드 웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 이용하여 사람들과 정보를 공유할 수 있도록 거미줄처럼 엮인 공간이다. 월드 와이드 웹을 줄여 웹(web)이라고 한다. 웹 컴포넌트 : HTML과 HTTP HTML HTML(Hyper Text Markup Language)은 웹상의 정보를 구조적으로 표현하기 위한 언어다. 태그(tag)는 꺾쇠 괄호 로 둘러싸여 있고, 그 안에 정보에 대한 의미를 적는다. 그리고 그 의미가 끝나는 부분에 슬래시(/)를 사용하여 해당 태그를 종료한다. 더보기 # 예시 Hello, World # 제목 요소, 값은 Hello, World HTTP HTTP(Hypertext Transaction Protocol)는 인터넷에서 컴퓨터 간에 정보를..
CSV(Comma Separate Values)는 콤마(,)를 기준으로 나누어진 값이고 이해하면 된다. csv 파일은 어디서나 사용할 수 있도록 텍스트 데이터를 사용한다. 위의 데이터를 보면, 제일 상단에 필드(filed), 헤더(header) 또는 열 이름(column name)이라고 부르는 텍스트 데이터가 입력되었다. 각 데이터는 콤마로 나누어진다. 두 번째 줄부터는 각 필드의 실제 데이터가 있는데, 각 행위 데이터가 인슴턴스라고 이해하면 된다. 이러한 데이터를 행(row), 튜플(tuple), 인스턴스(instance)등으로 부른다. 데이터의 분류는 분류 기준이 되는 문자에 따라 TSV(Tab SeparateValues), SSV(Single-blank Separate Values) 등으로 구분한다..
파일의 개념 파일(file)은 컴퓨터를 실행할 때 가장 기본이 되는 단위다. 아이콘을 클릭하여 프로그램을 실행하는 것이 아니라, 실제로는 아이콘과 연결된 파일이 실행되는 구조다. 아이콘에서 마우스 오른쪽 버튼을 클릭하고, 속성을 선택하면 다음과 같은 화면을 볼 수 있다. 컴퓨터에서 파리의 종류는 다양하지만, 기본적으로 바이너리 파일(binary file)과 텍스트 파일(text file), 두 가지로 분류할 수 있다. 파이썬에서는 텍스트 파일을 다루기 위해 open() 함수를 사용한다. 더보기 # 형식 f = open("파일명", "파일 열기 모드") f.close() 파일 읽기 더보기 f = open("test.txt", "r", encoding ="utf-8") # test.txt 파일을 읽기 모드로..
딕셔너리(dictionary) : 전화번호부와 같이 키(key)와 값(value) 형태로 데이터를 저장하는 자료구조다. 파이썬에서 딕셔너리의 선언은 중괄호 {}를 사용하여 키와 값의 쌍으로 구성하면 된다. 형식 : 딕셔너리 변수 = {키1 : 값1, 키2 : 값2, 키:3 : 값3, ...} 더보기 student_info = {20140012:'Janhyeok', 20140059 : 'Jiyong', 20150234: 'JaeHong', 20140058 : 'Wonchul'} print(student_info) 해당 변수에서 특정 값을 호출하는 방법 해당 값의 키를 대괄호 []안에 넣어 호출할 수 있다. 변수의 자료형을 정확히 모르고 호출한다면, 리스트로 오해한다. 더보기 student_info = {2..