url로부터 html을 가져오기 위한 라이브러리로 urllib, 2, 3 등이 있지만

필자는 requests를 이용할 것이다

request는 urllib3를 기반으로 한 라이브러리로, 가장 짧고쉽게 html을 얻을 수 있다

pip install requests

설치 후, 아래와 같이 사용할 수 있다

import requests


url = 'https://www.naver.com/'

html = requests.get(url).content

얻은 html은 BeautifulSoup 등에서 이용할 수 있다

from bs4 import BeautifulSoup


soup = BeautifulSoup(html, 'html.parser')


'Language > python' 카테고리의 다른 글

[python] converting bytes to ctypes.c_short array  (0) 2017.11.26
[python] beautifulsoup4 example  (0) 2017.11.26
[python] str to bytes  (0) 2017.11.25
[python] json example  (0) 2017.11.25
[python] Windows python3, jupyter 설치하기  (0) 2017.11.25

WRITTEN BY
hojongs
블로그 옮겼습니다 https://hojongs.github.io/