scrapy: Web Crawling Framework
beautifulsoup과 비교해보자면, beautifulsoup은 parseing library인 반면
scrapy는 더 강한 abstraction을 제공하는 framework이다
scrapy.Request(url=URL, callback=self.parse, method=METHOD, body=BODY, meta=META)
기본적인 사용방법은 위와 같은데 body에 form-data를 전송할 경우
FormRequest를 사용해야한다.
scrapy.FormRequest(..., formdata=FORM_DATA, ...)
request의 body(data)는 form-data, json, wav 등 여러가지 타입이 될 수 있다
request는 이 타입을 header 중 Content-Type field에 명시해야한다
scrapy에서는 FormRequest 클래스를 통해 이러한 수고를 덜어준다
Request 클래스는 Content-Type 헤더가 명시되어 있지 않으므로, server에서 body data를 form-data 타입으로 인식하지 못한다
'Language > python' 카테고리의 다른 글
[python] win32api ImportError (0) | 2018.03.26 |
---|---|
[python] windows pip Twisted install error (0) | 2018.03.23 |
python scrapy 한글 인코딩 (0) | 2018.03.16 |
[python] multiprocessing (0) | 2018.01.15 |
[Language] [IDE] PyCharm Run Path (Working Directory) (0) | 2018.01.05 |
WRITTEN BY
- hojongs
블로그 옮겼습니다 https://hojongs.github.io/