본문 바로가기
Programming/Errors

[Python] BeautifulSoup을 이용한 크롤링에서 한글 깨짐 해결

by Brian Go 2022. 6. 17.

간단하게 인코딩이 안되기 때문인데, Soup 객체의 인자로 from_encoding 옵션을 utf-8로 주면 된다.

soup = BeautifulSoup(res.content, 'html.parser', from_encoding='utf-8')

requests.get()의 반환값을 res라 할 때, res.content와 res.text 두 가지가 있는데 text는 유니코드로, Content는 바이트로 결과를 반환한다고 한다.

주피터 노트북에서 실행 중인데, text로 받으면 자꾸 깨져서 content로 바꾸니 정상 작동.

 

댓글