본문 바로가기
반영훈/Python

네이버 메일제목 크롤링

by Banda 2019. 9. 4.

[28]

기본적인 환경을 세팅해주고

크롬드라이버를 이용하여 로그인 화면으로 가줍니다

(이해 안되는 부분이 있으시다면 이전 포스팅 인스타 크롤링을 먼저 보시거나 댓글로 남겨주세요)

[23]은 완전자동화 하여 사용하실 때 id와 비밀번호를 '' 사이에 미리 입력하여두시면 됩니다.

[37]은 id와 pw를 입력받아서 나중에 로그인 할 때 참조값으로 쓸 때 사용 해 주시면 됩니다.

[18] 원래 send_keys를 이용하려 하였으나 네이버에서 send_keys를 이용할 경우 자동입력 방지 page로 넘어가게 만들어 두어 자동화에 실패하게 됩니다.(1년 전 쯤 패치 한 듯)

[29] 따라서 스크립트를 이용하여 id와 pw를 입력합니다. (주석에 후회가 아니고 우회입니다;; 후회되네요)

크롬 개발자환경에서 ID입력칸을 분석해보면 파라미터 값이 name = "id"로(pw 또한 마찬가지로 "pw"로 설정되어있음) 설정되어있는것을 확인할 수 있습니다.

[30] XPath를 이용하여 로그인버튼을 눌러줍니다.

XPath 값 추출 방법

[31] 라이브러리를 불러온 후

[32] 메일주소로 이동, 해당 페이지의 소스코드를 가져온 후 파싱할 수 있는 형태로 바꿔줍니다.

[33] 개발자 환경에서 확인한 메일제목의 태그,class값을 이용하여 파싱합니다.

[34] 파싱한 메일제목들을 프린트하여 확인해 줍니다.

-끝-

해당 포스팅은 유튜브 동빈나 님의 영상을 참고하였습니다.

댓글