본문 바로가기

파이썬17

[파이썬 머신러닝] day 003 - pandas 끝 groupby 함수 사용법 데이터 프레임명.groupby(분류를 나눌 열 이름)[연산을 할 열 이름].집계함수() 형태로 사용하는 것을 볼 수 있다. 연산할 열 별 집계내용이 다를 시 agg() 함수 안에 {'열이름':'집계함수명,'열이름':'집계함수명' .... } 형태로 넣으면 열별로 별도의 집계가 가능하다. 처음 파이썬으로 전처리 할 때, pandas를 몰라서 줄 단위로 불러들여서 구분기호로 split하고, 각각을 리스트에 넣어서 연산했었는데... 시간은 정말 많이 잡아먹고 오류는 많고 ㅜㅜ... 이걸 좀 더 일찍 알았으면... 결측값 핸들링(결측값 제거, 수정 등) 데이터프레임.isna() 를 통해 결측값에 대한 행렬을 데이터 프레임 형태로 리턴 가능함 .sum() 을 이용해 각 항목(열)별로 몇.. 2019. 12. 25.
[아나콘다] python 버전 변경 하는 법 아나콘다 설치 후 cmd(윈도우키->실행->cmd)에서 conda search python 을 입력후 엔터 -> 사용 가능한 버전리스트가 나온다. conda install python=3.5.6 을 입력하면 해당 버전으로 기본 파이썬버전이 변경된다. conda create -n py35 python=3.5.6 anaconda 를 입력하여 환경을 추가하는 방법도 있다. 해당 방법은 사용 시 activate py35 를 입력 #위에서 만든 환경 이름 사용 종료시 deactivate py35 를 입력할 시 기본 환경으로 빠져나옴. p.s버전 변경이 잘 안되는분들을 위한 아나콘다 버전별 아카이브주소 https://repo.continuum.io/archive/index.html Anaconda3-4.2.0-Wi.. 2019. 11. 1.
네이버 메일제목 크롤링 [28] 기본적인 환경을 세팅해주고 크롬드라이버를 이용하여 로그인 화면으로 가줍니다 (이해 안되는 부분이 있으시다면 이전 포스팅 인스타 크롤링을 먼저 보시거나 댓글로 남겨주세요) [23]은 완전자동화 하여 사용하실 때 id와 비밀번호를 '' 사이에 미리 입력하여두시면 됩니다. [37]은 id와 pw를 입력받아서 나중에 로그인 할 때 참조값으로 쓸 때 사용 해 주시면 됩니다. [18] 원래 send_keys를 이용하려 하였으나 네이버에서 send_keys를 이용할 경우 자동입력 방지 page로 넘어가게 만들어 두어 자동화에 실패하게 됩니다.(1년 전 쯤 패치 한 듯) [29] 따라서 스크립트를 이용하여 id와 pw를 입력합니다. (주석에 후회가 아니고 우회입니다;; 후회되네요) [30] XPath를 이용하.. 2019. 9. 4.
파이썬으로 인스타 이미지 크롤링하기 크롬드라이버 다운 chrome://version/ 위 주소로 들어가 자신의 크롬버전을 확인 후 https://chromedriver.chromium.org/downloads 이 주소로 들어가 자신의 크롬버전에 맞는 크롬드라이버를 설치 작업할 폴더에 다운하여 압축해제 하고, img 폴더를 미리 만들어 줍니다. 사용할 라이브러리(패키지)를 불러와줍니다. 인스타그램에 로그인 한 후 태그검색 하여 해당 url을 복사후 붙여넣기 합니다 크롬 개발자 도구(Ctrl + Shift + I)를 눌러 엘리멘트에 들어가 html 구조를 분석하여 이미지한개짜리의 클래스명을 추출해줍니다. 아래와 같이 변수명을 설정해준 후 insta = soup.select('.Nnq7c.weEfm') 괄호안에 넣어 이미지클래스를 선택하여 ht.. 2019. 9. 3.
[sololearn]틀린 문제 - if문 이유: 파이썬은 첫번째 조건( if num >3:) 이 TRUE, 두번째 조건(if num 2019. 7. 12.