본문 바로가기

반치용105

[저장]강화 학습 https://github.com/reinforcement-learning-kr/how_to_study_rl/wiki 2019. 12. 27.
[저장]R XGBoost를 이용한 kaggle 도전 https://medium.com/@peteryun/ml-kaggle에-적용해보는-xgboost-f1650342ba93 [ ML ] Kaggle에 적용해보는 XGBoost what is xgboost, how to tune parameters, kaggle tutorial medium.com 데이터, R코드, 전반적인 설명 등이 있음 2019. 12. 27.
[저장]데이터 엔지니어링 쿡북 https://github.com/andkret/Cookbook 2019. 12. 27.
[저장]예제코드(한빛) http://m.hanbit.co.kr//support/supplement_list.html 2019. 12. 26.
[논문 리뷰]Bidirectional association betweengastroesophageal refux diseaseand depression: Two diferentnested case-control studies using anational sample cohort https://www.nature.com/articles/s41598-018-29629-7 불러오는 중입니다... 건강보험관리공단 데이터를 활용한 case-control study 입니다. 랩미팅용으로 준비했던 내용이라 논문 내용에서 제가 관심있는 분야만 발췌했습니다. 2019. 12. 26.
[파이썬 머신러닝] day 003 - pandas 끝 groupby 함수 사용법 데이터 프레임명.groupby(분류를 나눌 열 이름)[연산을 할 열 이름].집계함수() 형태로 사용하는 것을 볼 수 있다. 연산할 열 별 집계내용이 다를 시 agg() 함수 안에 {'열이름':'집계함수명,'열이름':'집계함수명' .... } 형태로 넣으면 열별로 별도의 집계가 가능하다. 처음 파이썬으로 전처리 할 때, pandas를 몰라서 줄 단위로 불러들여서 구분기호로 split하고, 각각을 리스트에 넣어서 연산했었는데... 시간은 정말 많이 잡아먹고 오류는 많고 ㅜㅜ... 이걸 좀 더 일찍 알았으면... 결측값 핸들링(결측값 제거, 수정 등) 데이터프레임.isna() 를 통해 결측값에 대한 행렬을 데이터 프레임 형태로 리턴 가능함 .sum() 을 이용해 각 항목(열)별로 몇.. 2019. 12. 25.