2016년 건강검진 데이터를 기반으로 차원축소를 해 보겠습니다.
우선 사용할 라이브러리와 데이터를 불러와주고 간단하게 환경설정을 해 줍니다.
데이터 프레임 설정을 해주고 컬럼명을 한글->영어로 바꿔줍니다.
각각의 변수에 남, 녀를 나누어 주고 X축에는 허리둘레, Y축에 키를 넣어 분포가 어떻게 되는지 시각화 해 줍니다.
허리둘레와 키 값을 정규화 시켜 준 후 PCA의 컴포넌트를1로 설정해 주고 정규화 하여 PCA 변환데이터를 반환해줍니다.
이후 타겟값으로 성별을 추가하여 남자는 파랑, 여자는 오렌지 색으로 분포를 표현해 줍니다.
LDA를 이용해서 차원축소를 해 본 후 PCA와 비교해보겠습니다.
마지막으로 2016년 건강검진데이터의 피처들 간의 상관계수를 시각화 해 보겠습니다.
각 컬럼명을 영문으로 바꿔주고 성별코드 컬럼을 빼 줍니다.
피처간의 상관계수를 시본을 이용하여 시각화 해 줍니다.
해당 포스트는 위키북스의 파이썬 머신러닝 완벽가이드를 참고하여 작성하였습니다.
'반영훈 > Python' 카테고리의 다른 글
파이썬으로 하는 클러스터링 (0) | 2020.08.02 |
---|---|
[ML]파이썬으로 하는 선형회귀 (0) | 2020.08.02 |
[아나콘다] python 버전 변경 하는 법 (2) | 2019.11.01 |
주피터 노트북에서 package 만들고 import 하기. (0) | 2019.09.16 |
[웹 코딩사이트] (0) | 2019.09.09 |
댓글