본문 바로가기
반영훈/Python

파이썬으로 하는 차원축소

by Banda 2020. 8. 2.

2016년 건강검진 데이터를 기반으로 차원축소를 해 보겠습니다.

우선 사용할 라이브러리와 데이터를 불러와주고 간단하게 환경설정을 해 줍니다.

데이터 프레임 설정을 해주고 컬럼명을 한글->영어로 바꿔줍니다.

각각의 변수에 남, 녀를 나누어 주고 X축에는 허리둘레, Y축에 키를 넣어 분포가 어떻게 되는지 시각화 해 줍니다.

 

허리둘레와 키 값을 정규화 시켜 준 후 PCA의 컴포넌트를1로 설정해 주고 정규화 하여 PCA 변환데이터를 반환해줍니다.

이후 타겟값으로 성별을 추가하여 남자는 파랑, 여자는 오렌지 색으로 분포를 표현해 줍니다.

 

 

LDA를 이용해서 차원축소를 해 본 후  PCA와 비교해보겠습니다.

 

마지막으로 2016년 건강검진데이터의 피처들 간의 상관계수를 시각화 해 보겠습니다.

각 컬럼명을 영문으로 바꿔주고 성별코드 컬럼을 빼 줍니다.

피처간의 상관계수를 시본을 이용하여 시각화 해 줍니다.

 

 

해당 포스트는 위키북스의 파이썬 머신러닝 완벽가이드를 참고하여 작성하였습니다.

댓글