AI/Statistics
2021. 9. 19.
[통계] 데이터 전처리 - 여러 가지 feature scaling 방법
아래 포스트를 통해 정규화와 표준화가 무엇인지 살펴보았으니, scikit-learn에서의 feature scaling 방법들을 소개해보려 한다. [통계] 정규화와 표준화, Normalization vs Standardization ML을 공부하는 사람이라면 feature scaling이 얼마나 중요한 지 알것이다. scikit-learn에는 많은 스케일링 메서드들이 모듈화 되어있는데, 기본적으로 정규화와 표준화가 무엇인지 이해해야 과제를 수 heeya-stupidbutstudying.tistory.com mglearn 라이브러리는 랜덤한 데이터셋이나 머신러닝 적용 결과를 보기좋게 표현하기 위한 함수들을 생성해준다. mglearn.plots.plot_scaling을 통해 scikit-learn이 제공하는 ..