Binning : 연속형 변수를 범주형 변수로 만들기 - 그룹짓기
cut - 길이 기준으로 구간 나누기
qcut - 개수 기준으로 구간 나누기 (원하는 개수 입력)
Scaling : 숫자 데이터간의 상대적인 크기 차이를 제거하기( 대표적 예시로 정규화)
- StandardScaler: 평균을 0, 표준편차를 1로 맞추어 정규화.
- RobustScaler: 중앙값과 IQR을 사용하여 이상치의 영향을 줄임.
- MinMaxScaler: 모든 특성 값을 [0, 1] 사이로 조정.
- MaxAbsScaler: 특성 값을 [-1, 1] 사이로 조정, 특히 음수값이 없는 경우 유용.
Label Encoding : 범주형 변수의 문자열 값을 숫자로 매핑
컴퓨터는 문자열 이해를 못하기에 그에 상응하는 숫자로 전달해줘야한다.
One Hot Encoding : 하나의 데이터만 1, 나머지는 0으로 만들어주는 방법
날짜 데이터 변
'코딩 > Python' 카테고리의 다른 글
[KT AICE] 데이터 전처리 - 결측치처리 (0) | 2024.08.29 |
---|---|
[KT AICE] Pandas 기초 - Dataframe 병합하기 (0) | 2024.08.22 |
[KT AICE] Pandas 활용 - Dataframe 변형하기 (0) | 2024.08.18 |
[KT AICE] Pandas 기초 - Dataframe 살펴보기 (0) | 2024.08.14 |
[파이썬 웹크롤링] beautiful soup를 이용한 웹크롤링 후 간단한 게임 만들기 (0) | 2024.01.08 |