[필답형] 데이터 전처리 (2)
중요도 : ★★☆☆☆ 키워드 : 변수 변환, 정규화, 최소-최대 정규화, Z-Score 정규화, 로그변환, 역수변환, 지수변환, 제곱근변환, 언더 샘플링, 오버 샘플링, 한 줄 평 : 키워드 개념 정확히 외우기 07 변수 변환 1) 변수 변환의 개념 데이터를 분석하기 좋은 형태로 바꾸는 작업 2) 변수 변환의 방법 모집단의 분포형태별로 사용가능한 변수 변환 방법이 상이하다. 최종적으로 정규 분포화 형태를 지향하며, 샤피로 테스트 또는 Q-Q Plot을 통해 그래프의 치우침 정도를 확인하고 결과에 따라 적당한 변수 변환식을 사용한다. 범주형 변환 : 연속형 데이터를 범주형 데이터로 변환하여 분석결과의 명료성 및 정확성을 증가 정규화 : 데이터의 스케일이 심하게 차이나는 경우 상대적 특성이 반영된 데이터로 ..