[필답형] 데이터 전처리 (1)
중요도 : ★★☆☆☆ 키워드 : 명목·서열·구간·비율자료, 데이터 정제, 결측치, 대치, 이상치, 전진 선택법, 후진 소거법, 단계적 선택법, 차원의 저주, 과적합, 요인 분석, 주성분 분석, SVD, NMF, 요약변수, 파생변수 한 줄 평 : 키워드 개념 정확히 외우기 01 데이터에 내재된 변수의 이해 1) 데이터 관련 용어 데이터, 단위, 관측값, 변수, 원자료 2) 데이터의 종류 구분 설명 단변량 자료 자료의 특성을 대표하는 특성 변수가 1개 다변량 자료 특성 변수가 2개 이상 질적자료(범주형) 명목자료 : 측정 대상이 범주나 종류에 구분 되어지는 것을 수치 또는 기호로 분류 ex)지역번호 02 서열자료 : 수치나 기호가 서열을 나타내는 자료 ex) 마라톤 1등 수치자료(연속형) 구간자료 : 명목,..