데이터전처리1 [ Machine Learning ] 데이터 전처리 강의 내용 정리 데이터 전처리 주요 기법 1. 데이터 실수화 ( Data Vectorization ) : 범주형 자료. 텍스트 자료, 이미지 자료 등을 실수로 구성된 타입으로 변환 EX 1 > One-hot encoding을 이용한 범주형 자료 실수화 : DictVectorizer(sparse) *Default -> sparse = True * 희소행렬 ( Sparse Matrix ) - 불필요한 0값으로 인해 메모리 낭비가 심함, 연산 시 시간 소요 ↑ - 해결 방법 : COO표현식, CSR표현식 ( 참고 : bkshin.tistory.com/entry/NLP-7-%ED%9D%AC%EC%86%8C-%ED%96%89%EB%A0%AC-Sparse-Matrix-COO-%ED%98%95%EC%8B%9D-CSR-%ED%98%9.. 2021. 1. 18. 이전 1 다음