본문 바로가기
데이터분석/Pandas&Numpy

pandas 특수한 자료형 - 카테고리

by ADELA_J 2023. 7. 3.

판다스에 있는 특수한 자료형 - 카테고리

유한한 범위의 값만을 가질 수 있음. 

만약 10종류의 과일 이름을 저장한 열이 있다면 카테고리 자료형을 사용하는 것이

용량과 속도 면에서 더 효율적

주로 동일한 문자열이 반복되어 데이터를 구성하는 경우에 사용.

 

1. tips['sex'] 에는 남, 여만 있으니까 동일한 문자열이 반복되기 때문에 이걸로 확인

 -- > str으로 바꿔줬을 때 메모리 사용량은 8.9+KB임.

-->> category로 바꿔줬을때는 메모라 사용량이 7.4KB 임. 

>> 메모리사용량이 줄어든 것을 확인할 수 있음.

데이터가 많아진다면 더 눈에 띄게 줄어들겠지..!