판다스에 있는 특수한 자료형 - 카테고리
유한한 범위의 값만을 가질 수 있음.
만약 10종류의 과일 이름을 저장한 열이 있다면 카테고리 자료형을 사용하는 것이
용량과 속도 면에서 더 효율적
주로 동일한 문자열이 반복되어 데이터를 구성하는 경우에 사용.
1. tips['sex'] 에는 남, 여만 있으니까 동일한 문자열이 반복되기 때문에 이걸로 확인
-- > str으로 바꿔줬을 때 메모리 사용량은 8.9+KB임.
-->> category로 바꿔줬을때는 메모라 사용량이 7.4KB 임.
>> 메모리사용량이 줄어든 것을 확인할 수 있음.
데이터가 많아진다면 더 눈에 띄게 줄어들겠지..!
'데이터분석 > Pandas&Numpy' 카테고리의 다른 글
pandas apply 메서드 사용해보기 (0) | 2023.07.05 |
---|---|
Numpy tolist 메서드 (0) | 2023.07.04 |
pandas 잘못 입력한 데이터 처리하기 (0) | 2023.07.03 |
pandas 자료형 astype()를 사용해 자유자재로 변환하기 (0) | 2023.07.03 |
pandas 중복 데이터 처리하기 합쳐서 처리하기 (0) | 2023.06.29 |