본문 바로가기
데이터분석/Pandas&Numpy

pandas 열 이름 관리 - 여러의미를 가지고 있는 하나의 열

by ADELA_J 2023. 6. 29.

<하나의 열이 여러 의미를 가지고 있을 때>

- 가끔 데이터 열에는 여러가지 의미를 가지고 있을 수 있음

(나는 안그러고싶지만 여러상황들이 그렇게 만들수 있지 암요..........................)

 

이럴때 데이터 깔끔하게 만들기..🌠

 

1. 일단 불러온 데이터의 열 이름 확인..!

 - Cases_Guinea 처럼 질병_나라이름 이렇게 합쳐져 있기도 함.

2. 그리고 Date랑 Day를 고정시키고 나머지는 다 열 이름이 합쳐져 있으니까 다 피벗해버리자

 피벗하는 법 모르겠으면 여기 https://dev-adela.tistory.com/114

3. 그리고 split 함수를 써서 _(밑줄)을 기준으로 글자를 분리해버리기 (자르기)

 ▼ 좀 더 자세히 적어보자면 데이터프레임.(점연산자)열이름.문자열.자르기('이거기준')

하나의 열을 통째로 추출해서 단어를 잘랐을 때 '리스트'인 데이터값들이 모여있는

'시리즈'가 만들어지는 것을 알 수 있음.

4. 그래서 리스트 안에 있는 단어 2개를 따로따로 변수를 지정해주자

get 메서드를 사용해서 인덱스의 데이터를 한꺼번에 추출

▼그에 대한 결과! 단어가 깔끔하게 잘 분리되어서 각각의 변수에 값들이 잘 저장되었다.

5. 그리고 분리된 문자열을 열 추가를 해준다! 햐 미쳐따

<concat으로 추가해서 연결하기>

>> expand = False가 default 값인데, 이거는 리스트 형으로 1개의 열에만 나오지만 

True 로 하면 split 로 나눠서 단어별로 하나하나씩 열 갯수로 들어감.

그래서 concat으로 열을 그냥 합쳐버리면 더 짧게 코드 짜서 열 이름을 나누어서 정리할 수 있다..!

이러면 status / country 별로 따로 통계낼수도 있겠지.