<하나의 열이 여러 의미를 가지고 있을 때>
- 가끔 데이터 열에는 여러가지 의미를 가지고 있을 수 있음
(나는 안그러고싶지만 여러상황들이 그렇게 만들수 있지 암요..........................)
이럴때 데이터 깔끔하게 만들기..🌠
1. 일단 불러온 데이터의 열 이름 확인..!
- Cases_Guinea 처럼 질병_나라이름 이렇게 합쳐져 있기도 함.

2. 그리고 Date랑 Day를 고정시키고 나머지는 다 열 이름이 합쳐져 있으니까 다 피벗해버리자
피벗하는 법 모르겠으면 여기 https://dev-adela.tistory.com/114

3. 그리고 split 함수를 써서 _(밑줄)을 기준으로 글자를 분리해버리기 (자르기)
▼ 좀 더 자세히 적어보자면 데이터프레임.(점연산자)열이름.문자열.자르기('이거기준')

하나의 열을 통째로 추출해서 단어를 잘랐을 때 '리스트'인 데이터값들이 모여있는
'시리즈'가 만들어지는 것을 알 수 있음.

4. 그래서 리스트 안에 있는 단어 2개를 따로따로 변수를 지정해주자
get 메서드를 사용해서 인덱스의 데이터를 한꺼번에 추출

▼그에 대한 결과! 단어가 깔끔하게 잘 분리되어서 각각의 변수에 값들이 잘 저장되었다.

5. 그리고 분리된 문자열을 열 추가를 해준다! 햐 미쳐따

<concat으로 추가해서 연결하기>

>> expand = False가 default 값인데, 이거는 리스트 형으로 1개의 열에만 나오지만
True 로 하면 split 로 나눠서 단어별로 하나하나씩 열 갯수로 들어감.

그래서 concat으로 열을 그냥 합쳐버리면 더 짧게 코드 짜서 열 이름을 나누어서 정리할 수 있다..!
이러면 status / country 별로 따로 통계낼수도 있겠지.

'데이터분석 > Pandas&Numpy' 카테고리의 다른 글
| pandas 중복 데이터 처리하기 합쳐서 처리하기 (0) | 2023.06.29 |
|---|---|
| pandas 여러개 분리된 열을 깔끔하게 데이터 정리 하는 방법 (0) | 2023.06.29 |
| pandas 깔끔한 데이터 만들기 - 열과 피벗 (0) | 2023.06.28 |
| pandas 누락값 처리하기, 변경하기, 삭제하기 (0) | 2023.06.27 |
| pandas 누락값의 개수 구하기 (0) | 2023.06.27 |