본문 바로가기
Python/개념익히기

시계열 데이터로 다양한 사례 다뤄보기

by ADELA_J 2023. 7. 18.

<에볼라 최초 발병일 계산하기>

 

ebola 데이터를 보면 행과 열을 5개씩 불러보면 시간이 역순으로 정렬되어 있음.

▶ 에볼라가 발생하기 시작한 날을 알기 위해 min 메서드를 사용하여 찾을 수 있음

▶ Date열에서 최초 발병일을 빼서 진행 정도를 새로운 열로 추가 할 수 있다.

 

<파산한 은행의 개수 계산하기>

▼ 이 데이터로 해볼거임.

▶ 보면 Closing Date와 Updated Date가 시계열 데이터로 보이지만 확인해보면 object, 문자열이다....속지말자 ㅎ

▶ 그래서 read_csv 메서드의 parse_dates 속성을 이용해 datetime 으로 변환해준다.

https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html#pandas.read_csv

▶ dt접근자와 quarter속성을 사용해서 파산한 분기와 연도를 새로운 열로 추가한다.

https://pandas.pydata.org/docs/reference/api/pandas.Series.dt.quarter.html?highlight=dt%20quarter#pandas.Series.dt.quarter 

▶ groupby 를 사용해서 몇년도에 몇개가 닫았는지 묶어보았다.

▶ 연도별, 분기별로 파산한 은행의 개수도 알아보자, 연도별로 묶고 분기별로 또 그룹화했다.

▶그걸 그래프로 그려보기..!