본문 바로가기
데이터분석/Matplotlib &Seaborn

seaborn 히스토그램 그리기

by ADELA_J 2023. 7. 6.

더 많은 그래프와 자세한건 https://dev-adela.tistory.com/97

 

<히스토그램>

- 연속형 변수를 확인할 때 사용하는 그래프. 범주형(categorical)데이터를 사용해서  그래프를 그릴경우, 카운트 플롯과 유사한 형태로 그려진다. (범주형 데이터 관련 https://dev-adela.tistory.com/123)

▶  seaborn 으로 히스토그램 그리는 법 :

이렇게 histplot를 사용할수도 있움.(한개 그릴때 편함)

▷ 인자값으로 bins 값을 주어지면 원하는 수만큼 구간이 나눠진다. 

 

▶ subplots, displot 메서드 이용하면 됨

subplots로 기본틀 만들고 distplot 메서드에 total_bill 전달하면 그릴 수 있음.

▶ 첫번째 방식(histplot)으로 distplot 처럼 만들고 싶을때는 kde속성(데이터의 밀도(Kernel Density Estimation)을 표시하면 된다.

 

1 . distplot 메서드를 사용하면 히스토그램 + 밀집도 그래프 같이 사용. 

 > 밀집도 그래프를 제외하고 싶으면 kde  인자값 False로 하면 됨

 > 밀집도만 나타내려면 hist 인자를 False

 >> 밀집도 그래프 : 데이터를 정규화시켜 넓이가 1이 되도록 그린 그래프

▼ distplot 메서드에 rug 를 True 하면 양탄자 그래프까지 그려짐

 >> 양탄자 그래프 : 그래프의 축에 동일한 길이의 직선을 붙여 밀집 정도를 표현한 그래프

▷ 위의 인자로 들어갔던 kde, 데이터 분포를 나타내는 그래프로 kdeplot, rugplot이 있음. 히스토그램은 y축이 빈도(Count)였는데 kdeplot는 밀도(Density)로 표시된다. (그래서 숫자만 된다. day같은 요일은 되지 않음.)

▼ size(인원수)에 대해서 했는데 튀는 부분이 바로 밀도 값.

▶그리고 데이터 분포를 나타내는 또 하나의 그래프 rugplot

주로 10~20에 몰려있음.