본문 바로가기
데이터분석/Matplotlib &Seaborn

pandas / matplotlib 그래프 그리기(종류)

by ADELA_J 2023. 6. 18.

- seaborn 라이브러리의 tips 데이터 집합 

 > 어떤 식당에서 팁을 지불한 손님의 정보를 모아둔 것

 

1. 히스토그램 : 데이터프레임의 열 데이터 분포와 빈도를 살펴보는 용도로 자주 사용하는 그래프

▲ 위 DF에서 total_bill, tip 등의 열을 변수라고 부르기도 함

▲ 변수 하나만 사용해서 그린 그래프 = 일변량 그래프

▲  x축의 간격은 bins = 인잣값으로 조정 가능 ( 여기서는 x축의 간격을 10으로 하겠다)

 

2. 산점도 그래프 : 변수 2개를 사용해서 만드는 그래프 (이것은 이변량 그래프)

 

3. 박스 그래프 : 이산형 변수와 연속형 변수를 합께 사용하는 그래프

( 이산형 변수 : 남/여 처럼 명확하게 구분되는 값,

  연속형 변수 : Tip과 같이 명확하게 셀 수 없는 범위의 값)

3. 다변량 그래프 : 3개 이상의 변수를 사용한 그래프

 - 위 2. 산점도 그래프에서 성별을 추가해 그릴려면 점의 색상을 다르게 하면됨. 

  >> 만약 식사 비용을 추가한다면 점의 크기를 다르게 하는 방법도 있음.  

       >>>> 이처럼 다양하게 표현할 수 있음(요소를 추가해서)