- seaborn 라이브러리의 tips 데이터 집합
> 어떤 식당에서 팁을 지불한 손님의 정보를 모아둔 것
1. 히스토그램 : 데이터프레임의 열 데이터 분포와 빈도를 살펴보는 용도로 자주 사용하는 그래프
▲ 위 DF에서 total_bill, tip 등의 열을 변수라고 부르기도 함
▲ 변수 하나만 사용해서 그린 그래프 = 일변량 그래프
▲ x축의 간격은 bins = 인잣값으로 조정 가능 ( 여기서는 x축의 간격을 10으로 하겠다)
2. 산점도 그래프 : 변수 2개를 사용해서 만드는 그래프 (이것은 이변량 그래프)
3. 박스 그래프 : 이산형 변수와 연속형 변수를 합께 사용하는 그래프
( 이산형 변수 : 남/여 처럼 명확하게 구분되는 값,
연속형 변수 : Tip과 같이 명확하게 셀 수 없는 범위의 값)
3. 다변량 그래프 : 3개 이상의 변수를 사용한 그래프
- 위 2. 산점도 그래프에서 성별을 추가해 그릴려면 점의 색상을 다르게 하면됨.
>> 만약 식사 비용을 추가한다면 점의 크기를 다르게 하는 방법도 있음.
>>>> 이처럼 다양하게 표현할 수 있음(요소를 추가해서)
'데이터분석 > Matplotlib &Seaborn' 카테고리의 다른 글
matplotlib 그래프 그리기 디테일한 부분 모음모음 (0) | 2023.07.03 |
---|---|
matplotlib 그래프 그리기 이것저것 추가 내용 (0) | 2023.06.30 |
seaborn으로 다변량 그래프 그리기 (0) | 2023.06.19 |
seaborn 활용해 그래프 그리기 (0) | 2023.06.19 |
pandas/matplotlib/seaborn 앤스콤 4분할 그래프 (0) | 2023.06.18 |