데이터 분석을 시작하는 첫번째
<데이터 탐색>
1. 기본정보 확인하기 .info()
2. 함수를 사용해 기술 통계하기
- 하기전에 컬럼이름에서 공백문자를 _ 로 바꿔주는 작업
* method chaining(메소드 체이닝) wine.columns.str 처럼 점연산자로 연결해주는거
▶ 전체적인 데이터의 특징/균형을 보기위해 보는 것.
이런저런 자세한 설명 https://dev-adela.tistory.com/139
▶ .unique() 메서드를 사용하면 quality의 값들이 뭐뭐 있는지, quality 속성값 중 유일한 값을 출력
▶ .value_counts() 메서드를 사용하면 quality의 unique한 값들이 몇개씩 있는지 알려줌
▷ 6등급은 2836개로 제일 많고 9등급은 5개로 제일 적다.
unstack('type')을 지우면 red와 white가 카테고리가 됨.(행의 카테고리)
'머신러닝 > 프로젝트' 카테고리의 다른 글
Proj 보스턴 주택 가격 회귀분석 (0) | 2023.08.09 |
---|---|
Proj 타이타닉호 생존율 분석, 상관관계 찾기 (0) | 2023.08.08 |
Proj Wine 속성을 이용한 포도 품종 예측 (0) | 2023.08.07 |
Proj 데이터 기술통계 분석/데이터모델링 - 와인 퀄리티 (3) (0) | 2023.08.07 |
Proj 데이터 기술통계 분석/ 개요, 데이터 준비 - 와인 퀄리티 (1) (0) | 2023.08.07 |