본문 바로가기
머신러닝/프로젝트

Proj 데이터 기술통계분석 / 데이터 탐색 - 와인 퀄리티 (2)

by ADELA_J 2023. 8. 7.

데이터 분석을 시작하는 첫번째

<데이터 탐색>

1. 기본정보 확인하기 .info()

2. 함수를 사용해 기술 통계하기

  - 하기전에 컬럼이름에서 공백문자를 _ 로 바꿔주는 작업

바로 위 info만 봐도 열 이름이 빈칸이 있는데 이를 통해 _ 로 바꿔줌 /

* method chaining(메소드 체이닝) wine.columns.str 처럼 점연산자로 연결해주는거

▶ 전체적인 데이터의 특징/균형을 보기위해 보는 것.

이런저런 자세한 설명 https://dev-adela.tistory.com/139

 

▶ .unique() 메서드를 사용하면 quality의 값들이 뭐뭐 있는지, quality 속성값 중 유일한 값을 출력

 

method chaining로 불러와도 되고
열을 선택해줘서 불러와도 되고

▶ .value_counts() 메서드를 사용하면 quality의 unique한 값들이 몇개씩 있는지 알려줌 

   ▷ 6등급은 2836개로 제일 많고 9등급은 5개로 제일 적다.

 

 unstack('type')을 지우면 red와 white가 카테고리가 됨.(행의 카테고리)