본문 바로가기

머신러닝/프로젝트14

Proj 레스토랑의 웨이터 팁 분석 및 예측 목표 레스토랑에서 웨이터에게 제공되는 팁에 대해 기록된 데이터를 기반으 영향을 미치는 요인과 머신러닝 모델을 훈련 데이터 준비 파이썬 사이킷런 내장데이터 데이터 내용 total_bill : 택스 포함된 총 가격 (달러) tip : 웨이터에게 준 팁 (달러) sex : 총 가격을 지불한 사람의 성별 smoker : 지불한 사람의 흡연 여부 day : 무슨 요일 time : 런치 or 디너 size: 테이블의 몇 사람이 앉았는지 ▶ info를 살펴보면 내장데이터 답게 깔끔하게 정리가 되어 있다. ▶ 좀 더 자세히 데이터를 보면 tip은 1~10달러이고, 테이블 size는 1~6명으로 되어 있다. ▶ total_bill 을 살펴보면 주로 7~22달러정도까지가 많은 사람들이 내는 가격으로 보인다. ▶ tip 도.. 2023. 12. 29.
Proj 사용자 행동 인식 예측 분류 Human Activity Recognition 목표 사용자 행동 인식 데이터 세트를 활용해 예측 분류 수행 데이터 준비 30명에게 스마트폰 센서를 장착한 뒤 사람의 동작과 관련된 여러가지 피처를 수집한 데이터 https://www.kaggle.com/datasets/uciml/human-activity-recognition-with-smartphones/ 분석 모델 구축 결정 트리 Decision Tree 먼저 데이터를 불러옴 그리고 컬럼 값(피처명)도 불러옴 피처명을 보면 X, Y, Z 이런식으로 나와 있는데, 인체의 움직임과 관련된 속성의 평균(mean)과 표준편차(std)가 X,Y,Z축 값으로 되어 있는 듯 함 그러다보니 중복되는 피처명들이 있을 수도 있음 (563개나 되니까) 그럼 오류가 날 수 있으니까 체크체크 체크해봤을 때 아무것도 나오지.. 2023. 12. 6.
Proj 구글 스토어 앱 데이터 분석을 통한 평점 예측 (2) 지난꺼 이어서 https://dev-adela.tistory.com/279 앱 평점을 예측하기 위해서 회귀모델을 사용할 예정, 0~5점까지의 값을 내야하니까 학습하기 전 해야할 1. 카테고리형 변수를 수치형으로 바꾸기. > ML에서 학습을 하려면 문자열이 아닌 컴퓨터가 학습할 수 있는 숫자로 바꿔줘야한다. - 이전 글에서 확인했듯이 'Free', 'Ad Supported', 'In App Purchases',' Editors Choice', '2021'는 'False' 와 'True'로 되어 있다. ▶ 그래서 Ture를 1로 False를 0으로 바꾸기 ▷원래 bool로 되어 있었던 피쳐들이 int 숫자로 바뀌었다. 그리고 아직도 남아있는 object...을 바꾸기 위해 사용할 one-hot encodin.. 2023. 11. 27.
Proj 구글 스토어 앱 데이터 분석을 통한 평점 예측 (1) 목표 구글 스토어 앱 데이터 분석을 통하여 앱 평점을 예측하는 회귀 모델 수행 구글 스토어 앱 평점에 영향을 미치는 특성 데이터들에 대한 데이터 분석 수행 데이터 준비 https://www.kaggle.com/datasets/gauthamp10/google-playstore-apps/ 분석 모델 구축 사이킷런의 로지스틱 회귀 모델 구축 결과 분석 회귀 모델을 사용 후 평가 및 예측 수행 confusion_matrix, accuracy, precision, recall, f1 info() 를 써서 봤더니 bool도 있고 문자열도 있고 숫자도 있고 어마무시함 describe()를 통해 통계량 정보를 출력. Rating은 별점이다보니 0부터 5가 최대 - 결측값과 이상치 처리 * 변수 .. 2023. 11. 26.