머신러닝/프로젝트14 Proj 피마 인디언 당뇨병 예측 데이터 세트 : https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database 데이터 피처 Pregnancies : 임신횟수, Glucose : 포도당 부하 검사 수치 BloodPressure : 혈압 SkinThickness : 팔 삼두근 뒤쪽의 피하지방 측정값 Insulin : 혈청 인슐린 BMI :체질량지수 DiabetesPedigreeFunction : 당뇨 내력 가중치 값 Age: 나이 Outcome : 클래스 결정값 ( 0 또는 1) 'OutCome', 클래스 결정값의 갯수하고 3개 열만 뽑아서 봐보기 info() 도 뽑아보자 Null값은 없었고, 모두 숫자형이다. 0은 500개고 1은 268개로 불균형하기 때문에 균형있게 나눠주려면.. 2023. 10. 24. Proj 콤프레샤 모터의 이상감지 * 설비이름_VOLT_N상 : 설비이름/N상 전압(단위:V) (Type: float64) * 설비이름_VOLT_AVG : 설비이름/평균 전압(단위:V) (Type: float64) * 설비이름_CURR_N상 : 설비이름/N상 전류(단위:A) (Type: float64) * 설비이름_CURR_AVG : 설비이름/평균전류(단위:A) (Type: float64) * 설비이름_KW : 설비이름/유효전력(단위:KW) (Type: float64) * 설비이름_KVAR : 설비이름/무효전력 (단위:KVAR)(Type: float64) * 설비이름_HZ : 설비이름/주파수 (단위:HZ) (Type: float64) * 설비이름_PWR_FACTOR : 설비이름/역률 (단위:%) (Type: float64) * 설비이름_.. 2023. 8. 21. Proj 유방암 진단하기, 로지스틱 회귀 목표 로지스틱 회귀 분석을 이용해 유방암에 영향을 미치는 특징 데이터를 분석하고 유방암 여부를 진단하는 예측 모델을 생성한다. 핵심 개념 로지스틱 회귀, 시그모이드 함수, 성능 평가 지표, 오차 행렬, 정밀도, 재현율, F1 스코어, ROC 기반 AUC 스코어 데이터 준비 유방암 진단 데이터 : 사이킷런 내장 데이터셋 https://archive.ics.uci.edu/dataset/17/breast+cancer+wisconsin+diagnostic 데이터 탐색 1. 사이킷런 데이터에서 제공되는 설명 확인:b_cancer.DESCR 2. 사이킷런 데이터셋에 지정된 X 피쳐와 타깃 피쳐 결합 3. 로지스틱 회귀 분석을 위해 X 피쳐 값을 정규 분포 형태로 스케일링 : b_cancer_scaled = scal.. 2023. 8. 16. Proj 자동차 연비 예측하기 자동차 연비 예측하기 목표 설정 : 연비에 영향을 미치는 항목을 확인하고 그에 따른 자동차 연비를 예측 데이터 수집:자동차 연비 데이터 : UCI Machine Learning Repository에서 다운로드( https://archive.ics.uci.edu/dataset/9/auto+mpg ) 1.필요없는 컬럼 제거 2. X변수와 Y변수 확인 데이터 수집 : ▷ \s+ >>>> 공백하고 한개 이상의 캐릭터를 나누자 - https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html?highlight=read_csv ▶라고 했어도 만약 다른 파일 불러왔을 때 \t 가 포함된 값이 있었다. 맨 마지막에 1\t라고 적혀있기 때문에 1\t도 잘랐다 그래서.. 2023. 8. 9. 이전 1 2 3 4 다음