머신러닝62 딥러닝의 기초 - 딥러닝 중에서도 가장 기본적인 알고리즘. - Keras, TensorFlow(구글에서 만든 인기 있는 딥러닝 라이브러리). > Keras는 TensorFlow 쉽게 다루기 위한 라이브러리. 래퍼wrapper라고 불리움. ▶ epoch 수가 높아짐에 따라 훈련 데이터의 정확도 / 테스트 데이터의 정확도가 올라가는것을 확인하자. - 심층 신경망 모델을 사용하여 데이터의 분류나 회귀를 실시 - 머신러닝의 한 방법 ▶ x0, x1 등등이 입력, w1,w2이가 가중치 파라미터, w1x1+w2x2의 값이 임곗값 보다 높으면 뉴런이 발화spiking, firing 하여 1을 출력하고 그렇지 않으면 0 을 출력 - 위 그림처럼 여러 층을 구축하여 복잡한 문제를 다룰 수 있게 하는것. - 신경망은 입력X(벡터나 행렬.. 2023. 7. 24. 머신러닝 scikit-learn, 머신러닝 프로세스 간단히 알고가기 - 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리 - 가장 파이썬스러운 API를 제공,(다른 ML 패키지도 사이킷런 스타일의 API를 지향) - 머신러닝(이하 ML)을 위한 다양한 알고리즘, 편리한 프레임워크 API 제공 - 많은 환경에서 사용되며 검증된 성숙한 라이브러리 * 참고로 짚고 넘어가는 pip 원하는 버전 설치/버전 확인 하는 방법 더보기 #원하는 버전 설치 (뒤에 == 버전 적어준다) pip install scikit-learn ==1.0.2 #버전 확인 import sklearn print(sklearn.__version__) - 붓꽃 데이터 세트로 붓꽃의 품종을 분류(Classification) ▷ 꽃잎의 길이, 너비, 꽃받침의 길이 너비 Featrue를 기반으로 품종을 예.. 2023. 7. 21. 머신러닝 하이퍼파라미터 하이퍼파라미터, hyperparameter - 머신러닝 모델을 학습시킬 때 사람이 직접 보정해야 하는 파라미터 튜닝 tuning - 하이퍼파라미터를 조정하는 것. 파라미터 C - 로지스틱 회귀에는 C라는 파라미터가 존재. - C는 모델이 학습하는 식별 경계선을 분류 오류에 대해 얼마나 엄격하게 규제할지 나타내는 지표 - 클수록 엄격하고 작은수록 관대해짐 - 초깃값은 1.0 ▼ C값의 변화로 모델의 정확도가 얼마나 달라졌는지 그래프로 확인 - 검증하기 위해, 좋아지다 나빠질수 있는데 가장 좋은 수치를 찾는 것. ▼ C값의 후보가 포함된 리스트 C_list 를 이용해 정확도를 나타낸 그래프를 그리기 - 파라미터 C > SVM(support vector machine)도 오류의허용 오차를 나타내는 C가 파라미.. 2023. 7. 20. 머신러닝 같은 데이터로 scikit-learn 구현해보기 1. make_classification() 으로 데이터 X와 라벨 y를 생성하고 2. train_test_split()으로 학습데이터와 테스트 데이터를 나눈다. 3. LogisticRegression, LinearSVC, SVC, DecisionTreeClassifier, RandomForestClassifier를 import한 후 모델을 딕셔너리를 이용해 구축한다. 4. for문으로 모델을 학습시키고 정확도를 출력한다. ▷랜덤 포레스트랑 결정트리의 정확도가 가장 높다(1.0이니..ㅎ) ▷그래서 앞에서 했던 버섯데이터에도 해봤다. ▶ 여기서는 결정트리, 랜덤포레스트가 미세하게 높게 나왔고 비선현 SVM도 만만치 않게 높게 나왔다. 0.0002가 높으니까 크게 차이나지 않는게 아닐까..? 2023. 7. 19. 이전 1 ··· 9 10 11 12 13 14 15 16 다음