본문 바로가기

전체 글307

ADsP 2과목 데이터 분석 기획 정리 당면한 분석 주제의 해결 (과제단위) 지속적 분석 문화 내재화 (마스터플랜 단위) Speed & Test Accuracy & Deploy Quick-Win Long Term View Problem Solving Problem Definition - Data Size : 분석하고자 하는 데이터 양을 고려한 관리방안 수립이 필요 - Data complexity : 초기 데이터의 확보와 통합 외에도 해당 데이터에 잘 적용할 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요하다. - Speed : 분석결과가 도출되었을 때 이를 활용하는 시나리오 측면에서의 속도를 고려해야함 - Analytic Complexity : 정확도와 복잡도는 트레이드 오프관계. 모델이 복잡할 수록 정확도는 올라가지만 해석이 어려워짐.. 2023. 8. 18.
ADsP 1과목 데이터 이해 정리 - OLTP(On-Line Transcation Processing) : 네트워크상의 여러 이용자가 실시간으로 데이터베이스의 데이터를 갱신하거나 조회하는 등의 단위작업을 처리하는 방식 ex)은행에서 입출금 등이 일어날때 - OLAP (On-Line Analytic Processing) : 정보 위주의 처리분석을 의미한다. 의사결정에 활용할 수 있는 정보를 얻을 수 있께 해주는 기술 ex) 판매추이, 구매성향 파악, 재무회계 분석 등을 프로세싱하는것 - CRM : 선별된 고객으로부터 수익을 창출하고 장기적인 고객 관계를 가능케 함으로써 보다 높은 이익을 창출할 수 있는 솔루션 - SCM : 제조, 물류, 유통업체 등 유통 공급망에 참여하는 모든 업체가 협력을 바탕으로 정보기술을 활용, 재고를 최적화하기 위.. 2023. 8. 17.
ADsP 31회 기출문제 정리 10. 조직이나 기업의 인적 자원이 축적하고 있는 개별적인 지식을 체계화하여 공유함으로써 경쟁력을 향상시키기 위한 기업 정보시스템을 무엇이라 하는가? 지식관리시스템(KMS, KnowledgeManagement System) 02. 분석 주제 유형 중 분석의 대상은 알고 있지만 분석 방법을 모르는 경우의 주제 유형의 방식을 무엇이라 하는가? 1) 최적화(Optimization) 2) 통찰(Insight) 3) 솔루션(Solution) 4) 발견(Discovery) 방법 / 대상 Known Un-Known Known 최적화 (Optimization) 통찰 (Insight) Un-Known 솔루션 (Solution) 발견 (Discovery) ^^..맨날 통찰이랑 솔루션 헷갈림... 제발 외웁시다 04. 프로.. 2023. 8. 16.
Proj 유방암 진단하기, 로지스틱 회귀 목표 로지스틱 회귀 분석을 이용해 유방암에 영향을 미치는 특징 데이터를 분석하고 유방암 여부를 진단하는 예측 모델을 생성한다. 핵심 개념 로지스틱 회귀, 시그모이드 함수, 성능 평가 지표, 오차 행렬, 정밀도, 재현율, F1 스코어, ROC 기반 AUC 스코어 데이터 준비 유방암 진단 데이터 : 사이킷런 내장 데이터셋 https://archive.ics.uci.edu/dataset/17/breast+cancer+wisconsin+diagnostic 데이터 탐색 1. 사이킷런 데이터에서 제공되는 설명 확인:b_cancer.DESCR 2. 사이킷런 데이터셋에 지정된 X 피쳐와 타깃 피쳐 결합 3. 로지스틱 회귀 분석을 위해 X 피쳐 값을 정규 분포 형태로 스케일링 : b_cancer_scaled = scal.. 2023. 8. 16.
ADsP 34회 기출문제 정리 09. 데이터의 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그의미를 부여한 데이터를 무엇이라 하는가? 정보 02. 분석 준비도의 분석 업무 영역이 아닌 것은? 1) 업무별 적합한 분석기법 사용 > 분석 준비도의 '분석기법 영역' 이다. 2) 최적화 분석 업무 3) 발생한 사실 여부 파악 4) 예측 분석업무 - 분석준비도(readiness) : 데이터 분석 도입의 수준을 파악 하기 위한 진단방법 분석 업무파악 인력 및 조직 분석기법 - 발생한 사실 분석 업무 - 예측 분석 업무 - 시뮬레이션 분석 업무 - 최적화 분석 업무 - 분석 업무 정기적 개선 - 분석전문가 직무 존재 - 전문가 교육훈련 프로그램 - 관리자 기본분석능력 - 전사 총괄조직 - 경영진 분석 업무 이해 - 업무별 적합한 분석기법 -.. 2023. 8. 15.
ADsP 32회 기출문제 - 아니 이번에 무슨일.............................. 02. N:1 관계란 상품 개체의 원소는 고객 개체의 원소와 대응하고 있지만, 고객 개체의 원소는 상품 개체의 원소 한 개와 대응함을 의미한다. 03. 아래 보기가 설명하는 기업 내부 데이터 베이스 솔루션을 무엇이라 하는가? - 조직의 회계, 구매, 프로젝트 관리, 리스트 관리 규정 준수 및 공급망 운영 같은 일상적인 비즈니스 활용을 관리하는데 사용하는 소프트웨어 유형을 의미한다. 다양한 비즈니스 분야에서 생산, 구매, 재고, 주문, 공급자와의 거래, 고객서비스 제공 등 주요 프로세스 관리를 돕는 통합 어플리케이션이다. 1) ERP 2) CRM 3) SCM 4) KMC > Enterprise Resource Planning. 제.. 2023. 8. 15.
ADsP 35회 기출문제 정리 09. '문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 정리 및 정보통신 기기에 의하여 체계적으로 수집 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체'를 무엇이라 하는가? 데이터베이스 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ....ㅠ.... 미쳤나봐 06. 기업의 '도입형' 분석 수준 진단 결과 항목이 아닌것은? 1) 조직 및 인력 2)분석업무 3)분석기법 4)관리 목표 '도입형'은 기업에서 활용하는 분석 업무 및 분석기법 등은 부족한 상태지만, 조직 및 인력 등 준비도가 높은 유형 07. 분석과제 접근방법 중 상향식 접근 프로세스 절차로 옳은 것은? 1) 프로세스 분류 > 프로세스 흐름 분석 > 분석 요건 식별 > 분석 요건 정의 > 문제 정의 자체가 어려운 경우 데.. 2023. 8. 14.
ADsP 33회 기출문제 정리 05. 빅데터의 관점에서 사물인터넷(IOT)의 역할로 적절한 것은? 1) 모든 것의 데이터화(Datafication) > 인터넷에 연결되는 사물인터넷은 모든 것들을 데이터화하는 시대로 변모시키고 있다. 2) 서비스의 지능화(Intelligent Service) 3) 분석 고급화(Advanced analytics) 4) 정보 공유화(Information Sharing) 07. 빅데이터의 위기 요인과 통제방안이 바르게 연결되지 않은 것은? 가. 사생활 침해 - 정보 사용자의 동의제에서 책임제로 변환 나. 결과 기반 책임 원칙 훼손 - 알고리즘에 대한 접근권 제공 > 알고리즘에 접근권 제공은 데이터 오용에 대한 통제방안이다. 결과 기반 책임 원칙 훼손이라면 명확히 나타난 결과에 대해서만 책임을 물어야함(결과기.. 2023. 8. 14.
Proj 자동차 연비 예측하기 자동차 연비 예측하기 목표 설정 : 연비에 영향을 미치는 항목을 확인하고 그에 따른 자동차 연비를 예측 데이터 수집:자동차 연비 데이터 : UCI Machine Learning Repository에서 다운로드( https://archive.ics.uci.edu/dataset/9/auto+mpg ) 1.필요없는 컬럼 제거 2. X변수와 Y변수 확인 데이터 수집 : ▷ \s+ >>>> 공백하고 한개 이상의 캐릭터를 나누자 - https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html?highlight=read_csv ▶라고 했어도 만약 다른 파일 불러왔을 때 \t 가 포함된 값이 있었다. 맨 마지막에 1\t라고 적혀있기 때문에 1\t도 잘랐다 그래서.. 2023. 8. 9.