<1과목. 데이터 이해> - 아니 이번에 무슨일..............................
02. N:1 관계란 상품 개체의 원소는 고객 개체의 원소와 대응하고 있지만, 고객 개체의 원소는 상품 개체의 원소 한 개와 대응함을 의미한다.
03. 아래 보기가 설명하는 기업 내부 데이터 베이스 솔루션을 무엇이라 하는가?
- 조직의 회계, 구매, 프로젝트 관리, 리스트 관리 규정 준수 및 공급망 운영 같은 일상적인 비즈니스 활용을 관리하는데 사용하는 소프트웨어 유형을 의미한다. 다양한 비즈니스 분야에서 생산, 구매, 재고, 주문, 공급자와의 거래, 고객서비스 제공 등 주요 프로세스 관리를 돕는 통합 어플리케이션이다.
1) ERP 2) CRM 3) SCM 4) KMC
> Enterprise Resource Planning. 제조업을 포함한 다양한 비즈니스 분야에서 생산, 구매, 재고, 주문, 공급자와의 거래, 고객서비스 제공 등 주요 프로세스 관리를 돕는 여러 모듈로 구성된 통합 애플리케이션 소프트웨어패키지를 의미함.
CRM(Customer Relationship Management) 선별된 고객으로부터 수익을 창출하고 장기적인 고객관계를 가능케함으로써 보다 높은 이익을 창출할 수 있는 솔루션을 말함.
SCM (Supply Chain Management) 기업에서 원재료의 생산.유통 등 모든 공급망 단계를 최적화해 수용자가 원하는 제품을 원하는 시간과 장소에 제공하는 '공급망 관리'를 뜻한다.
04. 딥러닝(Deep Learning)과 가장 관련 없는 분석 기법은?
1) LSTM 2)Autoencoder 3)SVM 4)RNN
> SVM (support vector machine) 패턴인식, 분류, 회귀 분석 등의 머신러닝 알고리즘
>> LSTM(Long Short-Team Memory) / Autoencoder /RNN (Recurrent Neural Network)
05. 머신러닝 학습 방법이 나머지와 다른 것은?
1) 군집 분석 ^^... 이건 비지도 학습 나머지는 다 지도학습
07. 인문학 열풍의 외부 환경적인 측면 요소가 아닌 것은?
1) 단순세계화에서 복잡한 세계화로의 변화
2) 비즈니스 중심의 제품 생산에서 서비스로 이동
3) 경제와 산업의 논리가 생산에서 시장창조로의 변화
4) 빅데이터 분석기법 이해와 분석 방법론의 확대
> 단순세계화 → 복잡세계화:컨버전스 (규모의 경제, 표준화) → 디버전스 (복잡한 세계, 다양성)
상품 생산 → 서비스 : 고장나지 않은 상품 → 뛰어난 서비스
생산 → 시장 창조 : 공급자 중심 → 무형자산 경쟁(현재 사회, 문화)
창의적 관점, 비즈니스 핵심가치 이해, 고객과 직원의 내면적 요구 이해하는 능력(인문학 역량)
09. 다음은 어떤 기업내부데이터 솔루션에 대한 설명인가?
- 물류, 유통업체 등 유통 공급망에 참여하는 모든 업체들이 협력을 바탕으로 정보기술(information Technology)을 활용, 재고를 최적화하기 위한 솔루션이다.
SCM(Supply Chain Management) 기업에서 원재료의 생산.유통 등 모든 공급망 단계를 최적화해 수용자가 원하는 제품을 원하는 시간과 장소에 제공하는 '공급망 관리'를 뜻한다.
<2과목 데이터의 분석 기획>
05. 빅데이터 분석방법론 분석기획 단계에서 발생하는 산출물로 프로젝트에 참여하는 관계자들 이해를 일치시키기 위한 결과물을 무엇이라 하는가?
1) 데이터 스토어 2)SOW (Statement of Woga) 3) 상세 알고리즘 4) WBS(Work Breakdown structure)
> SOW : 프로젝트 정의 및 계획 수립을 위한 작성. 중장기 계획서, 빅데이터 분석 프로젝트 지시서, 도메인 이해 및 문제점 그리고 자료수집, 비즈니스 이해 이런거 적어서 하는것
WBS : 전체업무를 구성 요소로 만든 후 각 요소 평가하고 일정별로 계획하며 완수할 수 있는 사람에게 할당해주는 역할을 함.
08. 기업의 데이터 분석 도입의 수준을 명확하게 파악하기 위한 방법으로 분석준비도(Readiness)를 진단할 수 있다. 다음 중 분석 준비도를 측정하기 위한 요소로 가장 부적절한 것은?
1) 분석 업무 파악 2) 인력및 조직 3) 분석기법 4) 분석성과
> 분석준비도 : 분석업무 파악, 인력 및 조직, 분석기법, 분석데이터, 분석 문화, IT 인프라
10. 분석 수준 진단 방법 중 조직의 분석 및 활용을 위한 역량 수준을 파악하기 위해 도입→( ) → 확산 → 최적화의 분석 성숙도 단계 포지셔닝을 파악하게 된다. 빈칸에 알맞은 용어는? 활용
> 도입 : 분석을 막 시작하여 환경, 시스템 구축
→ 활용 : 분석 결과를 실제 업무에 적용
→ 확산 : 전사 차원에서 분석을 관리하고 공유
→ 최적화 : 분석을 진화시켜서 혁신 및 성과 향상에 기여
<3과목 데이터분석> - 여기서 덜 틀린대신 1과목에서 아작 났나보다....ㅎ....
02. 귀무가설이 실제로 사실임에도 불구하고 귀무가설을 기각하는 확률은?
1) 검정력 2) 제2종 오류 3) 유의수준 4) 유의확률
> 유의수준을 평가하여 귀무가설을 채택할지 거부할지를 판단한다. (알파a), 오류를 허용할 범위이다.
제 2종 오류 : 귀무가설이 사실이 아님에도 사실이라고 판정
유의확률 : 회귀분석 모형에서 모형이 통계적으로 유의미한지, 회귀계수들이 유의미한지 p-value 통해서 확인
09. 군집분석 중 모형기반(Model-Based)의 군집 방법으로 데이터가 k개의 모수적 모형으로 가중합으로 표현되는 모집단의 모형으로 나왔다는 가정하에서 모수와 함께 가중치를 자료로부터 추정하는 방법은?
1) 밀도기반군집 2)혼합분포군집 3) 비계층적군집 4)격자기반군집
> 데이터가 k개의 모수적 모형(정규분포 혹은 다변량 분포를 가정)의 가중합으로 표현되는 모집단 모형으로부터 나왔다는 가정하에서, 모수와 함께 가중치를 자료로부터 추정하는 방법. 데이터가 k개의 모수적 모형(군집)의 가중합으로부터 나왔다는 가정. k개의 각 모형은 군집을 의미. 각 데이터는 추정된 k개의 모형 중 어느 모형으로부터 나왔을 확률이 높은지에 따라 군집의 분포가 이뤄짐.
비계층적 군집 : n개의 개체를 g개의 군집으로 나눌 수 있는 모든 방법을 점검해 최적화한 군집을 형성. 자료의 크기에 제약이 없음. 장점으로는 사전정보 없이 의미있는 자료구조를 찾을 수 있지만 단점으로는 사전에 주어진 목적이 없으므로 결과 해석이 어렵고 초기 군집수 결정과 가중치, 거리정의가 어렵다.
20. 파생변수에 대한 설명 중 올바르지 않는 것은?
1) 파생변수는 기존 변수에 특정 조건 혹은 함수등을 사용하여 새롭게 재정의한 변수를 의미한다.
2) 파생변수는 재활용성이 높고 다른 많은 모델을 공통으로 사용할 수 있는 장점이 있다.
> 요약변수(Summary Variable)에 대한 설명이다.
3) 파생변수는 논리성과 대표성을 나타나게 할 필요가 있다.
4) 일반적으로 1차 분석마트의 개별 변수에 대한 이해 및 탐색을 통해 각 특성을 고려하여 파생 변수를 생성한다.
- 요약 변수 : 수집된 정보를 분석에 맞게 종합한 변수, 공통적으로 사용될 수 있어 재활용성 높음.
간단한 구조이므로 자동화하여 자동화프로그램 구축 가능. 연속형 변수를 범주화하여 사용해도 좋음.
- 파생 변수 : 사용자가 특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수
매우 주관적일 수 있으므로 논리적 타당성을 갖추어 개발
특정 상황에만 유의미하지 않도록 대표성을 띄게 생성해야 한다.
25. 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법을 무엇이라 하는가? 분해시계열
ㅎ......정답이 아예 질문에 나와있었는데 너무 복잡하게 생각함 ㅎ
> 상시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법이다.
회귀분석적인 방법을 주로 사용. 이론적 약점이 있음에도 널리 사용중.
26. 아래 설명하는 시계열 모형은 무엇인가?
- 과거 시점의 관측자료와 과거시점의 백색잡음의 선형결합으로 현 시점의 자료를 표현하는 모형
ARMA 모형
> 과거 시점의 관측자료의 선형 결합으로 표현하는 것이 자기회귀(AR)모형,
과거 시점의 백색잡음의 선형결합으로 표현하는 것이 이동평균(MA)모형이며
이 두 모형을 합친 것이 자기회귀이동평균(ARMA)모형이다.
: (쉽게) 시계열 모델 중 자기 자신의 과거 값을 사용해 설명하는 모형.
백색잡음의 현재값과 과거값의 선형가중합으로 이루어진 정상 확률 모형
27. 아래 빈칸에 알맞은 말은?
인공 신경망의 노드가 많을 수록 변수의 복잡성을 학습하기 쉽지만 ( ) 문제가 발생한다. 훈련용 데이터에서는 높은 성능을 보이지만, 일반화 시키기는 어렵다. 과대적합(Overfitting)
29. 이익(Gain)는 목표범주에 속하는 개체들이 각 등급에 얼마나 분포하고 있는지 나타내는 값을 의미한다. 분류된 관측지가 각 등급별 얼마나 포함되는지 나타내는 평가를 무엇이라 하는가? 이익도표
> - 이익(Gain) : 목표 번주에 속하는 개체들이 각 등급을 얼마나 분포하고 있는지를 나태는 값.
- 이익도표 : 분류분석 모형을 사용해 분류된 관측지가 각 등급별로 얼마나 포함되는지를 나타내는 도표
'ADsP' 카테고리의 다른 글
| ADsP 1과목 데이터 이해 정리 (1) | 2023.08.17 |
|---|---|
| ADsP 31회 기출문제 정리 (0) | 2023.08.16 |
| ADsP 34회 기출문제 정리 (0) | 2023.08.15 |
| ADsP 35회 기출문제 정리 (0) | 2023.08.14 |
| ADsP 33회 기출문제 정리 (0) | 2023.08.14 |