본문 바로가기
ADsP

ADsP 31회 기출문제 정리

by ADELA_J 2023. 8. 16.

<1과목 데이터 이해>

10. 조직이나 기업의 인적 자원이 축적하고 있는 개별적인 지식을 체계화하여 공유함으로써 경쟁력을 향상시키기 위한 기업 정보시스템을 무엇이라 하는가? 지식관리시스템(KMS, KnowledgeManagement System)

 

<2과목 데이터의 분석기획>

02. 분석 주제 유형 중 분석의 대상은 알고 있지만 분석 방법을 모르는 경우의 주제 유형의 방식을 무엇이라 하는가?

1) 최적화(Optimization)   2) 통찰(Insight)   3) 솔루션(Solution)   4) 발견(Discovery) 

방법 / 대상 Known Un-Known
Known 최적화
(Optimization)
통찰
(Insight)
Un-Known 솔루션
(Solution)
발견
(Discovery)

^^..맨날 통찰이랑 솔루션 헷갈림...  제발 외웁시다

 

04. 프로토타이핑 프로세스에 대한 설명 중 적절하지 않은 것은?

1) 가설의 생성

2) 디자인에 대한 실험

3) 실제 환경에서의 테스트

4) 반복적으로 위험분석을 수행하여 위험관리 개선

> 테스트 결과에서의 통찰 도출 및 가설확인으로 구성된다.

프로토타이핑 접근법 : 상향식 접근방식. 요구사항/데이터 정확히 규정하기 어렵고

데이터 소스도 명확하게 파악하기 어려운 상황에서 일단 분석해보고

그 결과를 확인해가면서 반복적으로 개선해 나가는 방법

 

07. 마스터 플랜을 수립할 때 우선순위 고려요소가 아닌 것은?

1) 전략적 중요도 2)실행 용이성 3) 데이터 우선 순위 4) 비즈니스 성과&ROI

> 적용범위/방식 고려요소 : 업무 내재화 / 분석 데이터 / 기술 적용 수준

 

09. 기업 및 공공기관에서는 시스템의 중장기 로드맵을 정의하기 위한 (  )를 수행한다. (   )는 정보기술 또는 정보시스템을 전략적으로 활용하기 위하여 조직 내 외부 환경을 분석하여 기회나 문제점을 도출하고 사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 등 중장기 마스터 플랜을 수립하는 절차이다. 

정보전략계획(ISP, Information Strategy Planning)

: 분석마스터플랜 수립에서 정보기술 또는 정보 시스템을 전략적으로 활용하기 위해 중장기 마스터 플랜 수립하는 절차

 

10. 데이터 분석 도입의 수준을 파악하기 위한 분석 준비도의 6가지 구성요소 중 하나로서 운영 시스템 데이터 통합, 빅데이터 분석환경, 통계분석 환경 등을 진단하는 구성요소는 무엇인가?  IT 인프라

- 분석준비도......... readiness : 분석도입 수준을 파악하기 위한 진단방법 (외워)

분석 업무파악 인력 및 조직 분석 기법
- 발생한 사실 분석 업무
- 예측 분석 업무
- 시뮬레이션 분석 업무
- 최적화 분석 업무
-분석 업무 정기적 개선
- 분석전문가 직무 존재
- 전문가 교육훈련 프로그램
- 관리자 기본분석능력
- 전사 총괄조직
- 경영진 분석 업무 이해
- 업무별 적합한 분석기법
- 분석 업무 도입 방법론
- 분석기법 라이브러리
- 분석기법 효과성 평가
- 분석기법 정기적 개선
분석 데이터 분석 문화 IT 인프라
- 분석업무를 위한 데이터
 : 충분성 / 신뢰성 / 적시성
- 비구조정 데이터 관리
- 외부 데이터 활용 체계
- 기준데이터 관리(MDM)
- 사실에 근거한 의사 결정
- 관리자의 데이터 중심
- 회의 등에서 데이터 활용
- 직관보다 데이터 활용
- 데이터 공유 및 협업 문화
-운영 시스템 데이터 통합
-EAI, ETL 등 데이터 유통 체계
- 분석 전용 서버 및 스토리지
- (빅데이터/통계/비쥬얼) 분석환경

<3과목 - 데이터 분석>

04. 이상값 자료에 민감한 k-평균 군집의 단점을 보완하기 위해 군집방법을 무엇이라 하는가?

1) k-medoids  2) 밀도기반   3)혼합분포   4)퍼지

 

06. MAPE

At는 실제값 Ft는 예측값. ....................................... 걍 틀릴까봐 ㅎ

 

12. 다음 중 분석기법이 다른 것은?

1) DBSCAN (밀도 기반 클러스터링)

2) Hierarchical Clustering (계층적 군집화)

3) PCA  (주성분 분석)

4) K- means (비계층적 군집)

 

16. 변수의 표준화와 함께 변수 간의 상관성(분포 형태)을 동시에 고려한 통계적 거리를 무엇이라 하는가?

1) 표준화(Standardized)거리   2)마할라노비스(Mahalanobis)거리   3)맨하든(Manhattan)거리  4)유클리드(Euclidian)거리

유클리드(유클리디안, Euclidean) 데이터간 유사성 측정을 위해 사용
통계적 개념이 내포 X, 
변수들의 산포정도 감아 X
두 점을 잇는 가장 짧은 직선 거리
맨하탄(Manhattan) 건물간 최단거리 계산
마할라노비스 통개념 개념이 포함된 거리
변수들의 산포를 고려하여 표준화한 거리
= 변수의 표준화와 상관성을 동시에 고려한 통계적 거리
그룹에 대한 사전 지식 없이는
표본 공분산을 계산할 수 없으므로
사용하기 어려움
표준화 해당 변수의 표준편차로 척도 변환 후 유클리디안 거리 계산
표준화를 하게 되면 척도의 차이, 분산의 차이로 인해 왜곡 피할 수 있음. 

 

19. 다중공산성(Multicollinearity)에 대한 설명 중 적절하지 않은 것은?

1) 다중공선성 문제를 해결하기 위해 중요하지 않은 변수를 제거한다.

2) VIF을 구하여 이 값이 10을 넘으면 다중공선성의 문제가 있는 것으로 판단한다.

3) 두 변수의 VIF값이 "1" 에 가까우면 회귀식의 기울기는 완만하다.

> 다중 공선성이 회귀모형의 설명변수 사이에 존재하는 경우, 추정된 회귀계수의 분산이 매우 커진다. 이러한 다중 공선성 문제가 발생할 때, 회귀계수 추정량의 분산이 커지게 되어, 회귀계수 추정값의 검정통계량값의 분모가 커지므로, 검정통계량 값이 작아지게, p-value 가 유의수준보다 작아지게 되고 따라서, 회귀계수 유의성 검정에서 귀무가설 H0:B=0을 기각하지 못하게 된다. 즉, 회귀계수의 유의성이 증명되지 못한다.

4) 표본수가 증가해도 VIF에서 결정계수는 크게 변하지 않는다.

 

21. 분해 시계열에 대한 설명 중 적절하지 않은 것은?

1) 자료가 어떤 특정한 형태를 취할 때 추세요인(trend factor)이 있다고 한다.

2) 고정된 주기에 따라 자료가 변화할 경우 계절요인(seanson factor)가 있다고 한다.

3) 순환요인은 경제 전반이나 특정 산업의 원인으로 나타난다.

> 명백한 경제적, 자연적인 이유가 없이 알려지지 않는 주기를 가지고 변화하는 자료를 순환요인이 있다고 한다.

4) 회귀분석에서 오차에 해당하는 요인을 불규칙 요인(irregular facotr)라고 한다.

 

25. 베이즈 추론을 기반으로 한 방법론의 정확도는 일반적으로 머신러닝의 대표적인 방법인 랜덤 포레스트나 트리 분류 방법보다도 높다고 평가받고 있다. 베이지안 추론을 활용한 대표적 분류 방법 알고리즘은? 나이브 베이즈 분류

 

27. 아래 예시와 같이 텍스트마이닝의 전처리 과정 중에서 변형된 단어 형태에서 접사등을 제거하고 그 단어의 원형 또는 어간을 찾아내는 것을 지칭하는 용어는 무엇인가? ('argue', 'argued', 'argus'의 어간인 'argu'를 찾아내는것)

스태밍(stemming)

 

28. 시계열의 수준에서 나타내는 변화를 제거하여 시계열의 평균 변화를 일정하게 만드는 것을 의미하며 자료가 추세를 보이는 경우에는 현 시점의 자료값에서 전 시점의 자료를 빼는 방법을 통해 비정상시계열을 정상 시계열로 변환해주는 방법을 무엇이라 하는가? 차분(differencing)

 

 

'ADsP' 카테고리의 다른 글

ADsP 2과목 데이터 분석 기획 정리  (0) 2023.08.18
ADsP 1과목 데이터 이해 정리  (1) 2023.08.17
ADsP 34회 기출문제 정리  (0) 2023.08.15
ADsP 32회 기출문제  (0) 2023.08.15
ADsP 35회 기출문제 정리  (0) 2023.08.14