본문 바로가기
ADsP

ADsP 33회 기출문제 정리

by ADELA_J 2023. 8. 14.

05. 빅데터의 관점에서 사물인터넷(IOT)의 역할로 적절한 것은?

1) 모든 것의 데이터화(Datafication)

  > 인터넷에 연결되는 사물인터넷은 모든 것들을 데이터화하는 시대로 변모시키고 있다.

2) 서비스의 지능화(Intelligent Service)

3) 분석 고급화(Advanced analytics)

4) 정보 공유화(Information Sharing)

 

07. 빅데이터의 위기 요인과 통제방안이 바르게 연결되지 않은 것은?

가. 사생활 침해 -  정보 사용자의 동의제에서 책임제로 변환

나. 결과 기반 책임 원칙 훼손 - 알고리즘에 대한 접근권 제공

 > 알고리즘에 접근권 제공은 데이터 오용에 대한 통제방안이다.

  결과 기반 책임 원칙 훼손이라면 명확히 나타난 결과에 대해서만 책임을 물어야함(결과기반 책임원칙), 책임원칙을 더 보강하고 강화해야함.

다. 데이터 오용 - 데이터의 선택적 공개

 > 데이터의 선택적 공개 → 데이터의 접근권 제공

 

09. 기업의 의사결정을 지원할 수 있는 분석 정보를 제공하는 데이터베이스로 데이터의 주제 지향성 통합성, 시계열성, 비휘발성을 특징으로 하는 데이터베이스를 무엇이라 하는가? 데이터웨어하우스(통합적이고 시간성을 가지는 비휘발성 데이터의집합. 일관적인 형식 유지)

 

<2과목 데이터의 분석 기획>

01. 분석 프로젝트 관리방안에 관한 설명으로 적절하지 않은 것은?

1) 정확도는 실제로 TRUE인 비율 중 TRUE로 예측 되었던 정도를 의미한다. 

2) 정밀도는 TRUE로 예측한 비율 중 실제로 TRUE인 정도를 의미한다.

 > 정확도는 실제 측정과 절대 측정 간의 일치 수준을 나타냄. 정밀도는 같은 요소의 여러 측정값에 있는 변동 수준을 의미.

   모델을 지속적으로 반복했을 때의 편차의 수준으로서 일관적으로 동일한 결과를 제시한다는 것을 의미.

3) 분석의 활용적 측면에서는 정확도가 중요하고, 안정적인 측면에서는 정밀도가 중요하다.

4) 분석 모델의 정확도와 정밀도는 트레이드오프(trade-off)관계를 이룬다. 

 

02. 마스터 플랜을 수립할때 우선순위 고려 요소로 적절하지 않은 것은?

1) 전략적 중요도

2) 분석 데이터 적용 수준

 >  적용 범위 및 방식 고려요소이다.

3) 실행 용이성

4) 비즈니스 성과 및 ROI

 

03. 빅데이터 분석방법론의 계층적 프로세스 모델에 대한 설명으로 적절한 것은?

1) 분석 방법론의 최상위 계층은 단계(phase)이고 마지막 계층은 태스크(task)이다. 

 > 단계(Phase) ▷ 테스크(Task) ▷ 스텝(Step) 이라 마지막 계층은 스텝. 

2) 태스크(Task)는 기준선(Baseline)으로 설정되어 관리되어야 하며 버전관리(Configuration Management) 등을 통한 통제가 이루어져야 한다. 

 > 단계(Phase)에 해당 되는 내용

3) 마지막 계층인 태스크(Task)는 입력자료, 출력자료 등으로 구성된 단위 프로세스이다.

 > 마지막 계층은 Step. 입력자료, 처리 및 도구, 출력자료 로 구성된 단위 프로세스는 맞다. 

4) 빅데이터 분석 방법론은 분석 기획, 데이터 준비, 데이터분석, 시스템 구현, 평가 및 전개 단계를 수행하여 빅데이터 분석 프로젝트를 종료한다.

 

05. 비즈니스 모델의 하향식 접근방식(Top Down Approach) 프로세스가 올바르게 연결된 것은?

가. 문제 탐색(Problem Discovery)

나. 문제 정의(Problem Definition)

다. 해결방안 탐색(Solution Search)

라. 타당성 검토(Feasibility Study)

 

가 > 나 > 다 > 라

현황 분석을 통해or인식된 문제점or 전략으로부터 기회나 문제를 탐색(Problem Discovery)하고 해당 문제를 데이터 문제로 정의한 후(Probelm Definition) 해결방안 탐색(Solution Search),  그리고 타당성평가(Feasibility Study)를 거쳐 분석과제를 도출하는 과정이다. 

 

06. 빅데이터 분석방법론의 분석기획(Planning)단계에서의 태스크(task)로 적절하지 않은 것은?

1) 필요 데이터 정의  2) 프로젝트 정의 3) 프로젝트 계획 수립 4) 프로젝트위험계획 수립

 > 분석 기획 ( 비즈니스 이해 및 범위 설정 / 프로젝트 정의 및 계획 수립 / 프로젝트 위험 계획수립)

 > 데이터 준비 ( 필요 데이터 정의 / 데이터 스토어 설계 / 데이터 수집 및 적합성 점검)

 > 데이터 분석 ( 분석용 데이터 준비 / 텍스트 분석 / 탐색적 분석 / 모델링 / 모델 평가 및 검증)

 > 시스템 구현 ( 설계 및 구현 / 시스템 테스트 및 운영) 

 > 평가 및 전개 ( 모델 발전 계획 / 프로젝트 평가 보고 / 평가 및 전개)

 

<3과목 데이터 분석>

02. 통계적 추론에 대한 설명으로 옳지 않은 것은?

1) 점추정은 모집단의 모수를 하나의 값으로 추정하는 것이다.

 > 모수가 특정한 값일것이라 추정하는 것. 모집단에서 표본을 추출하여 모집단의 모수를 추측하는 과정에서 범위가 아니라 가장 참값이라고 여겨지는 하나의 모수를 택하는 것.  

2) 구간 추정은 모수의 참값이 포함되어 있다고 추정되는 구간을 도출하는 것이며, 실제 모집단의 모수는 신뢰구간에 포함되어야 한다.

 > 구간추정이란 일정한 크기의 신뢰수준으로 모수가 특정한 구간에 있을 것이라고 선언하는 것으로 실제 모집단의 모수가 포함되지 않을 수도 있다. 모수가 특정한 구간에 있을 것이라고 추청하는 것. 

3) 제한된 표본을 통해 모집단에 대한 일반적인 결론을 유도하려는 시도이므로 본질에서 불확실성을 수반한다. 

4) 추정이란 전수 조사가 불가능하여 모집단에서 추출한 표본을 근거로 확률론을 활용하여 모집단의 모수를 추론하는 것이다.

 

03. 산점도를 통해 두 변수의 통계적으로 유의한 지 여부를 파악할 수 없다. 

 

08. K-means 군집의 단점으로 적절하지 않은 것은?

1) 잡음이나 이상치의 영향을 많이 받는다. 

2) 사전에 주어진 목적이 없으므로 결과의 해석이 쉽지 않다.

3) 초기 k값이 설정이 쉽지 않고, 적절한 k값을 선택하더라도 최적의 결과를 보장할 수 없다.

4) 한번 군집이 형성되면, 군집 내의 객체들은 다른 군집으로 이동할 수 없다. 

> k-평균 군집은 군집의 단계마다 군집 중심으로부터 오차 제곱 합을 최소화하는 방향으로 군집을 형성해나가나는(부분 최적화) 탐욕적 알고리즘이다. 이것은 계층적 군집에 대한 설명이다.

 

10. A와 B의 키와 체중이 다음과 같을 때, A,B의 유클리드 거리를 구하시오.

A(165, 70), B(170, 65) 

 

13. .연관분석의 측도 관련 문제

 

지지도 (support)

 

신뢰도 (Confidence)

조건부확률 

 

향상도(Lift)

1보다 크면 결과를 예측하는데 있어 해당규칙이 우수하다는 의미.ㅎ

 

 

14. 유의수준 0.05보다 작으면 다중 회귀분석 모형은 통계적으로 유의함을 확인할 수 있다.

 

16. 의사 결정나무 모형에 대한 설명으로 옳지 않은 것은?

1) 이익도표 또는 검정용 자료에 의한 교차 타당성을 등을 이용하여 평가한다.

2) 분리 변수의 P 차원 공간에 대한 현재 분할은 이전 분할의 영향을 받지 않고 이루어지며, 공간을 분할하는 모든 직사각형의 순수도가 가능한 높게 한다.

 > 이전 분할에 영향을 받는다.

3) 각 마디에서의 최적 분리 규칙은 분리 변수의 선택과 분리기순에 의해 결정된다.

4) 가지치기는 분류 오류를 크게 할 위험이 크거나 부적절한 규칙을 가지고 있는 가지를 제거하는 작업이다.

 

17. 시계열 분석에 대한 설명으로 적절하지 않은 것은?

1) 지수평활법은 전체 시계열 자료를 이용하여 평균을 구하고, 최근 시계열에 더 큰 가중치를 적용하는 방법이다.

2) 자기 회귀모형은 자기 상관함수가 빠르게 감수하고 부분 자기상관 함수는 어느 시점에서 절단점을 갖는다.

3) 계절성을 갖는 비정상 시계열을 정상 시계열로 변환할때 계절차분을 사용한다.

4) 이동평균법은 시계열 자료에서 불규칙 변동을 제거하여 계절변동과 추세변동, 순환변동만을 갖는 시계열로 변환하는 방법이다.

 > 이동평균법은 시계열 자료들의 평활에 의해 계절변동 또는 불규칙 변동을 제거하여 전반적인 추세를 뚜렷하게 파악할 수 있도록 하는 방법이다.

 

18. 모집단이 정규분포를 따르고, 신뢰구간이 90%인 모평균에 대한 구간추정은 다음과 같다. 이에 대한 설명으로 적절하지 않은 것은?

1) 모집단의 분산은 1이다.

2) 실제 모집단의 모수는 신뢰구간에 포함되지 않을 수 있다.

3) 불편추정량 중에서 최소의 분산을 가진 추정량이 가장 좋은 추정량이다.

4) 재추출한 표본으로 재분석할때도 신뢰구간은 동일하다. 

 > 재추출한 표본 데이터의 신뢰구간은 동일하지 않다. 

 

19. 감염되었다는 양성을 받은 사람 중 실제로 질병이 있는 사람의 확률은?

- 실제 질병이 있는 사람 중 양성일 확률은 0.9이다. 

- 질병에 걸린 사람의 비율은 0.1이다.

- 양성인 사람은 0.2이다.

> 베이즈 정리 : 이전의 경험과 현재의 증거를 토대로 어떤 사건의 확률을 추론하는 방법.

P(질병|양성) = P(양성|질병) P(질병) / P(양성) = 0.9 * 0.1 / 0.2 = .45

 

20. SOM(Self- Organizing Map)에 대한 설명으로 적절하지 않은 것은?

1) SOM은 입력 벡터들을 신경망에 계속하여 제시하면서 자율적으로 연결 가중치를 변경시키는 방법이다.

2) SOM은 경쟁 학습으로 각각의 뉴런이 입력 벡터와 얼마나 가까운지를 계산하여 연결 강도를 반복적으로 재조정하여 학습한다.

3) 출력 뉴런들은 승자 뉴런이 되기 위해 경쟁하고 오직 승자만이 학습한다.

4) SOM을 이용한 군집분석은 역전파 알고리즘을 사용하여 수행 속도가 빠르고 군집의 성능이 우수하다.

> 신경망 모형은 역전파 알고리즘이지만,  SOM은 전방패스(feedforward flow)를 사용하여 속도가 매우 빠르다.

 

25. 분류 모형평가에서 실제값이 False인 관측치 중 예측치가 적중한 정도에 나타나는 평가지표를 무엇이라 하는가?

특이도, Specificity

 

28. 다음 빈칸에 적절한 용어는?

단순 로지스틱 회귀모형에서 exp( ) 의 의미는 x1,x2,x3...xk가 주어질 때 x1이 한 단위 증가할 때마다 성공(Y=1)의 ( ) 가 증가하는지를 나타난대.

 > 오즈(Odds) 

  >> 로지스틱 회귀분석에서 회귀계수는 해당 변수가 1증가함에 따른 오즈(odds)의 변화량을 의미한다.

 

29. 인공신경망에서 사용하는 활성화 함수 중 출력값z가 여러개 주어지고 목표치가 다 범주일때 각 범주에 속할 사후 확률을 제공하는 활성화 함수는?

 > 소프트맥스  >> 표준화지수. 세개 이상으로 분류하는 다중 클래스 분류에서 사용되는 활성화함수이다. 목표치가 다범주인 경우

  * 시그모이드 함수 : 0~1의 값을 가지며 로지스틱 회귀분석과 유사. 

 

30. 인공신경망 모형에서 역전파(Backpropagation) 알고리즘에서 처음 입력층(input layer)으로 진행할수록 기울기가 점차 작아지다가 나중에는 거의 기울기의 변화가 없어지는 문제를 무엇이라 하는가? 기울기 소실 문제(Vanishing Gradient problem)

'ADsP' 카테고리의 다른 글

ADsP 1과목 데이터 이해 정리  (1) 2023.08.17
ADsP 31회 기출문제 정리  (0) 2023.08.16
ADsP 34회 기출문제 정리  (0) 2023.08.15
ADsP 32회 기출문제  (0) 2023.08.15
ADsP 35회 기출문제 정리  (0) 2023.08.14