ADsP(Advanced Data Analytics Semi-Professional) 자격증의 기출문제 분석을 아래와 같이 정리해드리겠습니다.
1. 시험 개요
ADsP 자격증은 데이터 분석 기초부터 실무 적용 능력까지 평가하는 국가공인 데이터 분석 준전문가 자격입니다. 시험은 주로 데이터 분석 기초, 데이터 수집 및 전처리, 데이터 분석 기법, 데이터 시각화 및 결과 해석 영역을 다룹니다.
2. 기출문제 출제 영역 및 비중
3. 기출문제 유형 분석
객관식 문제 중심이며, 단순 암기보다는 개념 이해와 적용 능력을 평가하는 문제가 많음
사례형 문제도 일부 출제되어, 실제 데이터 분석 상황에서 적합한 기법과 절차를 묻는 문제가 증가 추세
통계학 기본 개념(평균, 분산, 상관관계 등)과 데이터 전처리 방법(결측치 처리, 이상치 탐지 등)에 대한 이해도가 필수
회귀분석, 군집분석, 분류 알고리즘 등 주요 분석 기법의 원리와 특징을 묻는 문제가 자주 출제
데이터 시각화에서는 차트 유형별 적합 용도와 해석 능력 평가가 이루어짐
4. 기출문제 예시
통계 기초 : 표본평균과 모집단 평균의 차이점은 무엇인가?
모범답안 : 모집단 평균은 전체 모집단의 모든 데이터를 포함하여 계산한 평균값으로, 모집단의 중심 위치를 나타낸다. 반면 표본평균은 모집단에서 추출한 일부 표본 데이터의 평균값으로, 모집단 평균을 추정하기 위한 값이다. 표본평균은 표본에 따라 달라질 수 있으며, 모집단 평균에 근접하도록 표본 크기가 클수록 정확도가 높아진다.
데이터 전처리 : 결측치가 많은 데이터에서 적용할 수 있는 처리 방법을 3가지 제시하시오.
모범답안 :
삭제법: 결측치가 있는 행(row) 또는 열(column)을 제거하는 방법. 결측치 비율이 낮을 때 효과적이나, 데이터 손실이 발생할 수 있다.
대체법: 평균, 중앙값, 최빈값 등으로 결측치를 대체하거나 회귀분석, KNN, 다중대체법(Multiple Imputation)을 활용하여 예측 대체하는 방법.
모델 기반 처리: 결측치를 포함하는 상태로 학습 가능한 알고리즘을 사용하거나, 결측치 여부를 별도의 변수로 추가하여 모델에 반영하는 방법이다.
분석 기법 : 로지스틱 회귀분석의 적용 목적과 기본 가정을 서술하시오.
모범답안 :
적용 목적: 로지스틱 회귀분석은 종속변수가 이진(두 가지 범주) 형태일 때, 독립변수와의 관계를 분석하여 특정 사건이 발생할 확률을 예측하는 데 사용된다.
기본 가정:
독립변수와 종속변수 사이의 관계가 선형 로짓 함수 형태를 가진다.
독립변수들 간에 다중공선성이 없어야 한다.
관측치들은 서로 독립적이다.
데이터는 충분한 표본 크기를 가져야 한다.
시각화 및 활용 : 막대그래프와 히스토그램의 차이점과 각각의 적합한 활용 사례를 설명하시오.
모범답안 :
차이점 : 막대그래프는 범주형 데이터의 각 항목별 빈도나 크기를 비교할 때 사용하며, 각 막대 사이에 간격이 존재한다.
히스토그램은 연속형 데이터의 구간별 빈도 분포를 나타내며, 막대들이 서로 붙어 있어 연속성을 표현한다.
활용 사례 :
막대그래프: 제품별 판매량 비교, 설문조사 응답 빈도 등 범주형 데이터 시각화에 적합하다.
히스토그램: 시험 점수 분포, 고객 구매 금액 분포 등 연속형 데이터의 분포 파악에 적합하다.
5. 기출문제 출제 경향
기본 개념 중심: 데이터 분석의 기초 통계 및 용어 이해 문제 비중이 높음
실무 적용 강조: 단순 이론 문제보다 실제 사례를 기반으로 한 문제 출제가 늘어나고 있음
데이터 전처리 중요성 부각: 결측치, 이상치 처리 등 데이터 품질 관리 문제 자주 출제
분석 기법 이해와 비교: 여러 분석 기법의 특징과 적용 조건을 이해하고 비교하는 문제 출제
결과 해석 및 시각화 역량 중시: 분석 결과를 올바르게 해석하고 효과적으로 전달하는 능력 평가
6. 효과적인 시험 대비 방법
기본 통계 개념과 데이터 전처리 방법을 확실히 숙지
주요 분석 기법(회귀, 분류, 군집, 시계열 등)의 원리와 적용 사례 학습
데이터 시각화 도구 및 차트 유형별 특성 이해
기출문제 풀이를 통한 문제 유형 및 출제 경향 파악
실제 사례 중심의 문제 해결 능력 강화