ADSP기출 6

ADsP(비전공자 독학)3과목/3장 데이터마트

"iris"라는 데이터셋에서 데이터의 내용을 조회할 때, R프로그램으로 적절한 것은? -sqldf("select*from iris") 결측치에 대한 설명으로 부적절한 것 1. 해당 칸이 비어있는 경우 결측치 여부는 알기 쉽다. 2. 관측치가 있지만 실상은 default값이 기록된 경우에도 결측치로 처리해야 하는 것이 바람직하다. 3. 결측치가 있는 경우 다양한 대치방법을 사용하여 완전한 자료로 만든 후 분석을 진행할 수 있다. 4. 결측치가 20%이상인 경우에는 해당 변수를 제거하고 분석해야 한다. -관측치가 기록된 값을 결측치로 처리하여 분석에 활용하는 것은 옳지 않다. default 값이 기록된 경우라도 그 값의 의미를 가지고 있기 때문에 결측치로 처리하면 분석에 큰 오류로 작용할 수도 있다. 이상값..

자격증/ADsP 2021.10.29

ADsP(비전공자 독학)3과목/2장 R프로그래밍 기초

R의 데이터 구조 중 벡터에 대한 설명으로 적절한 것 1. 벡터는 행과 열을 갖는 M*N 형태의 직사각형에 데이터를 나열한 데이터 구조이다. 2. 벡터는 하나의 스칼라 값 또는 하나 이상의 스칼라 원소들을 갖는 단순한 형태의 집합이다. 3. 벡터는 행렬과 유사한 2차원 목록 데이터 구조이다. 4. 벡터는 숫자로만 구성되어야 한다. -한 벡터의 모든 원소는 같은 자료형(숫자 또는 문자)로 구성된다. 벡터는 행렬구조로 나타나지 않는다. 연속형 변수의 경우 4분위수, 최소값, 최대값, 중앙값, 평균 등을 출력하고 범주형 변수의 경우 각 범주에 대한 빈도수를 출력하여 데이터의 분포를 파악할 수 있게 하는 함수 -summary 함수 다음 중 아래의 R코드를 수행한 결과에 대한 설명으로 옳은 것? > C(2,4,6..

자격증/ADsP 2021.10.29

ADsP(비전공자 독학)3과목/1장 데이터 분석 개요

모델링 성능을 평가함에 있어, 데이터마이닝에서 활용하는 평가 기준이 아닌것은? 1. 정확도 2. 리프트 3. 디렉트 레이트 4. Throughput -데이터마이닝에서는 정확도, 정밀도, 디렉트 레이트, 리프트 등의 값으로 판단하고, 시뮬레이션에서는 Throughput, average waiting time, average queue length, time in system 등의 지표가 활용된다. 탐색적 데이터 분석의 목적은 데이터를 이해하는 것이다. 부적절한 것은 1. 데이터에 대한 전반적인 이해를 통해 분석 가능한 데이터인지 확인하는 단계이다. 2. 탐색적 데이터 분석 과정은 데이터에 포함된 변수의 유형이 어떻게 되는지를 찾아가는 과정이다. 3. 데이터를 시각화하는 것만으로는 이상점 식별이 잘 되지 않..

자격증/ADsP 2021.10.27

ADsP(비전공자 독학)2과목. 데이터 분석 기획 (단답형)

ADsP 데이터 분석 준전문가 시험은 객관식뿐만 아니라 서술형도 10문제(20점) 출제되기 때문에 시험 전에 간단히 읽어보시기에 도움이 될 것 같아요 ! 분석 방법론의 "시스템 구현" 단계에서 시스템으로 구현된 모델은 검증을 위하여 단위테스트, 통합테스트, 시스템 테스트 등을 실시한다. 이중 시스템테스트는 품질관리 차원에서 진행함으로써 적용된 시스템의 객관성과 안정성을 확보한다. 데이터 거버넌스 체계에서 데이터 저장소관리란 메타데이터 및 표준 데이터를 관리하기 위한 전사차원의 저장소로 구성된다. 저장소는 데이터 관리 체계 지원을 위한 워크 플로우 및 관리용 응용소프트웨어를 지원하고 관리 대상 시스템과의 인터페이스를 통한 통제가 이루어져야 한다. 또한 데이터 구조 변경에 따른 사전영향평가도 수행되어야 효율..

자격증/ADsP 2021.10.27

ADsP(비전공자 독학)2과목. 데이터 분석 기획 (오답+헷갈리는 부분 정리)

지속적인 분석 내재화를 위한 "장기적인 마스터 플랜 방식"에 비하여 "과제 중심적인 접근 방식"의 특징으로 적절하지 못한것 1. Quick-Win 2. Accuracy & Deploy 3. Problem Solving 4. Speed & Test -목표시점 별로 당면한 과제를 빠르게 해결하는 "과제 중심적인 접근 방식"과 지속적인 분석 내재화를 위한 "장기적인 마스터 플랜 방식"으로 나눌 수 있다. 분석기획에서는 문제해결을 위한 단기적인 접근방식과 분석과제 정의를 위한 중장기적인 마스터 플랜 접근방식을 융합하여 적용하는 것이 중요하다. 구분 당면한 분석 주제의 해결 (과제 단위) 지속적 분석 문화 내재화 (마스터 플랜 단위) 1차목표 Speed&Test Accuracy&Deploy 과제의 유형 Quick..

자격증/ADsP 2021.10.27

ADsP(비전공자 독학) 1과목. 데이터이해 (단답형)

데이터 사이언티스트가 갖춰야 할 역량은 빅데이터의 처리 및 분석에 필요한 이론적 지식과 기술적 숙련에 관련된 능력인 하드스킬과 데이터 속에 숨겨진 가치를 발견하고 새로운 발전 기회를 만들어 내기 위한 능력인 소프트스킬로 나누어진다. 구분 요구역량 내용 하드스킬 빅데이터에 대한 이론적 지식 분석 기술에 대한 숙련 관련 기법에 대한 이해와 방법론 습득 최적의 분석 설계 및 노하우 축적 소프트스킬 통찰력 있는 분석 설득력 있는 전달 다분야간 협력 창의적 사고, 호기심, 논리적 비판 스토리텔링, 시각화 커뮤니케이션 정보는 데이터의 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그 의미를 부여한 것이며, 지식을 도출하기 위한 재료가 된다. -DIKW 피라미드: 데이터, 정보, 지식을 통해 최종적으로 지혜를 얻..

자격증/ADsP 2021.10.26