KNOU STUDYREAD

한국방송통신대학교 통계데이터과학과 블로그

CS & Department of Statistics and Data Science

통계데이터과학과 및 컴퓨터과학 독서

Part 02-1-3,4. 분석 과제 발굴 및 프로젝트 관리 방안

Harryㅤ 2022. 7. 3.

 

분석과제 발굴 방법론 : 풀어야 할 문제 -> 데이터 분석 문제 변환 -> 과제 정의서 형태 도출

 

분석과제도출 2가지 유형

하향식(top-down approach) 접근법 : 전통적인 분석 과제 발굴 방식이며 대규모의 데이터 생성과 동시에 빠르게 변하는 환경에서는 적용하기 어려운 문제가 있다.

상향식(bottom up approach) 접근법 : 현황 분석을 통해 문제를 탐색 -> 문제 정의 -> 해결방안 탐색 -> 데이터 분석의 타당성 평가 -> 분석 과제 도출

디자인 사고(design thinking) 접근법 : 상향식 접근 방식과 하향식 접근 방식의 발산, 수렴을 반복적 수행하는 기법이며 최적의 의사결정 방식.


분석과제 관리를 위한 5가지 영역

1) data size : 분석하고자 하는 데이터의 양. 하둡과 DBMS에서의 생성되는 데이터 양은 상이하므로 이를 고려해야함
2) data complexity : 텍스트, 오디오, 비디오 등 비정형 데이터들을 통합하여 분석 프로젝트 이행시에는 이에 잘 적용될 수 있는 분석 모델을 산정해야함
3) speed : 프로젝트 수행 시 분석 모델의 성능과 속도를 고려해야함
4) analytic complexity : 분석 모델이 복잡할 수록 정확도는 올라가지만 해석의 어려움도 증가한다. 해석이 가능하면서도 동시에 정확도도 높일 수 있는 최적 모델을 고려해야함
5) accuracy & precision : 정확도와 일관성은 각 활용적 측면에서의 정확성, 안정성 측면에서 일관성을 말하며 이 둘을 고려해야함