|
|||||
[대전시청역점] 서가 단면도
|
하둡과 스파크가 대규모 데이터 과학 문제를 해결할 수 있는 효과적인 플랫폼으로 진화해 온 과정과 그 이유를 설명한다. 데이터 엔지니어링 전 과정을 파악하고, 핵심 개념을 개괄적으로 배우고 실용적 구현 사례를 학습하도록 데이터 입수, 데이터 개조 그리고 시각화의 여러 단계에 대한 실용적인 가이드라인을 제시하고 있다. 머신러닝, 감성 분석을 위한 예측 모델링, 문서 분석을 위한 군집화, 이상 탐지 그리고 자연어 처리에 이르는 다양한 응용 사례를 접할 수 있다.
1부 하둡을 활용한 데이터 과학의 개요
|