알라딘

하둡과 스파크를 활용한 실용 데이터 과학
오퍼 멘델리비치, 케이시 스텔라, 더글라스 에드라인 (지은이), 이춘오 (옮긴이) | 길벗 | 2017년 8월

미리보기

최저가 : -원 I 최고가 : -원
재고 : 0부

쇼핑목록 추가

출력하기

- 쇼핑목록에 추가하신 후 목록을 출력하시면 매장에서 간편하게 상품을 찾을 수 있습니다.

[대전시청역점] 서가 단면도

(0)

하둡과 스파크가 대규모 데이터 과학 문제를 해결할 수 있는 효과적인 플랫폼으로 진화해 온 과정과 그 이유를 설명한다. 데이터 엔지니어링 전 과정을 파악하고, 핵심 개념을 개괄적으로 배우고 실용적 구현 사례를 학습하도록 데이터 입수, 데이터 개조 그리고 시각화의 여러 단계에 대한 실용적인 가이드라인을 제시하고 있다. 머신러닝, 감성 분석을 위한 예측 모델링, 문서 분석을 위한 군집화, 이상 탐지 그리고 자연어 처리에 이르는 다양한 응용 사례를 접할 수 있다.

1부 하둡을 활용한 데이터 과학의 개요

1장 데이터 과학
__1.1 데이터 과학이란 무엇인가?
__1.2 데이터 과학의 예: 검색 광고
__1.3 데이터 과학의 간략한 역사
____1.3.1 통계학과 머신 러닝
____1.3.2 인터넷 거인들이 가져온 혁신
____1.3.3 현대 기업의 데이터 과학
__1.4 데이터 과학자가 되는 길
____1.4.1 데이터 엔지니어
____1.4.2 응용과학자
____1.4.3 데이터 과학자로 전직하는 방법
____1.4.4 데이터 과학자가 갖춰야 할 소프트 스킬
__1.5 데이터 과학팀 구성하기
__1.6 데이터 과학 프로젝트의 생명 주기
____1.6.1 적절한 질문
____1.6.2 데이터 입수
____1.6.3 데이터 정제: 데이터 품질 관리
____1.6.4 데이터 탐색과 모델 특징 변수 설계

더보기

지은이 : 오퍼 멘델리비치 (Ofer Mendelevitch)

최근작 :	<하둡과 스파크를 활용한 실용 데이터 과학> … 총 2종 (모두보기)
소개 :	렌드업(Lendup)의 데이터 과학 VP로, 머신러닝과 고급 분석 그룹을 이끌고 있다. 이전에는 호튼웍스의 데이터 과학 디렉터를 역임하며 의료, 금융, 리테일 등 여러 산업에 하둡과 스파크를 전파하였다.

지은이 : 케이시 스텔라 (Casey Stella)

최근작 :	<하둡과 스파크를 활용한 실용 데이터 과학> … 총 2종 (모두보기)
소개 :	호튼웍스의 수석 데이터 과학자며, 아파치 메트론이라는 사이버 보안 오픈 소스 프로젝트의 분석과 데이터 과학팀을 이끌고 있다. 이전에는 의료 정보학 스타트업인 익스플로리스(Explorys)의 아키텍트로 근무하였다.

지은이 : 더글라스 에드라인 (Doug Eadline)

최근작 :	<하둡과 스파크를 활용한 실용 데이터 과학> … 총 3종 (모두보기)
소개 :	리눅스 고성능 컴퓨팅의 혁명을 목격한 기록자이자 실무자로 커리어를 시작했다. 2017년 현재 빅데이터 분야의 기술 저자이자 고성능 컴퓨팅과 데이터 분석 산업의 컨설턴트로 활동하고 있다.

옮긴이 : 이춘오

최근작 :	… 총 7종 (모두보기)
소개 :	KAIST 정보통신공학과 학사 및 박사 학위를 취득하고, 삼성전자에서 빅데이터 플랫폼 엔지니어로 근무했으며, 현재는 SK 플래닛의 데이터 과학자로 재직 중이다. 11번가의 다양한 데이터를 바탕으로 각종 예측 모델을 구축하고 데이터 기반 서비스를 개발하는 업무를 하고 있다.

길벗 도서 모두보기 신간알리미 신청
최근작 :	<유니티 교과서>,<AI 디자인>,<연봉이 달라지는 실전 보고서 작성법>등 총 734종
대표분야 :	오피스(엑셀/파워포인트) 1위 (브랜드 지수 312,200점), 그래픽/멀티미디어 2위 (브랜드 지수 288,020점), 이유식 3위 (브랜드 지수 22,247점)

호튼웍스 데이터 과학팀이 알려주는 실용 데이터 과학
이 책은 하둡과 스파크를 활용해 대규모 데이터 분석을 수행하고자 하는 데이터 과학자, 데이터 엔지니어, 비즈니스 이해 관계자를 대상으로 한다. 데이터 엔지니어링 전 과정을 파악하고, 핵심 개념을 개괄적으로 배우고, 실용적 구현 사례를 학습한다. 하둡을 손쉽게 시작할 수 있도록 호튼웍스의 가상 머신 샌드박스를 사용해 실습한다.

데이터 과학과 하둡 & 스파크로 안내하는 완벽한 가이드

데이터 과학과 현대 하둡 생태계의 정수를 소개한다.
하둡과 스파크가 대규모 데이터 과학 문제를 해결할 수 있는 효과적인 플랫폼으로 진화해 온 과정과 그 이유를 설명한다. 더불어 데이터 과학의 응용 사례를 포괄적으로 다루며, 데이터 입수, 데이터 개조 그리고 시각화의 여러 단계에 대한 실용적인 가이드라인을 제시한다.

데이터에 대한 기초 지식을 다진 ...

(주)알라딘커뮤니케이션 대전시청역점

영업시간 : 오전 9시 30분~오후 10시 | 매장통합 콜센터 : 1544-2514
주소 : 대전광역시 서구 둔산로 125 둔산동 스타 빌딩 3층 위치보기

구매안전 에스크로 서비스 가입 확인

고객센터 1544-2514 (발신자 부담)

서울시 마포구 백범로 71 숨도빌딩 7층 Fax 02-6926-2600

1:1 문의 FAQ

중고매장 위치, 영업시간 안내

중고매장

서울

경기

광역시 등

(주)알라딘커뮤니케이션 대전시청역점

고객센터 1544-2514 (발신자 부담)