![]() |
| 새책 | eBook | 알라딘 직접배송 중고 | 이 광활한 우주점 | 판매자 중고 (19) |
| 36,000원(절판) | 출간알림 신청![]() | - | - | 2,900원 |
하둡을 이용한 대용량 데이터 마이닝 기법!
웹과 인터넷 상거래의 발달로 엄청난 규모의 데이터가 생성되고 있으며, 데이터 마이닝으로 이런 데이터에서 유용한 정보를 얻는 것이 가능하다. 이 책 『빅데이터 마이닝』은 데이터 마이닝 분야의 핵심 과제를 해결하고 대규모 데이터에 적용할 수 있는 현실적인 알고리즘에 초점을 맞추었다.
알고리즘의 자동 병렬처리를 위해 중요하게 사용되는 툴인 맵리듀스 프레임워크에 대한 논의로 책을 시작한다. 이후 지역성 기반 해싱 기법을 설명한다. 이는 대규모로 수집된 데이터에서 비슷한 객체를 일일이 비교하지 않고 찾아내기 위한 기본 지식 체계이기 때문에 알아둘 필요가 있다. 또한 정확한 처리를 위해 매우 빨리 입력되는 데이터를 마이닝하는 스트림 처리 알고리즘을 설명한다. 그리고 웹 체계화를 위한 페이지랭크 개념 및 이와 관련된 기법들을 다룬다.
나머지 장에서는 빈발 항목 집합 찾기와 클러스터링, 그리고 이 각각을 메인 메모리에 담을 수 없을 정도로 큰 데이터 관점에서 처리하는 방법, 그 외 전자상거래에서 중요하게 사용되는 추천 시스템 및 웹 광고에 대해 다룬다. 제2판에는 소셜 네트워크와 머신 러닝 및 차원 축소 기법이 포함됐다. 데이터베이스와 웹 기술을 선도하는 학자들이 쓴 이 책은 전공자들과 실무자들에게 유용한 책이 될 것이다.




