Data_Mining_Concepts_and_Techniques

作者:Jiawei Han (加)(加)Micheline Kamber 译者:范明 孟小峰

内容简介
本书第2版在十分丰富和全面的第1版基础上进行了更新和改进,并增添了新的重要课题,例如挖掘流数据、挖掘社会网络和挖掘空间、多媒体和其他复杂数据。本书将是一本适用于数据挖掘和知识发现课程的优秀教材。.
——Gregory Piatetsky-Shapiro, KDnuggets的总裁
科学的飞速发展使产生和收集数据的能力快速增长。大多数商业、科学和政府事务的日益计算机化,数码相机、发布工具和条码的广泛应用都产生着大量的数据。在数据收集方面,扫描的文本和图像平台、卫星遥感系统和互联网已经使我们生活在海量的数据之中。这种爆炸性的数据增长促使我们比以往更迫切地需要新技术和自动化工具,以帮助我们将这些数据转换为有用的信息和知识。..
本书第1版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的技术研究进展,重点关注其可行性、有用性、有效性和可伸缩性问题。第1版出版之后,数据挖掘领域的研究又取得了很大的进展,开发出了新的数据挖掘方法、系统和应用。第2版在这方面进行了充实,增加了多个章节讲述最新的数据挖掘方法,以便能够挖掘出复杂类型的数据,包括流数据、序列数据、图结构数据、社会网络数据和多重关系数据。
本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材,同时也适宜作为数据挖掘研究人员和相关专业人士的参考书。

本书特点:
● 全面实用地论述了从实际业务数据中抽取出读者需要的概念和技术。
● 结合读者的反馈,反映数据挖掘领域的技术变化以及统计和机器学习方面的进展。
● 引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。

前言:

我们产生和收集数据的能力正在迅速提高。起作用的因素包括商务、科学技术和政府部门在内的事务处理的计算机化;数码相机、出版工具和用于大部分商用产品的条码的广泛使用;由文本和图像扫描平台到卫星遥感系统的数据收集工具的进步。此外,作为全球信息系统的万维网的流行,已经将我们淹没在数据和信息的汪洋大海中。存储数据或瞬态数据的爆炸性增长业已激发对新技术和自动工具的需求,这些技术和工具能够以智能方式将海量数据转换成有用的信息和知识。.
本书考察数据挖掘的概念和技术。数据挖掘是数据和信息系统及其应用的一个有希望的、欣欣向荣的学科前沿。数据挖掘通常又称为数据中的知识发现(KDD)...