本书旨在提供一个比较全面且实用的关于大数据挖掘基本概念、方法、工具、技术及应用的指南。本书共9章,包含3部分内容。第1部分介绍大数据挖掘的基础知识、概念和方法,包括大数据的概念、发展阶段和特征,大数据挖掘的概念、标准过程模型、主要任务等内容。第2部分重点介绍具体工具与技术,包括Python的基本语法、NumPy工具包、Pandas工具包、ScikitLearn工具包和Matplotlib绘图,以及Hadoop中的MapReduce框架和Spark大数据处理技术,目的是帮助读者将数据挖掘的方法和算法落到实处,同时训练读者解决大数据挖掘实际问题的能力。第3部分为数据挖掘案例,包括关于分类、聚类、关联规则挖掘等应用主题的案例,每个案例都展示了一个数据挖掘项目的具体过程和细节,个别案例还给出了Python的实现方法与代码,目的是为读者模仿、修改、拓展、延伸、创新以及运用所学数据挖掘技术解决实际应用问题提供原型。 本书的主要特色是在重点关注数据挖掘理论、方法与算法的同时,也适当兼顾数据挖掘的实现工具以及应用,并将它们融合,读者通过学习能够具备一定解决实际应用问题的能力。 本书可作为高年级本科生的数据挖掘等课程的教材,也可作为研究生相关课程的教材,还可作为对大数据挖掘与分析感兴趣的学习者和在企业从事业务数据分析的人士的参考书。为方便教师教学,本书配套了电子教学课件。
本书旨在提供一个比较全面且实用的关于大数据挖掘基本概念、方法、工具、技术及应用的指南。本书共9章,包含3部分内容。第1部分介绍大数据挖掘的基础知识、概念和方法,包括大数据的概念、发展阶段和特征,大数据挖掘的概念、标准过程模型、主要任务等内容。第2部分重点介绍具体工具与技术,包括Python的基本语法、NumPy工具包、Pandas工具包、ScikitLearn工具包和Matplotlib绘图,以及Hadoop中的MapReduce框架和Spark大数据处理技术,目的是帮助读者将数据挖掘的方法和算法落到实处,同时训练读者解决大数据挖掘实际问题的能力。第3部分为数据挖掘案例,包括关于分类、聚类、关联规则挖掘等应用主题的案例,每个案例都展示了一个数据挖掘项目的具体过程和细节,个别案例还给出了Python的实现方法与代码,目的是为读者模仿、修改、拓展、延伸、创新以及运用所学数据挖掘技术解决实际应用问题提供原型。 本书的主要特色是在重点关注数据挖掘理论、方法与算法的同时,也适当兼顾数据挖掘的实现工具以及应用,并将它们融合,读者通过学习能够具备一定解决实际应用问题的能力。 本书可作为高年级本科生的数据挖掘等课程的教材,也可作为研究生相关课程的教材,还可作为对大数据挖掘与分析感兴趣的学习者和在企业从事业务数据分析的人士的参考书。为方便教师教学,本书配套了电子教学课件。
随手扫一扫~了解多多