一、前 言 数据挖掘是为统计等专业本科生开设的专业必修课。该课程是一种高级数据处理和分析技术。本课程主要讲授数据挖掘的基本概念,原理、方法和技术,具体包括:数据的预处理、分类预测、关联挖掘、聚类分析等内容。本课程采用理论课与实验课结合的授课方式,帮助学生在理论学习的基础上同时掌握一些R软件的操作。通过本课程学习,可以使学生了解数据挖掘这种现代数据分析和知识挖掘方法的思想与技术,熟悉数据挖掘的基本理论,掌握数据挖掘方法,并使学生具有进一步学习的基础与能力。能熟练地应用R软件对现实数据进行有效的分析,获取有价值的信息。 本大纲的制订主要依据《数据挖掘》(韩家炜)和《数据挖掘:R语言实战(黄文)》。前者完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容;后者依据实例讲解了相关数据挖掘方法的R实现。本课程按课程设计选取了部分内容,且在部分相关章节补充相应的理论和R软件的操作。 二、参考书目 [1](美)韩家炜(Han,J.)等.范明等译,数据挖掘:概念与技术(原书第3版),北京:机械工业出版社,2012年7月. [2]黄文,王正林,数据挖掘:R语言实战, 北京:电子工业出版社,2014年6月. [3]李洪成,陈道轮,吴立明译,数据挖掘与R语言,北京:机械工业出版社,2013年4月. [4]陈堰平,邱怡轩,潘岚锋,熊熹译,R语言编程艺术,北京:机械工业出版社,2013年5月. 三、教学时数分配表(共54学时) 教学内容 理论课学时 实验课学时 第一章 数据挖掘概述 3 0 第二章 数据特征 3 0 第三章 数据预处理 9 3 第四章 关联分析(关联规则挖掘) 3 3 第五章 分类与预测 9 6 第六章 聚类分析 9 6 合计 36 18 四、授课对象 授课对象:应用统计学本科。 五、教学方式(授课形式和考核方式) 教学方式:课堂教授为主,辅助教师演示,学生网络教学平台自学,学生上机实习。 考核方式:期末70%-100%,平时成绩(包含平时作业、上机实习、课堂提问和考勤)0%-30%。