开课时间:2012-12-18至2012-12-21
开课地点:上海
培训费用:5000元/人
[课程介绍]
本课程主要介绍数据挖掘的基本概念、基本方法以及在商务决策中的应用。具体的内容包括数据预处理技术(包括数据清理、数据集成和转换等),数据挖掘技术(包括分类、预测、关联和聚类等)以及数据挖掘方法(包括决策树方法、统计方法、关联规则挖掘等),并结合案例分析上述方法在商务决策中的应用。
[课程目标]
系统地熟悉数据挖掘的原理、方法、算法以及应用案例。
对常见的应用领域数据进行挖掘,提高决策质量。
[培训特色]
培训采用实战的方式,整个培训过程学员需要在讲师的指点下动手操作,四天需要利用一种数据挖掘工具,掌握多种数据挖掘方法。
课堂分组练习。数据都来自真实的项目案例。
[讲师背景]
国信高级技术培训中心的资深专家、高级顾问。香港大学和纽约大学访问学者、复旦大学博士后、复旦大学计算机科学技术学院副教授。目前就任于上海复旦大学软件工程硕士电子商务、商务智能等方向专业主任和主讲教师,商务智能上海市精品课程负责人,同时担任SAP软件公司商务智能高级讲师。
主要研究方向包括电子商务、流程管理和智能决策等。
曾担任ICEBE2006-2012,IEEE SMC 2007-2010,ISECS 2009-2010 等多个国际会议程序委员和主席,国内《系统工程学报》、《哈尔滨工业大学学报》、《系统工程与电子技术》、《计算机集成制造系统》、《中国科学技术大学学报》等多个核心刊物以及Service Oriented
Computing and Applications,Software and Systems Modeling 等国际学术刊物的审稿专家,上海市电子商务专家服务团专家,2006 年香港大学访问学者,SAP 大学联盟培训教师,2011 年纽约大学Stern 商学院访问学者。
[课程安排]
时间安排
第一天 课程大纲
一、数据挖掘基础
●数据挖掘的概况和发展
●数据挖掘的过程
1.确定业务问题
2.数据预处理
数据清理
空值处理
冗余和重复
数据集成
数据变换
数据归约
数据挖掘和可视化
评估数据挖掘结果
部署
●数据挖掘过程标准CRISP-DM
●数据挖掘的隐私保护
●数据挖掘的典型应用领域
典型案例分析
AlphaMiner和IBM SPSS Statistics(Modeler)数据挖掘工具简介
第二天 课程大纲
二、聚类分析
●聚类基础
●常用聚类算法
1.k-means算法
2.k-modes算法
3.k-prototypes算法
4.其他聚类方法
基于密度的聚类
基于网格的聚类
基于统计模型的聚类
模糊聚类
●离群点检测
1.基于统计的离群点检测
2.基于距离的离群点检测
3.基于密度的离群点检测
三、分类分析
●贝叶斯分类器>
1.贝叶斯定理
2.朴素贝叶斯分类器
●决策树
1.决策树的属性选择
2.连续属性的离散化方法
3.ID3、C4.5等决策树算法
4.决策树算法的可伸缩性
5.决策树的过拟合和修剪
6.分类模型的评估
●支持向量机
●其他分类方法
1.k最近邻分类器
2.基于案例的推理
3.BP神经网络
典型案例分析:业务流程分析
分类和聚类实验
第三天 课程大纲
四、关联分析
●关联分析常用算法
1.Apriori算法
频繁项目集
强关联规则
2.FP增长算法
构造FP树
利用FP树产生频繁项集
3.其他关联规则挖掘算法
约束性关联规则挖掘算法
增量式关联规则挖掘算法
多层关联规则挖掘
●序列模式挖掘
1.类Apriori算法
●回归分析
1.一元回归分析
2.多元线性回归分析
3.其他回归分析
●时间序列分析
典型案例分析
关联和回归分析实验
第四天 课程大纲
五、Web挖掘基础
●Web挖掘的分类
●Web内容挖掘
1.Web文本挖掘
文本概括
文本分类
文本聚类
●Web文本挖掘的应用
1.搜索引擎领域
2.自然语言理解领域
●Web多媒体挖掘
1.多媒体索引和检索
2.多媒体数据泛化和多维分析
3.多媒体数据的分类与预测
4.多媒体数据的关联分析
●Web结构挖掘
1.Web结构挖掘主要方法
PageRank算法
HITS算法
2.Web结构挖掘的应用
信息检索
社区识别
网站优化
1.Web日志挖掘
Web日志挖掘过程
Web日志挖掘的应用
1.改进系统性能
2.网站结构优化
3.电子推荐
典型案例分析
Web挖掘实验
参考教材:
赵卫东. 商务智能(第二版). 北京:清华大学出版社,2011
赵卫东. 流程智能. 北京:清华大学出版社,2012
报名热线:
● 电话: 0512-62861389
●联系人: 杜先生
● E-mail:chinabi@126.com
● QQ: 37971343
|