载入中…
公告栏:
当前位置: 中国商业智能网 >> CIO >> 数据挖掘
  •  什么是数据挖掘:
  •  数据挖掘方法:
  •  知识发现9大步骤:
  • 数据挖掘是数据库知识发现(KDD)过程中应用数据分析和发现算法中"知识发现9大步骤"的第7个步骤:寻找一种特定的表现形 式或一组这些表征的兴趣模式,包括分类规则或树型、回归与聚类。用户可以大大帮助数据挖掘方法以正确执行前面的步骤。
    一种透过数理模式来分析企业内储存的大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法。
    在可接受的计算效率的局限性之内,在数据上产生一种特殊的列举模式(或模型)。
    模式的空间通常是无限的而且模式的列举包括对该空间某种形式的探索与研究。

    数据挖掘

    分类(Classification):是学习一种将某一项数据映射(分类)到几个预定义分类中的一种功能;
    回归(Regression):是学习一种将某一项数据映射到取值为R的预测变量的功能;
    聚类(Clustering):是一种常见的描述性任务旨在确定在一组有限级的类别或聚类来描述数据;
    总计(Summarization):包括为一个数据集找到一种简洁描述的方法;
    依赖(Dependency) 模型:是要找到一种模型来描述存在于两个层次上依赖模型之间显著的依赖性;
    对变化和差异的检测集中在从先前的测量或规范值中发现最值得注意的数据;
    数据挖掘算法的组件;
    模型的表示是用来描述模式发现的语言;
    评价标准是模型在一个特定的模式上如何满足数据库知识发现 (KDD) 过程的目标的定量语句(或功能调整);
    搜索方法由两个组件组成:1)搜索参数;2)模型搜索;
    一旦模型表示方法和模型评价标准建立起来,那么数据挖掘的问题就降至为仅仅是一种优化任务,找出模型优化标准。
    详细请看:“知识发现”和“数据挖掘”之间的区别
    1. 对应用领域的开发和认识,并有相关的经验知识和从客户的角度识别数据库知识发现 (KDD) 过程的目标;
    2. 创设一个数据集的目标:选择数据集,或者聚焦于一组用于发现的变量或数据样本;
    3. 数据清洗和预处理。基本操作包括去除错误数据,收集必要的信息建模或处理缺失数据的策略以及信息时间顺序和变化;
    4. 数据压缩和投影:根据任务的目的寻找有用的特征呈现数据。通过降维的方法,对有效的变量数目可能减少的数据表示;
    5. 匹配过程目标:特别数据挖掘方法 (步骤1)的数据库知识发现 (KDD)。例如,总计、分类、回归、聚类和其它;
    6. 建模和探索性分析与假设的选择:选择算法和数据挖掘并选择用于寻找数据模式的方法。最终用户对预测能力更有兴趣;
    7. 数据挖掘:寻找一种特定的表现形式或一组这些表征的兴趣模式,包括分类规则或树型、回归与聚类;
    8. 解释挖掘模式,可能为另外的迭代再回到步骤1至7之间的有些步骤。这一步包含提取模式和给予绘制模型的可视化数据;
    9. 知识发现:直接利用知识结合另一个系统知识进一步地行动,或简单地记录并向利益相关者报告,检查和分辨之前冲突。
    详细请看:“知识发现”和“数据挖掘”之间的区别
    数据挖掘文章列表
    固顶文章满足市场需求的六项优势研究生课程08-15
    位于芝加哥的西北大学提供了预测分析理科硕士的课程。这个课程迎合了在跨领域的数据分析方面有感兴趣的人,为在数据建模、管理、沟通和分析方面有兴趣的人提供实用的训练。这些技能是有兴趣致力于销售规划、市场调研、市场营销和业务分析的人必需的。
    固顶文章“知识发现”和“数据挖掘”之间的区别08-10
    数据挖掘是数据库知识发现(KDD)过程中应用数据分析和发现算法的一个步骤(第七个步骤),在可接受的计算效率的局限性之内,在数据上产生一种特殊的列举模式(或模型)。数据库知识发现 (KDD) 是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。
    固顶文章数据挖掘师的数据挖掘奖金08-08
    足智多谋的数据挖掘师很认真地为300万美元大奖竞标。澳大利亚的三个团队进入一场竞赛,去为努力帮助医生积极治疗病人并节省数千万的美元而去获得加利福尼亚医疗保健机构提供的近323万美元的奖金。
    固顶文章国际ACM知识发现和数据挖掘大会08-05
    涵盖知识发现和数据挖掘(KDD)、预测分析、大数据分析技术和大数据库中发现模式等重要领域的世界领先会议,将于2011年8月21日- 24日在圣地亚哥召开。
    普通文章CIO该如何借助数据挖掘提升企业核心管理04-22
    笔者在利用数据方面作了多方面探索,有以下三点深刻体会:一是数据分析不在于用什么工具,而在于能不能从数据中得到有用的信息并影响企业的业务与管理。很多 CIO一听到数据分析,马上就联想到 数据仓库、 数据挖掘等昂贵的BI软件,其实,在实践中……
    普通文章数据挖掘操作必须在数据仓库基础上进行04-22
    人们对数据的处理需求可以分为两种类型,操作型处理(OLTP)和分析型处理(OLAP),传统的数据库主要是面向OLTP,注重数据的计算、记录的插入、删除、与修改,以及简单的查询和统计。它的主要任务是进行事务处理,所关注的是事务处理的及时性、完整性和正确性,而在数据的分析处理方面存在着严重的不足,主要表
    普通文章细数数据挖掘的五个超赞免费开源软件04-22
    本篇文章介绍五个免费开源的数据挖掘软件  ORANGE    ORANGE 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 PYTHON以进行脚本开发。
    普通文章BI并非"贵族"专用 中小企业更需数据挖掘04-22
    由于BI软件的价格昂贵,人们一直认为中小企业中用不起BI系统,也不需要BI系统。其实不同的企业信息化程度并不一致,中小企业也可根据自身信息化的状况,选择合适的BI软件。事实上,正是因为中小企业规模小,生存的压力才更大,更需要时刻关注企业的经营数据

    23 篇文章  首页 上一页 下一页 尾页 页次:2/2页  15篇文章/页 转到:
     
    本栏最新热门关键字
     
    专 题 栏 目
     中国商业智能BI产品年度调查评选大会
     Oracle BI(Hyperion,OBIEE)产品专题
     SAP(BO,Crystal)商业智能产品专题
     开源商业智能工具Pentaho技术专题
     全球商业智能BI系列产品专题
     iPhone,Andirod手机移动商业智能专题
     IBM(DataStage,Cognos,SPSS)BI产品
     中国商业智能(BI)-CIOs专栏
    最 新 热 门
    固顶文章下一代分析平台的七个特性
    固顶文章如何使用预测性分析全程与客户接触
    固顶文章人工智能的影响,观点和利益
    固顶文章全球消费者对人工智能及其对日常生活的影
    固顶文章用预测分析抢得先机
    固顶文章为什么大数据是驱动创新广告的关键
    固顶文章零售商用人工智能拯救商店的3种方式
    固顶文章人工智能:科幻小说还是商业现实?
    固顶文章大数据分析是如何解决大广告商问题的
    固顶文章大数据
    娱 乐 资 讯
    最 新 推 荐
    固顶文章百咨BI Pentaho实施案例分析(教育行业)
    固顶文章百咨BI Pentaho实施案例分析(环保行业)
    固顶文章百咨BI Pentaho实施案例分析(物流行业)
    固顶文章百咨BI Pentaho实施案例分析(销售行业)
    固顶文章百咨BI Pentaho实施案例分析(多媒体行业)
    固顶文章百咨BI Pentaho实施案例分析(金融行业)
    固顶文章百咨BI Pentaho Saiku二次开发效果图
    推荐文章商业智能深入浅出
    固顶文章第3届Micropole 中国商业智能论坛2014
    固顶文章魅力惠下血本!邀孙俪代言 千万元换上域名…
    网站合作、内容监督、商务咨询、投诉建议 电话:0512-62861389  邮箱:chianbi@126.com
    Copyright 2004-2014 中国商业智能网版权所有   |    苏 ICP 备 13004727 号