载入中…
公告栏:
当前位置: 中国商业智能网 >> 资讯 >> BI资讯 >> 文章正文
数据分析能做和不能做的
作者:中国商业智能网    来源:本站原创    点击数:    时间:2017/1/25
【摘要】现在大量的兴趣集中于大数据、商业智能、预测分析和其他与数据相关的领域。

现在大量的兴趣集中于大数据、商业智能、预测分析和其他与数据相关的领域。无论是在显然与法律无关的领域如物联网,或是法律领域如挑选陪审团成员、诉讼金融、文本分析和对冲基金的复制,使用数据的技术显然在改变着商业世界的许多方面

这些工具和技术整体上可以一般称为数据分析,而且随着计算能力和软件接口的主要进步,2017年很可能是数据分析进步最大的一年。对大多数新手来说,围绕数据分析可以和不能做什么仍然有一个大误解。

首先,所有数据分析过程开始于一个基本的真理 —— 垃圾进,垃圾出。如果被分析的数据不能准确地表示世界,那么它就不是有用的。这个概念似乎很简单,但它往往被遗忘。例如,在一个风险管理功能上,人们常常认为数据是用于推断未来事件的可能性,但这只在一种情况下是真的,那就是,如果我们所担心事情的数据实际上以相同的频率发生在世界上。

以陪审团的选择为例,我们可以用一个被称为概率模型的统计模型找出一个特定陪审员在案子结束时做出决定的概率。为了模型的有效,我们需要陪审员的数据有年龄、性别、就业、背景等。

一旦我们有了这些数据,我们可以弄清陪审员可能对给出实事的案件做出的决定。而同样重要的是,数据分析可以从统计上告诉我们对结果的自信如何。换句话说,我们有95%的把握认为陪审员XYZ将判定一个审判有罪。而我们只有63%的把握确定保陪审员ABC会提交这样的裁决。

但是为了建立这种类型的模型,我们需要有正确的底层数据 —— 这意味着有正确的陪审员数据,并拥有在过去的案件中其他陪审员做出的裁决的正确数据以及这些其他陪审员的数据。换句话说,建立一个数据模型需要投入时间和金钱 —— 在许多情况下它不是一个简单的一次性过程。

数据分析是强大,但我们要有正确的工具。许多业内人士说, 阻碍有效使用新的数据工具和技术的最大问题是缺乏数据。

数据分析的第二个主要问题是,我们需要被正确清理了的和编排好的数据。很多时候用于分析的数据来自不同的数据源,有一些质量高而有一些质量低。这意味着数据集必须清洗后合并在一起成为一个更大的数据库。许多情况下这会很困难并且很耗时,尤其是在大型数据集如用于投资的方面。

例如,当复制对冲基金时,要使用一个数据源的对冲基金回报数据,交易频繁的期货的数据和来自于第二个数据源的数据整合返回数据,还有第三个来源数据整合特征数据。

三组数据都基于一个统一的因素如返回的日期合并在一起。一旦这样做了,数据必须清洗,处理诸如关闭商店,或数据整合价格中买卖反弹的对冲基金。

完成这个过程时,有一个公式可以让你成本更低地复制任何一类的对冲基金的绩效,但同样,它需要时间和投资以得到准确的结果。

律师常被认为是一个传统的行业,但对于建立数据使用的新观念的律师明显有更多的机会。这些努力的关键在于将投资于新的数据分析能力看成一个过程,而不是把它当作一次性的工作。

<P class=style_new>中国<A class=Channel_KeyLink href="http://www.chinabi.net">商业智能</A>网(<A class=Channel_KeyLink href="http://www.chinabi.net">BI </A>)</P>

责任编辑:朱莉   
 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    ChinaBI版权、投稿与免责申明:
    1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明稿件来源:中国商业智能网,违者本网将依法追究责任。
    2)本网注明“本站来源处不写本站原创”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    最新热点
    娱乐资讯
    最新推荐
    网站合作、内容监督、商务咨询、投诉建议 电话:0512-62861389  邮箱:chianbi@126.com
    Copyright 2004-2014 中国商业智能网版权所有   |    苏 ICP 备 13004727 号