登录 | 注册 | 加入收藏 | 网站地图 东莞采购网
当前位置:主页 > 专题报道 > 正文

从数据当中寻找有价值的洞察

[专题报道] 时间:2016-08-22 07:18 来源:未知 作者:www.dgcgw.com 点击:

人民网深圳8月21日电(记者燕帅)由人民日与深圳市委、深圳市结合主办的2016融合成长论坛手艺分论坛在深圳举行。“数据旧事与可视化”高端对话召开,武汉大学旧事与学院副传授王琼讲话。

一个是适才陈院长提到的“大数据旧事”和“数据旧事”,良多时候我们提到数据旧事,大师会说你们做的是“大数据旧事”,好厉害。但其实由于我们做过良多统计,包罗走访了差不多30多家数据旧事机构,我们发觉能够如许讲,全球范畴内,可以或许完成大数据旧事的保守几乎没有。我们都需要通过和科技公司的合作,来完成大数据的出产。这其实给我们提了一个醒,当我们把数据的来历和数据的掌控、筛选完全交给第三方的时候,需要我们有更多的义务感和更多的专业能力去判断数据本身的客观性和实在性。

数据挖掘和数据阐发在我们做旧事傍边大要起到什么感化?大要它的比例和适才说大数据旧事和数据旧事差不多,绝大大都时候我们只是做数据阐发,很是少的时候我们用到了数据挖掘。最初想给大师看两个案例,想通过这两个案例来申明数据挖掘在数据旧事傍边可能会利用的两个场景。

以下是武汉大学旧事与学院副传授王琼讲话全文:

最初说回来,什么是数据挖掘?数据挖掘是要利用包罗数据阐发在内的一些手段。从数据傍边寻找有价值的洞察。譬如说数据挖掘有一个很是典范的故事,听说也是一个数据阐发司理,他编出来的,便于大师理解。

有几个概念,是大师容易的,有需要一下:

同时这里面也有一个值得我们每小我思虑和的圈套,手艺霸权具有的可能性。所以大数据旧事仅仅只占数据旧事傍边的1%摆布。

第一个它有助于我们发觉纪律。这个案例是TheChangingFaceOfAmerica,讲的是美国种族跟着时间变化在全美发生的变化。过去报道凡是有两种:一种是全国范畴内种族多样性变化。USAToday这家公司从1960年用数据挖掘数据阐发的算法,算到2060年全美种族多样性的变化,这个价值很是有价值,并且这个算法跟着时间变化不竭调整。其实算法就是一段公式,大师不要感觉算法是很奇异的工具,它可能就是一个公式。

我们再看这个案例,这个案例是英国BBC的一个案例,用来协助人们发觉个别和群体之间的关系。它大要查询拜访了16万多英国人的糊口形态,合作方是几家学术机构,包罗英国的伦敦政经大学等等,是做得很是成心思的算法。就会发觉,此刻社会曾经不像过去那样,只是上层、中层和劳工阶级,此刻有更多阶级划分。它通过一些互动,需要你填你的经济情况、有没有衡宇、你认识什么人、你的伴侣是什么职业、你的业余糊口,最初帮你算出来一个算法,最下面一行得出来一个结论。我算了一下,按照我在中国的薪资程度算出来,在他们系统傍边我是属于劳工阶级,我感觉有点尴尬。可是我想,也许是他们的算法不大适合中国国情。这是跟大师分享的两个案例,感谢!

在超市里面我们发觉尿布和啤酒放在一路,并且他们销量城市提拔,为什么?是由于我们通过数据挖掘获得一个纪律:在美国良多买尿布的人都是爸爸,他们趁便买几罐啤酒。

二个是数据挖掘和数据阐发,数据挖掘这个词,很容易让人发生,由于挖掘听起来仿佛就是这儿挖挖,那儿挖挖,从网上挖一点数据,从哪个演讲里挖一点数据,仿佛这就是数据挖掘。其实适才这些行为,它都是属于数据的汇集,就仿佛我今天做菜,我到菜场上买菜或者网上购菜,不管哪种路子都是我买菜采购出产原材料的过程,仍是数据汇集。数据汇集回来之后,我要起头洗菜,这个是数据清洗的过程。等这些菜清洗好了,也切好了,我就起头炒菜了,怎样炒?其实就是我怎样样阐发这些数据,怎样样最初把数据完成,做成数据旧事作品,就是我筹算用它做什么菜。同样是牛肉,同样是一波数据,我能够用它来做西红柿牛腩,我能够用它来做牛腩西葫芦汤,就是看你筹算从数据傍边问什么问题,所以讲什么故事,间接决定你用什么方式,从什么角度阐发数据。

其实“数据挖掘”和“数据阐发”,这两个词对于方才起头做数据旧事的记者来说会感觉很是很是头疼,并且良多做记者的人,之前都是数学不太好,所以才选了文科,一说要阐发数据,大师就天然会发生距离感和惊骇感。正好借着今天论坛机遇,还有在线网友收看我们直播,有需要我们给他们去讲,让大师晓得数据阐发、数据挖掘包罗数据可视化离我们并不遥远。

(责任编辑:www.dgcgw.com)

相关内容
东莞采购网
每天与你分享你喜欢的东莞采购网。东莞采购网
分享一下
东莞采购网
订阅本站
东莞采购网
精彩推荐
热门点击
友情链接