2014/05/07 | 数据智能
像金融一样,电信也是一个严重依赖IT的行业。在电信业务架构eTOM中,可以说所有的过程都是基于信息技术的。因此或许会有人说,电信行业肯定是不缺基础数据的。我认识一位朋友,曾在以服务电信行业为主业的公司里工作多年,主要从事BI研发,自称将电信行业的BI“做穿了”,可算是这种看法的一个佐证。...
2014/05/06 | 数据智能
你或许以为,那些业务开展完全依赖信息系统的行业,不会存在基础数据的问题。比如在银行业,大量数据存储在以核心系统为核心的各种系统之中,并且成熟的银行均建有企业级数据仓库,基于数据仓库的分析型应用多数数十甚至数百个之多。它们怎么会缺乏基础数据呢,只会存在数据质量不够好、数据量太多性能不足等问题。...
2014/05/05 | 数据智能
搞数据的人都清楚,最大的难题不是数据多、数据杂、数据质量不好,而是:根本就没有数据!书面一点说,数据的存在性是第一位的,及时性、有效性、准确性、一致性等等,都是在基础数据具备的前提下,才有讨论的意义。 不幸的是,我们中国的企业,业务和管理往往相当粗放,大量基础数据是缺失的。甚至是,“按道理”系统中“应该”保存的某些数据,可事实上就是没有、或有时有有时没有。我的数据模型师就多次向我抱怨,数据量太小、部分时点数据缺失,预测模型实在难以建立,更遑论让模型具有自学习、自适应的能力。...
2014/05/02 | 数据智能
“大数据恐慌”这个话题,我想好已有十多天了。但由于某些原因,继“断更”16天之后于4月20日发了一次神经,又再次“便秘”了十余天。然而“某些原因”是什么呢?我自己也说不清楚。 幸而有各位朋友的温暖关心,唤醒我沉睡的勤奋,也令我十分感动。有人给我发信息,问我是太忙了还是生病了,为什么这么久没更新。更有人说,每天看微信里的很多文章,绝大部分都是复制粘贴毫无新意,只有我写得最好,所以最爱读。我也答应从五一之后恢复更新。但是不守信的我,又食言了:五一加班过后,和同事吃饭,虽然happy,终究耽误了太多时间,错过了晚间12点的最后机会。...
2014/04/03 | 数据智能
在我宣讲大数据的材料中,我引用过老外的一句话: “We swim in a sea of data… with the sharks… and the sea level is rising rapidly.” 我们在数据的海洋中遨游,而水中满是鲨鱼,并且海平面在快速上升。 这话绝不是夸张。需知,我们今天就生存在一个大数据的世界中:每一秒,全球发送电子邮件300万封;每一分,YouTube上传20小时视频信息;每一天,微博新贴1亿条、淘宝交易2000万笔,而Google处理数据近30PB……...