大数据突然火得一塌糊涂,以致于搞大数据的人,在某些人看来已然行同骗子。所以你一提大数据,就有人语重心长地规劝你。
这不,我今天在朋友圈写了两句废话:
最近写了一个材料,有两点感受:
1 大数据不再局限于数据分析,而是渗透和参与到业务流程中,因而有可能产生颠覆性效果。
2 大数据业务场景当真还不够成熟,需要所有行业的共同努力。
就有朋友前来“规劝”道:先把小数据用好,再提大数据吧。
我的第一反应是:大数据是时代的产物,是随着发展的需要而提出来的,“小数据”这个概念,纯粹是好事者“船载以入”,世界上只有数据、大数据,而不存在“小数据”这种玩意儿。
好吧,为了便于理解和区分,我们权且接受小数据、大数据这种划分吧。然后我去搜了一下,看到一个老外的整理,分享给你。
小数据是:
- 抓取网站页面、Google Alert 和 RSS feed
- 只使用结构化数据
- 向业务人员提供原始数据,并不做汇总分析
- 商业智能模式的传统报表
- 专注于提供信息
- 手工或批处理模式的数据分析
- 用软性指标度量影响,如登录次数、账户访问数
- 数据分散在电子表格中,业务人员可能从未打开
- 依赖人工的不稳定模型,知识存储在少数人的大脑中
- 数据主要用于规划未来行为
而大数据是:
- 整合内部的、外部的、合作伙伴的数据,以便洞察客户和未来趋势
- 使用结构化数据和非结构化数据(如文本、呼叫日志)
- 处理数据的目的,只为发现相关性
- 预测未来,优化行为
- 完全与业务流程融合
- 向业务人员提供实时数据和业务洞见
- 用硬指标度量影响,如收入增长、借贷利率
- 专注于业务人员,与其工作流程整合在一起
- 有自动分析模型,聚焦于新发现或未曾预料的事情
- 专注于一线执行力,而不只是规划和预测
另外有一张图,更简洁、当然也更狭义地对比了“小数据”和大数据:
小数据:容易获得,采用常规数据库
大数据:难以获取,采用大规模数据库
不管怎样,“小数据”和大数据,它不是一个先后顺序的问题。现状来说:企业业务和管理,主要还是依赖于内部数据为主的“小数据”,但大数据带来的思维与视角,必能以“大数据驱动创新”的逻辑,帮助企业从用户、产品和渠道等不同角度进行创新,从而提升和优化企业经营的“硬指标”。基于大数据的业务流程,基本思想就是企业不再是单一的个体,而是 Interconncted Enterprise。
大数据决不是骗局。走着瞧,大数据会将你淹死——如果你不做弄潮儿的话。