先来看张图。它的含义简单明确:网站搜索“大数据”一词的人群统计,取了性别比例和年龄分布两个数据。
据介绍,这是一个功能完备的大数据产品,用户搜索任何一个关键词,均能得到它的搜索/成交趋势、人群信息(如性别、年龄、星座、地区、爱好等),还可以查询从这个关键词出发的相关商品、商品属性、品牌等的销售情况,以及对任意人群信息组合(例如25-30岁北京女性)下的相关交易信息。
这,也是该知名网站得意的大数据应用产品,称之为某某指数的便是。
您可能失望地想,这么简单的统计,果真是大数据应用吗?
我们说,数据应用要解决五个层次的问题。一,发生了什么事;二,为什么发生这样的事;三,未来将会发生什么事;四,此时此刻正在发生什么事;五,怎样主动推动事情发生。目前能够做到的,更多是第一、二两种,即基于报表的统计分析,较少能做到第三种,即预测分析;而第四、五两种迄今仍然很难做到,虽然人们正在努力想让机器帮助人类做到(例如通过机器学习达到一定的智能水准)。
因此,大数据概念再神奇,它始终是数据,其应用的基础,始终逃不出统计学的“魔掌”。某吹牛网站一定要称上图为大数据应用,您还真没办法指责它。它甚至可以振振有辞地说:看起来简单的事,实际上并不是那么简单的,后台经历了如此这般的复杂运算哦。
但是,您仍然有权利失望。这不是划时代的大数据应用。或者说,如果大数据只是如此,这太忽悠人了。
那么,究竟什么是大数据应用?我告诉您,它是信息时代的“猜心术”。
细节,留个伏笔,明天继续聊。
引用/广播