早在2005年,我写过一篇《数据、信息、知识与智慧》,讨论数据-信息-知识-智慧(DIKW)体系。当时我用了下面这张图,并引用诗人T.S. Eliot的话说:“信息迷失在数据中,知识迷失在信息中,智慧迷失在知识中”。

在这张图上,数据是一个人、一只兔子(未明示),信息是人看见兔子在跑,知识是兔子吃草、狼吃兔子、草长在土里、雨从云中落下,而智慧是“如果我把所有的狼都杀了,兔子就会把草吃光,土壤就会被雨水冲跑”。

如果用天气预报来说明,那么数据是百页箱采集的数字、卫星云图、环境监测的数字,信息是明天的天气、温度、湿度,知识是穿衣指数、晨练指数、洗车指数,而智慧是穿衣混搭方案、减肥健身方案、规避违章方案。

由此可见,DIKW体系不是一个严密的体系,数据与信息、知识及智慧之间,绝不是简单的直接映射或衍生递进关系。所以DIKW体系也被称为“信息金字塔”,形象地说,人们挖掘大量的数据,才能得到少量的一点智慧。大数据4V特征之价值(Value)特征,表现之一是价值密度低,道理就在这里:虽然数据是资产、是金矿,但能产生知识和智慧价值的数据却是很少的。

任何产品或服务,如果不能给用户带去价值增值,那必定是站不住脚的,就算因某些原因(比如知识产权土壤太差)而存在甚至猖獗一时,也是终将消亡的。所以像我昨天所说的那种,随意转发他人内容、让采编沦为标题党转载的作法,无论怎样“创新”地采用自动化工具,也终将是兔子尾巴——长不了。

另一方面,在传统的IT产业,即使在今天的大数据背景下,主要的产品/服务都是处于数据与信息两个环节,多为数据存储与处理平台、数据整合与分析工具、信息展现与数据应用等。知识和智慧对于计算机来说,仍然处于不可知、无法处理的蛮荒之中。

DIKW_Vendors

为什么呢?因为以目前的科技发展水平,所有一切内容,对计算机来说都是数据。甚至必须是结构化数据。所以我曾在微信朋友圈里说,神化大数据,你就是笨蛋。你看到的很多所谓大数据成果,基本都是统计分析,而统计分析必须基于结构化数据。这些大数据成果,无非是进行结构化处理,然后再进行统计分析。

在下不才,我目前也看不到更高明的办法。给你一篇文档,比如就是你现在正在看的这篇文章,计算机能够读懂吗?人工智能技术,无一不是把处理逻辑“喂”给计算机,它能够处理的东西永远超不出这些逻辑。以现有的科技水平,所谓人工智能,不过让计算机“看上去”懂得人类才能懂的东西。

有点扯远了。简而言之,我是想说,目前以互联网为载体的所谓新媒体,对于整合互联网数据和信息,帮助人们从媒体的视听信息中掌握知识和智慧,基本上是没有办法的。相反,新媒体给人们带来更多困扰。

数据化媒体,要致力于解决突破这一困境。

(但是很Sorry哟,我行文有点太啰嗦,今天再一次没有进入正题。明天继续聊咯。)