2017 年新年献词
2016,委实是诡异的一年。这一年,灾难不断、痛苦不断,而让人欣慰的事情却太少、太少、太少。
这一年,传统媒体加快了死亡的步伐。即使知名如美国《新闻周刊》,也干出了将印好的杂志销毁的傻事。总统大选之前,《新闻周刊》的精英们认为希拉里当选是一个大概率事件,早早就做好了封面和杂志,然而很不幸,11 月 8 日当选美国总统的,却是另有其人。
共和党人唐纳德·川普当选美国总统,是 2016 年最大的黑天鹅事件。川普入主白宫,而赢得普选的希拉里泪洒疆场。不按常理出牌的川普,不仅让媒体人颜面丢尽,更让美国一撕两半,前路漫漫,未知美国何去何从。
川普当选、英国脱欧,意味着 2016 年是反全球化的十字路口。“地球村”上的人们,突然发现世界原来并不是平的。2017 以及未来的三、五年,全球的政治、经济环境将出现巨大的动荡,强国商人当政、弱国极左回潮,黑天鹅将成为不可预期的正常现象。
这一年,雾霾进一步“侵略”中华大地,让人们感到更窒息的是禁止讨论的空气;这一年,以增值税、五险一金为核心的苛捐杂税让企业不堪重负,企业一边死亡,一边呼唤着“让我死个明白吧”。
据民间调查,中小企业健康率仅占 10%,而 GDP 的水分却可能高达 3 倍。人们能够清楚地感觉到,经济继续呈断崖式下迭,这让曹德旺一夜之间从一位老牌企业家变身网红,而他呼吁实事求是的文章却从互联网上消失。
美国大选预测失败,也让大数据人丢脸不已。在 2016,大数据持续高温不退,一边是大数据随同人工智能、机器学习、知识图谱、VR/AR等新兴领域尘嚣直上,一边是大数据应用场景和实施案例价值难彰,以致于“搞大数据的”在某些人看来几若行骗。
但是不管怎样,2017 还是迈着不急不慢的脚步,坚定不移地到来了。雄关漫道,从心出发。
其实,美国总统大选,也是 2016 年最重要的大数据事件。虽然大部分预测结果最终被证明是错误的,但是由于大选的巨大影响力,普通民众开始了解和探讨大数据、数据科学、预测分析等专业词汇,大数据从象牙塔中走出,与民众在数据价值、数据应用及数据滥用等方面进行了广泛而深入的亲密接触。另一方面,正是“预测不准”的不确定性,进一步显示了大数据的巨大潜力和真正价值。
可以预期,在2017年,越来越多的企业开始实现大数据的现实回报,从以往的“概念验证”(PoC, Proofs of Concept)逐渐转向“价值验证”(PoV, Proofs of Value)。以银行业为例:经过几年“东一榔头西一棒槌”的试验,务实的银行将在下一年度找到有商业价值回报的大数据应用场景,而领先的银行将在 2017 年勇当“小白鼠”,成为大数据驱动业务创新的先锋。
无聊的人们也许会继续谈论大数据的基本概念。但是当人们谈论大数据时,他们究竟在谈论什么?是狭义的数据处理技术变革,还是更深入、更广泛的数据应用?人们谈论着的大数据,也许是大数据思维、大数据商业模式,也许是大数据应用、大数据技术,或者是大数据资源、大数据管理与治理。总之,无论数据规模怎样增长、数据类型如何多样化、数据需求如何花样百出,只要数据应用最终还是简单的统计分析,它就不算一枚真正的大数据应用。
是不是大数据,有三个基本判据:
- 基于多途径、多结构的数据源
- 面向预测分析,而非现状统计
- 数据分析嵌入到业务流程之中
在 2017 年的工程实践中,可以从这三项基本判据出发,从不确定性中发现规律,使大数据价值正本清源:
- 从业务场景出发,尽可能全面地采集、清洗和解析多样化的数据资源
- 外部数据是重要补充,但如何充分挖掘内部数据的价值,更值得努力
- 无论何种数据资源,均需具备足够的数据管控能力,将数据整合为统一体系
- 大数据未必就是非结构的,也不见得非得用Hadoop,“工具论”是极其错误的
- 数据是人类描述世界的表征,数据的本质是业务,故一切可能性都来自业务
- 互联网代表开放,大数据代表民主,故数据和数据应用是开放给全体员工的
- 宜采用全局视角、重点突破的“钩子方法”,小起点、低投入实施大数据项目落地,通过反复迭代获得越来越大的投资回报,而不应盲目采用“大干快上”的策略
- 从爆发式市场动向,到大数据价值创造,必由之路是大数据业务转换和实施路径
- 大数据成熟度五阶段:业务监测;业务洞察;业务优化;数据变现;业务重塑
- 根据业务需求,通过统一的数据采集架构和方案,整合内外部大数据资源
- 大数据平台并没有“必须的”架构,它可能是MPP数据库,也可能是Hadoop/NoSQL/Spark或数据探索分析,总之应用与数据类型决定了平台架构
- 不要听传统IT厂商的,大数据就是要颠覆他们的;也不要相信传统咨询,他们也不知道大数据是什么;不要听专家的,大数据创新并无经验可借鉴;不要听领导的,他们瞎指挥
- 大数据要突破企业局限,以用户为中心部署数据和产品,360度用户画像是所有应用的基础
- 实施大数据要采用开放心态,没有谁能掌握全部资源,故宜采用开源的技术、开放的数据
- 精准营销、交叉销售、用户运营、产品创新、风险防控等领域,是现阶段容易实现的大数据机会。但若停留在数据采集 → 数据分析 → 决策支持的传统逻辑,它并不是真正的大数据应用
- 不能嵌入业务流程、不能帮助业务优化与重塑的“大数据”,都是耍流氓
- 要相信:大数据是活的!
最后,送你一支歌,祝你新年快乐。