周一聊完鱼骨图,我就不打算继续说离散了。

今天从离散里走出来:世界本来不是一分为二、一分为N的,现实世界是从来都是连续的。你永远看不到一个点、一条线或一个直角,那都是人类为了寻找规律的抽象。

那么,你就不难想到:如果能看到多个离散的点,就有可能把它“积分”为连续的曲线,甚至可以是多维度、多层次的曲线。

比如,你通过观测,得到这样的散点图:

你如果有基本的知识基础,你一眼就能看出:纵轴和横轴所代表的两个变量之间,大致是线性关系。

把这样的散点图回归为线性函数,那就是线性回归了。

回归,就是我上面说的带引号的“积分”。准确地说,回归的意思是:人们在测量事物时,因为客观条件所限,所获得的都是测量值,无法求得事物的真实值,为了能够得到真实值,只好多次进行测量,最后将测量数据计算回归到真实值。

回归的结果通常是一个函数,也就是用函数去逼近真实值。显然,函数有许多形态,线性函数可以说是最简单的一种了。

也就是说,对大量观测数据进行处理,得到事物发展规律是线性的。

因为实用,线性回归或许是最常见的回归方法。它又包括一元线性回归和多元线性回归,而一元线性回归又叫简单线性回归,主要用于判断是否能通过回归模型找到一个线性组合。

回归分析的基本步骤如下:

  1. 确定自变量和因变量;

  2. 确定回归模型;

  3. 确定回归方程;

  4. 对回归方程进行检验;

  5. 利用回归方程进行预测。

线性回归一般用最小二乘法进行拟合。一般的线性回归分析,用Excel就能搞定。这些技术性内容,我这里就不详细介绍了。

摩尔定律(Moore’s law)或许是最著名的线性回归了。它由英特尔创始人戈登·摩尔提出,含义是:集成电路上可容纳的晶体管数目,每隔两年便会增加一倍。

摩尔定律并不是一个真正的定律,其数据一半来自经验,一半来自“拍脑袋”。所以,它应该视为是对现象的观测或对未来的推测,而不是一个物理定律或自然界的规律。

但神奇的是,许多年来的事实竟一直与之吻合。摩尔定律“统治”了半导体行业半个多世纪,对世界经济增长做出了巨大贡献,并驱动了一系列科技创新、社会改革、生产效率的提高和经济增长。个人计算机、互联网、智能手机等技术改善和创新,都离不开摩尔定律的延续。

最后告诉你两个残酷的事实:

  1. 摩尔定律的常规版本是每隔18个月晶体管数量增加一倍,但摩尔当初发表文章时,他写的是每年增加一倍。可见,摩尔定律是一个传说,或一个故事? 

  2. 另外,摩尔定律所揭示的规律,真是线性的吗?