非科幻思考（第2/17页）

什么？这是什么算法，有这样的魔力？

“阿尔法狗”究竟是如何做到自我学习的呢？

实际上机器学习并不是非常新的概念，从几十年前，人类就试图让机器自己学习事情，但受限于算法和当时的计算速度，机器学习的步子一直都不快。

“阿尔法狗”的算法叫“深度学习”，它的前身是“神经网络学习”，也是几十年前就诞生的算法，当时流行过一段时间，后来被一篇著名的论文打消了热度，再加之学习效果不算好，于是遭受冷遇几十年。在与“阿尔法狗”的创始人相遇之前，“神经网络”并不是众望所归。

“神经网络”是什么算法？“深度学习”又是怎样将其点石成金的？

“神经网络”是一种“民主投票”算法，效仿大脑的神经网络建成。大脑的神经网络是这样工作的：一个神经细胞接收很多个神经细胞的信号输入，一个刺激信号相当于赞成票，一个抑制信号相当于反对票，如果某个细胞收到的赞成票和反对票合起来大于某一个门槛，就算是通过了，会有一个信号发出去到下一个神经细胞。一路赞成的刺激信号就这样一程程传递下去。神经网络算法是数字版脑神经网，用数字连接形成网，而其中的投票机制和大脑相似。它可以让信号在整个学习网络里传播，比单路信号分析复杂很多，也智能很多。

“深度学习”是什么呢？“深度学习”是“深度多层神经网络学习”的简称。深度是指层次多，一层套一层的神经网络，构成整个算法的深度。层与层之间的关系，大致是这样：每层神经网络分析的精细程度不同，底层分析细节，上层做出判断。将一个整体任务分解成无数细节，给一个输入，底层神经网络会分析基础细节，然后将分析结果传给上一层网络，上一层网络综合之后再将结果传给更上一层的网络，而顶层网络综合层层传来的结果，做出判断。例如，想读出一个字，底层网络会判断字里有没有横竖撇捺，上一层网络会判断字里有没有直角，再上一层网络判断是不是由左右两部分拼成一个字，诸如此类，最上层的网络根据层层结果认出这个字。这种多层判别本身是效仿真实人类的大脑，人类大脑就是由一层层神经网络组成，每一层网络识别信号，再将处理结果传递到上一层。人类皮层大脑的神经网络层次大约有六层。“深度学习”网络可以有上百层。

换句话说，“深度学习”就是把从前的“神经网络”重叠了多层。

就是这样吗？仅仅把“神经网络”叠了多层，就从受人冷遇的小人物变成了江湖明星？故事有这么鸡汤吗？

当然不是这么简单。“深度学习”这次能焕发生机，也是生逢其时，有两阵不可忽略的东风送其上青云。

一阵东风是算力增强。计算机芯片的速度呈指数级增长，价格一路下跌，由游戏应用发展壮大的GPU（图形处理器）大大补充了从前CPU（中央处理器）引擎的计算能力，让人工智能计算更强大。“阿尔法狗”战胜李世石的时候启用了1920个CPU和280个GPU阵列运算，一秒就能自我对弈数百盘。

另一阵东风是大数据。事实上，这可能是这一轮人工智能热潮最重要的推动因素。人们赫然发现，原来不是算法的问题，而是以前用来训练的数据还远远不够多。这就好比让徒弟自学武功，却不给他足够多的对战机会。有了大数据，算法呈现的结果出现了惊人的进步，让人目瞪口呆。

于是，在算力和大数据的辅佐之下，升了级的“深度学习”算法如虎添翼，能够从海量数据中找到高超的战术规律，以人类无法看懂的方式战胜人类。

就是大数据辅助的“深度学习”，成为这一轮人工智能热的关键。

人们把很多很多大数据扔给机器，用多层神经网络进行“深度学习”，结果发现，机器在很多领域能力有了突飞猛进的提高。图像识别的正确率赶上了正常人，语音识别也过关了，把科学文献作为数据，短时间就能学习几十万份最新文献。金融、电力、能源、零售、法律，“深度学习”都能从大数据中学到优化的行为做法。人工智能的应用，能让这些领域变得高效、便捷、自动化。除了“深度学习”，也还有其他算法，包括后面要提到的决策树、贝叶斯等算法，各种算法的综合使用效果是最佳的。各种算法共同构成机器学习大家庭。

除了深度学习，“阿尔法狗”另一重武器叫作“强化学习”。“强化学习”是什么呢？简单点说，就是“无序尝试，定向鼓励”，就好比小朋友在屋里随机行动，走到数学教具旁边父母就说“好棒好棒”，后来小朋友就特别喜欢走到数学教具旁边（当然，这纯属假想的场景）。这种思维一点都不奇怪，在心理学中很早就已经应用到教学中，对大多数教学场景都有效果，尤其对一些发展迟缓的孩子做教学干预（但也有心理问题）。