非科幻思考(第2/17页)

什么?这是什么算法,有这样的魔力?

“阿尔法狗”究竟是如何做到自我学习的呢?

实际上机器学习并不是非常新的概念,从几十年前,人类就试图让机器自己学习事情,但受限于算法和当时的计算速度,机器学习的步子一直都不快。

“阿尔法狗”的算法叫“深度学习”,它的前身是“神经网络学习”,也是几十年前就诞生的算法,当时流行过一段时间,后来被一篇著名的论文打消了热度,再加之学习效果不算好,于是遭受冷遇几十年。在与“阿尔法狗”的创始人相遇之前,“神经网络”并不是众望所归。

“神经网络”是什么算法?“深度学习”又是怎样将其点石成金的?

“神经网络”是一种“民主投票”算法,效仿大脑的神经网络建成。大脑的神经网络是这样工作的:一个神经细胞接收很多个神经细胞的信号输入,一个刺激信号相当于赞成票,一个抑制信号相当于反对票,如果某个细胞收到的赞成票和反对票合起来大于某一个门槛,就算是通过了,会有一个信号发出去到下一个神经细胞。一路赞成的刺激信号就这样一程程传递下去。神经网络算法是数字版脑神经网,用数字连接形成网,而其中的投票机制和大脑相似。它可以让信号在整个学习网络里传播,比单路信号分析复杂很多,也智能很多。

“深度学习”是什么呢?“深度学习”是“深度多层神经网络学习”的简称。深度是指层次多,一层套一层的神经网络,构成整个算法的深度。层与层之间的关系,大致是这样:每层神经网络分析的精细程度不同,底层分析细节,上层做出判断。将一个整体任务分解成无数细节,给一个输入,底层神经网络会分析基础细节,然后将分析结果传给上一层网络,上一层网络综合之后再将结果传给更上一层的网络,而顶层网络综合层层传来的结果,做出判断。例如,想读出一个字,底层网络会判断字里有没有横竖撇捺,上一层网络会判断字里有没有直角,再上一层网络判断是不是由左右两部分拼成一个字,诸如此类,最上层的网络根据层层结果认出这个字。这种多层判别本身是效仿真实人类的大脑,人类大脑就是由一层层神经网络组成,每一层网络识别信号,再将处理结果传递到上一层。人类皮层大脑的神经网络层次大约有六层。“深度学习”网络可以有上百层。

换句话说,“深度学习”就是把从前的“神经网络”重叠了多层。

就是这样吗?仅仅把“神经网络”叠了多层,就从受人冷遇的小人物变成了江湖明星?故事有这么鸡汤吗?

当然不是这么简单。“深度学习”这次能焕发生机,也是生逢其时,有两阵不可忽略的东风送其上青云。

一阵东风是算力增强。计算机芯片的速度呈指数级增长,价格一路下跌,由游戏应用发展壮大的GPU(图形处理器)大大补充了从前CPU(中央处理器)引擎的计算能力,让人工智能计算更强大。“阿尔法狗”战胜李世石的时候启用了1920个CPU和280个GPU阵列运算,一秒就能自我对弈数百盘。

另一阵东风是大数据。事实上,这可能是这一轮人工智能热潮最重要的推动因素。人们赫然发现,原来不是算法的问题,而是以前用来训练的数据还远远不够多。这就好比让徒弟自学武功,却不给他足够多的对战机会。有了大数据,算法呈现的结果出现了惊人的进步,让人目瞪口呆。

于是,在算力和大数据的辅佐之下,升了级的“深度学习”算法如虎添翼,能够从海量数据中找到高超的战术规律,以人类无法看懂的方式战胜人类。

就是大数据辅助的“深度学习”,成为这一轮人工智能热的关键。

人们把很多很多大数据扔给机器,用多层神经网络进行“深度学习”,结果发现,机器在很多领域能力有了突飞猛进的提高。图像识别的正确率赶上了正常人,语音识别也过关了,把科学文献作为数据,短时间就能学习几十万份最新文献。金融、电力、能源、零售、法律,“深度学习”都能从大数据中学到优化的行为做法。人工智能的应用,能让这些领域变得高效、便捷、自动化。除了“深度学习”,也还有其他算法,包括后面要提到的决策树、贝叶斯等算法,各种算法的综合使用效果是最佳的。各种算法共同构成机器学习大家庭。

除了深度学习,“阿尔法狗”另一重武器叫作“强化学习”。“强化学习”是什么呢?简单点说,就是“无序尝试,定向鼓励”,就好比小朋友在屋里随机行动,走到数学教具旁边父母就说“好棒好棒”,后来小朋友就特别喜欢走到数学教具旁边(当然,这纯属假想的场景)。这种思维一点都不奇怪,在心理学中很早就已经应用到教学中,对大多数教学场景都有效果,尤其对一些发展迟缓的孩子做教学干预(但也有心理问题)。