第二章 AI复兴:深度学习+大数据=人工智能(第3/20页)

2010年前后,准确地说,是从2006年开始,随着深度学习技术的成熟,加上计算机运算速度的大幅增长,当然,还有互联网时代积累起来的海量数据财富,人工智能开始了一段与以往大为不同的复兴之路。

例如,2012年到2015年,在代表计算机智能图像识别最前沿发展水平的Image Net竞赛(ILSVRC)中,参赛的人工智能算法在识别准确率上突飞猛进。2014年,在识别图片中的人、动物、车辆或其他常见对象时,基于深度学习的计算机程序超过了普通人类的肉眼识别准确率31。

图20 Image Net图像分类比赛历年来识别错误率的变化趋势

人们在Image Net竞赛(ILSVRC)中取得的非凡成就是人工智能发展史上一个了不起的里程碑,也是当今这一拨人工智能热潮由萌芽到兴起的关键节点。随着机器视觉领域的突破,深度学习迅速开始在语音识别、数据挖掘、自然语言处理等不同领域攻城略地,甚至开始将以前被人们视为科幻的自动驾驶技术带入现实。此外,基于深度学习的科研成果还被推向了各个主流商业应用领域,如银行、保险、交通运输、医疗、教育、市场营销等,第一次实现了人工智能技术与产业链条的有机结合。

今天的人工智能是“有用”的人工智能

我觉得,和前两次AI热潮相比,这一次人工智能复兴的最大特点,就是AI在多个相关领域表现出可以被普通人认可的性能或效率,并因此被成熟的商业模式接受,开始在产业界发挥出真正的价值。

心理学上说,人们接受一件新事物,就像人们感受一种外界刺激一样,是有一个心理阈值的。外界刺激(比如声、光、电)的强度太小的话,人们根本不会有任何感觉;只有外界刺激的强度超过了一个人能够感知的最小刺激量,人们才有“听到了声音”“看见了东西”之类的明确感受。这个能引起人们感知反应的最小刺激量,心理学上叫绝对阈值(absolute threshold)32。

人工智能技术的发展正是如此。还是拿图像识别来说,在人工智能发展早期,如果一个计算机程序宣称可以识别出图片中的人脸,但它的识别准确率只有五成左右,那普通人只会将这个程序看作一个玩具,绝不会认为它拥有智慧。随着技术进步,当人脸识别算法的识别准确率提高到80%甚至接近90%的时候,研究者们当然知道,取得这样的进步十分不易,但这一结果其实还是很难被普通人接受,因为每五个人脸就认错一个,这明显无法在实际生活中使用——人们也许会说这个程序挺聪明,但绝对不会认为这个程序已经聪明到可以替代人类的眼睛。只有计算机在人脸识别上的准确率非常接近甚至超过普通人的水平,安防系统才会用计算机来取代人类保安完成身份甄别工作。也就是说,对于人脸识别这个应用,接近或超过普通人的水平才是我们关心的“绝对阈值”。

所以,我们说“人工智能来了”,其实是说,人工智能或深度学习真的可以解决实际问题了。在机器视觉、语音识别、数据挖掘、自动驾驶等应用场景,人工智能接连突破了人们可以接受的心理阈值,并第一次在产业层面“落地”,发挥并创造出真正的价值。

人工智能之所以有今天的成就,深度学习技术居功至伟。谷歌最杰出的工程师杰夫·迪恩说:“我认为在过去5年,最重大的突破应该是对于深度学习的使用。这项技术目前已经成功地被应用到许许多多的场景中,从语音识别到图像识别,再到语言理解。而且有意思的是,目前我们还没有看到有什么是深度学习做不了的。希望在未来我们能看到更多更有影响力的技术。”33

所以,关于第三次人工智能热潮,我的看法是:

·前两次人工智能热潮是学术研究主导的,而这次人工智能热潮是现实商业需求主导的。

·前两次人工智能热潮多是市场宣传层面的,而这次人工智能热潮是商业模式层面的。

·前两次人工智能热潮多是学术界在劝说、游说政府和投资人投钱,而这次人工智能热潮多是投资人主动向热点领域的学术项目和创业项目投钱。

·前两次人工智能热潮更多是提出问题,而这次人工智能热潮更多是解决问题。

到底本次人工智能热潮是不是处于技术成熟度曲线的成熟上升期,到底能不能保持长期持续增长的势头,是不是会像此前的人工智能热潮那样,有跌入低谷的风险?我想,经过上面的分析,大家应该会有自己的判断。