第五章 机遇来临:AI先行的创新与创业(第6/14页)

技术开源和数据开放方面,其实谷歌已经算是做得非常好的了。谷歌开源的Tensor Flow框架,已经成为业界深度学习的标准框架之一。谷歌在过去的几年时间里,连续开源You Tube 8M、Open Images、Audio Set等包含数百万份视频、图片、音频的标注数据集,为人工智能领域的科研发展提供“原材料”。但我们也必须知道,谷歌、Facebook这样的大企业很难主动开放那些关乎它们核心业务的网页标注、结果排序的特征、用户点击次数、广告转换指标等,对这些数据的垄断将AI世界里的大数据海洋分割成了一个个相互隔离的区域。

更糟糕的是,巨头建立的AI平台以及巨头之间的结盟关系,有可能让数字鸿沟变得越来越严重。信息在人工智能算法的组织、管理下,会更多地向有信息理解和处理能力的平台、企业、终端用户倾斜,接受过高等教育、积极参与网络生活的用户更加容易获得信息和人工智能应用的帮助,而教育水平低、较少参与网络生活的用户则难以找到可以改善自己生活的有效信息。想一想电子商务平台上的智能推荐算法:一个用户越是频繁购物,就越容易得到最适合自己的商品信息。类似的场景会在许多有真实信息需求的领域存在,信息或大数据世界里的富者愈富、穷者愈穷现象并不是危言耸听。

对于这样的“巨头风险”,我觉得我们应该从法律和制度建设层面,多做些有前瞻性的事情,包括:

·提高大数据和人工智能应用领域的透明度,鼓励公开那些不涉及用户隐私和商业机密的研发成果,鼓励开源。

·更多地鼓励利用区块链技术管理数据和信息流动,从技术和制度双方面打破科技巨头对大数据的垄断。

·成立有社会责任感的VC基金,专注于新兴的大数据和人工智能方向。

·多关注能够帮助落后人群获取信息、享受AI福利的平台。

·鼓励大众和媒体去监督行业巨头的商业行为。

在瑞士达沃斯,我受邀与麻省理工学院媒体实验室负责人伊藤穰一探讨巨头可能对AI的垄断。我的看法是,目前的体系会持续促使大型科技企业不断发展。它们有能力垄断资源、垄断数据,在商业利益和激烈竞争的驱使下,它们会不断地竞逐更为精进的技术能力,为公司赚取更大的利益。对于较小企业,进入AI市场的难度的确比移动互联网时代的创业高出非常多。我呼吁大力推动AI生态系的开放性。在创新工场北京总部和我们所投的创业公司体系中,已经启动了全新的AI技术相关研发工作。近期,创新工场也成立了人工智能工程院,带着孵化中国AI生态系的目标投入大量资源,招聘培训一批年轻工程师入门AI领域,展开可公开数据集的采集和标注。我们也积极寻求在中国和全球资本市场的融资和成长机会。

我觉得,目前有些公司采取所谓公开透明的做法,其实是很讨喜的宣传手段。但我也确实担心,下面这种两难问题会不会出现:一些公司选择通过自律或推动立法来限制错误的发生,但另一些公司不会这么做。自然而然,比较规范自律的公司由于发展顾虑更多、更全面,相对发展速度上可能放缓;而较不顾虑错误发生的企业,反而可能成为最快速或最成功的那一方。这很难说是一个好的还是不好的发展态势。

例如在自动驾驶技术的开发上,谷歌很小心谨慎,把保护驾乘人员和行人放在了极其重要的位置上,技术不成熟就不推广;相反,特斯拉的Autopilot就很激进,会直接把测试版产品拿给公众进行试验。然而现在看来,特斯拉造出好的自动驾驶汽车的可能性也许要更大一点儿。所以,这个难题对任何规模、任何阶段的企业,都是一个道德层面的决策。

伊藤穰一则认为,随着世界愈发紧密互联,要以“赢家通吃”的玩法去垄断市场越来越难。现在,如果某个个体试图进行垄断行为,会自动触发市场机制。市场竞争会形成限制:如果某方采取垄断动作,对标竞争的另一方会花数百上千万美元去找到超级优秀的AI博士们来迎头赶上。现今人才培养的源头已经到位,但我担心,当某个企业实现了垄断甚或做上了寡头的时候,自然而然能顺势招募AI领域的全球才俊,吸引能够负担他们百万美元酬金的投资人,种种多方因素都正汇聚在一起。市场单方面依赖竞争机制进行调节并不完善。

伊藤穰一说:“因此,我对开复和创新工场在中国推动的开放做法特别感兴趣。而且,资本主义的市场竞争是不会激励大家分享数据、资源和市场的。传统的政府监管方式过去曾经行之有效,但在面对互联网的开放和动态结构时,这种传统的监管方式将会失效。现在这些AI、比特币和其他所有领域中的问题,都不是过去10年、20年间学者们研究的题目,而是真正在资本市场能够快速赚钱的技术。然而相较于开放的互联网,行业不曾充分在开放领域来探讨这些技术衍生的问题和现象,这是我的担忧所在。”150