第五章机遇来临：AI先行的创新与创业（第6/14页）

技术开源和数据开放方面，其实谷歌已经算是做得非常好的了。谷歌开源的Tensor Flow框架，已经成为业界深度学习的标准框架之一。谷歌在过去的几年时间里，连续开源You Tube 8M、Open Images、Audio Set等包含数百万份视频、图片、音频的标注数据集，为人工智能领域的科研发展提供“原材料”。但我们也必须知道，谷歌、Facebook这样的大企业很难主动开放那些关乎它们核心业务的网页标注、结果排序的特征、用户点击次数、广告转换指标等，对这些数据的垄断将AI世界里的大数据海洋分割成了一个个相互隔离的区域。

更糟糕的是，巨头建立的AI平台以及巨头之间的结盟关系，有可能让数字鸿沟变得越来越严重。信息在人工智能算法的组织、管理下，会更多地向有信息理解和处理能力的平台、企业、终端用户倾斜，接受过高等教育、积极参与网络生活的用户更加容易获得信息和人工智能应用的帮助，而教育水平低、较少参与网络生活的用户则难以找到可以改善自己生活的有效信息。想一想电子商务平台上的智能推荐算法：一个用户越是频繁购物，就越容易得到最适合自己的商品信息。类似的场景会在许多有真实信息需求的领域存在，信息或大数据世界里的富者愈富、穷者愈穷现象并不是危言耸听。

对于这样的“巨头风险”，我觉得我们应该从法律和制度建设层面，多做些有前瞻性的事情，包括：

·提高大数据和人工智能应用领域的透明度，鼓励公开那些不涉及用户隐私和商业机密的研发成果，鼓励开源。

·更多地鼓励利用区块链技术管理数据和信息流动，从技术和制度双方面打破科技巨头对大数据的垄断。

·成立有社会责任感的VC基金，专注于新兴的大数据和人工智能方向。

·多关注能够帮助落后人群获取信息、享受AI福利的平台。

·鼓励大众和媒体去监督行业巨头的商业行为。

在瑞士达沃斯，我受邀与麻省理工学院媒体实验室负责人伊藤穰一探讨巨头可能对AI的垄断。我的看法是，目前的体系会持续促使大型科技企业不断发展。它们有能力垄断资源、垄断数据，在商业利益和激烈竞争的驱使下，它们会不断地竞逐更为精进的技术能力，为公司赚取更大的利益。对于较小企业，进入AI市场的难度的确比移动互联网时代的创业高出非常多。我呼吁大力推动AI生态系的开放性。在创新工场北京总部和我们所投的创业公司体系中，已经启动了全新的AI技术相关研发工作。近期，创新工场也成立了人工智能工程院，带着孵化中国AI生态系的目标投入大量资源，招聘培训一批年轻工程师入门AI领域，展开可公开数据集的采集和标注。我们也积极寻求在中国和全球资本市场的融资和成长机会。

我觉得，目前有些公司采取所谓公开透明的做法，其实是很讨喜的宣传手段。但我也确实担心，下面这种两难问题会不会出现：一些公司选择通过自律或推动立法来限制错误的发生，但另一些公司不会这么做。自然而然，比较规范自律的公司由于发展顾虑更多、更全面，相对发展速度上可能放缓；而较不顾虑错误发生的企业，反而可能成为最快速或最成功的那一方。这很难说是一个好的还是不好的发展态势。

例如在自动驾驶技术的开发上，谷歌很小心谨慎，把保护驾乘人员和行人放在了极其重要的位置上，技术不成熟就不推广；相反，特斯拉的Autopilot就很激进，会直接把测试版产品拿给公众进行试验。然而现在看来，特斯拉造出好的自动驾驶汽车的可能性也许要更大一点儿。所以，这个难题对任何规模、任何阶段的企业，都是一个道德层面的决策。

伊藤穰一则认为，随着世界愈发紧密互联，要以“赢家通吃”的玩法去垄断市场越来越难。现在，如果某个个体试图进行垄断行为，会自动触发市场机制。市场竞争会形成限制：如果某方采取垄断动作，对标竞争的另一方会花数百上千万美元去找到超级优秀的AI博士们来迎头赶上。现今人才培养的源头已经到位，但我担心，当某个企业实现了垄断甚或做上了寡头的时候，自然而然能顺势招募AI领域的全球才俊，吸引能够负担他们百万美元酬金的投资人，种种多方因素都正汇聚在一起。市场单方面依赖竞争机制进行调节并不完善。

伊藤穰一说：“因此，我对开复和创新工场在中国推动的开放做法特别感兴趣。而且，资本主义的市场竞争是不会激励大家分享数据、资源和市场的。传统的政府监管方式过去曾经行之有效，但在面对互联网的开放和动态结构时，这种传统的监管方式将会失效。现在这些AI、比特币和其他所有领域中的问题，都不是过去10年、20年间学者们研究的题目，而是真正在资本市场能够快速赚钱的技术。然而相较于开放的互联网，行业不曾充分在开放领域来探讨这些技术衍生的问题和现象，这是我的担忧所在。”150

第五章 机遇来临：AI先行的创新与创业（第6/14页）

第五章机遇来临：AI先行的创新与创业（第6/14页）