X

全球AI技术制高点之争,中国排哪里?

【文/任泽平、连一席、谢嘉琪】

人工智能产业竞争是各国政策、基础研究、技术、资本等各方面综合实力的竞争。目前各国政府高度重视人工智能,在基础设施搭建、基础科研、人才培养、资助研发、合作交流等方面给予支持鼓励。资本和企业也积极寻求商业落地场景,协助技术转化。技术落地于垂直领域,继而产生新的数据,促进算法更新迭代,还可以进一步服务于垂直领域,如此循环往复、不断发展。在这场全球竞赛中,中国的优势在于拥有海量数据和实践经验,但在基础科研、基础技术、前沿拓展方面仍存在薄弱环节。

2020世界人工智能大会云端峰会7月9日上午在上海世博中心开幕,上海市委书记李强在开幕式上致辞。图自上观新闻

一、政策:全球主要国家和地区均高度重视

以AlphaGo(阿尔法围棋)事件为分水岭,人工智能获得了空前的关注,主要国家和地区纷纷加入这场事关未来大国科技实力的竞争当中。因为基础设施尚未普及、技术超前、理论分支众多等,人工智能的发展经历过三次潮起潮落,直到2016年DeepMind(深度思考)公司研发的AlphaGo挑战世界顶尖围棋选手李世石,并获得最终胜利,才让全球重新感受到人工智能所带来的魅力。AlphaGo在人机大赛中表现出的与人类相似甚至更胜一筹的观察、思考、决策能力,吸引了世界各国和地区着手并加强人工智能领域的研发。据不完全统计,目前全球包括美国、中国、欧盟、日本、韩国、印度、丹麦、俄罗斯等近30个国家和地区发布了与人工智能相关的战略规划和政策部署。

其中,约80%的国家在2016年之后密集发布相关政策和官方计划,例如美国《国家人工智能研究与发展战略规划》,英国《机器人技术与人工智能》,中国《“互联网+”人工智能三年行动实施方案》等。

从发布的政策规划来看,各国和地区认同人工智能对未来的人才、产业升级、社会福祉、全球影响力的重要性,并作为国家级战略进行推进。根据各国科研实力、人才汇集程度、基础设施完备度、国情等因素,各国和地区的侧重点有所不同。

美国致力于维持全球科技霸主地位,人工智能位于其科技版图的核心。从奥巴马时期到特朗普时期,美国一直积极支持人工智能的研究,并将政策态度从“引导和扶持”转为“必须领先”。2019年,美国陆续颁布《维护美国在人工智能领域领导地位》《国家人工智能研发战略计划》《美国人工智能时代:行动蓝图》三部重要政策,表现美国政府对人工智能技术的高度重视和维持领先地位的决心,主要措施包括:加强联邦政府资助,美国认为政府资金支持是参与推动科研进步的重要环节,但官方资助力度逐渐减弱,1976—2018年,联邦政府的研发支出占GDP比重从约1.2%下降为约0.7%;此外,通过减税来鼓励企业加大研发投入;发挥硅谷创新力量,建立包括计算机视觉、语音语义、开源框架平台等在内的技术和产业生态链;重视以芯片为主的硬件层,包括促进国内半导体制造产业、建立多边出口管制、保护供应链等;重视全球性人才,包括对国内人才的培育和国际人才的吸引,认为有必要简化相关人才的H-1B工作签证申请程序;加强合作,包括国内外组织研发中心或联合实验室、举办创新比赛等;开展前沿技术研究。

欧盟重点关注工业、制造业、医疗、能源等领域,强调发挥创新创造力,应用人工智能使制造业及相关领域智能升级。与美国类似,欧盟较早对人工智能进行研发,并通过颁布政策、扶助资金、推出国家级计划、建立重点科研实验室等行为支持人工智能技术和产业发展,例如2018年颁布的《人工智能合作宣言》。此外,作为“数字欧洲”计划和“地平线2020”计划中的重要环节,人工智能相关项目也将接受数十亿欧元的投资。首先,与美国对比,欧盟更加重视人工智能的道德和伦理研究,并在多份文件中表明人工智能发展需要符合人类伦理道德,例如2020年3月颁布的《走向卓越与信任——欧盟人工智能监管新路径》明确提出,为解决能力不对等和信息不透明问题,保障人民相关权利,需要建立人为监督的监管框架,重视数据安全和隐私保护。其次,欧盟对人工智能的应用侧重更细化,不同于美国的全方位领先,欧盟希望借助自身在制造业、工业、汽车等领域的优势,利用人工智能技术进行产业强化升级,例如颁布《通往自动化出行之路:欧盟未来出行战略》。

日本由于面临严峻的少子化与老龄化问题,着重研究人工智能在机器人、医疗、汽车交通等领域的应用。

如图5.2所示,日本生育率长期低迷,老龄化水平长期位居世界第一。1992年日本劳动年龄人口占比见顶,2008年日本人口总量见顶,这对日本经济和社会发展产生了深远的负面影响,日本面临着例如养老、健康等问题的挑战。在这一背景下,人工智能被认为是日本经济增长的“第四次产业革命”,以2016年发布的《日本下一代人工智能促进战略》为起点,不断推出相关政策规划,围绕“基础研究、应用研究、产业化”三个方面,其中日本总务省下设的信息通信技术研究所和文部科学省进行人工智能理论和技术研发,经产省解决应用场景问题,经产省建立的人工智能研究中心促进产学研合作,主要承担成果转化和推广。

中国人工智能呈三阶段逐步推进,重视与制造业和服务业的融合。自2015年起,我国人工智能相关政策从智能制造时期、“互联网+”时期(以《“互联网+”人工智能三年行动实施方案》为代表),到“智能+”国家战略时期(以《新一代人工智能发展规划》为代表)演变。政策重心从核心技术攻克到实际场景应用,从特定行业到跨界融合,从单项技术到人机协同。与美国和欧盟类似,我国也强调建立相关试点项目,包括技术示范试点、政策试验、社会实验。

二、基础科研:美国最强,中国快速追赶

中国人工智能领域论文数量增长较快,但论文质量与美国依然存在差距。如图5.3所示,全球累计发布人工智能论文超过70万篇,中美两国是论文发表大国,2018年中美两国分别发表论文2.5万篇和1.6万篇,合计占全球比重达46.5%。从增长趋势来看,美国保持匀速增长,中国自2014年后增长较快,中国论文数量占全球总量比重从1998年的8.9%上升为2018年的28.2%。从代表论文质量的FWCI(平均加权引用影响)指数来看,如图5.4所示,中国论文质量也在稳步提升,从1998年的0.43提升至2018年的1.39。美国保持全球最高水平,长年保持在2左右,2018年FWCI指数达2.38。

从论文发表机构类型来看,包括中国、美国、欧盟27国等在内的各国和地区均以高校为核心科研力量,2018年三者高校论文产出占各自总产出的92.1%、84.6%、90.7%。除高校外,中美两国的主力科研主体有所不同。如图5.5所示,2018年中国科研机构产出约为中国企业产出的3倍。如图5.6所示,同期美国企业产出约为美国科研机构产出的1.6倍。

三、数据量:人工智能时代的“原材料”,中国具有规模优势

电脑和智能手机的普及、互联网和移动互联网所累积的数据爆发,是促进人工智能技术和应用突破的重要原因之一。人工智能需要做到“感知、思考、决策”,首先就需要足够多、足够好的原始数据对计算机进行训练,犹如培育良驹,必须喂足新鲜的牧草。“足够多”代表数据的数量要多,电脑的发明使运算简化,并让信息以电子化形式保存,智能手机的普及使全球网民渗透率大幅提高,两者令大量的数据被保存。“足够好”代表数据的质量要佳,互联网的诞生极大地缩短了信息交流的物理距离,提高了传播速度,各类互联网类服务应用程序诞生,其产生的数据类型也更加多样,包括浏览网页喜好、外卖点单频率、行程记录等,只有多元丰富的数据才能应对各种训练人工智能的要求。数据增长和应用依赖于信息及物理的基础设施构建,中国将成为全球最大的数据中心。得益于人口数量、互联网渗透率、智 能手机渗透率、网速等因素,如图5.7所示,2018年中国拥有数据量7.6ZB,占全球数据总量的23.4%。随着5G、物联网等的发展,通信设备接入数量和承载能力的提高,终端消费者的增多,预计中国的数据量将在2025年达48.6ZB,占全球数据总量的27.8%(见图5.8),成为全球最大的数据集中地,这将极大地促进和丰富人工智能训练,相关模型结构和结果也会更精准。

四、技术:深度学习推动本次人工智能热潮

足够多、足够好的数据支撑人工智能“感知”阶段,而人工智能算法使计算机拥有思维,从而达到“理解、决策”,深度学习在此过程中做出了巨大贡献。深度学习是一类模式分析方法的统称,计算机通过学习样本数据来掌握内在逻辑和规律,从而拥有分析能力,这项研究最早可以追溯到1958年弗兰克·罗森布拉特发明的感知机(Perceptron)。利用感知机,可以进行图像区分训练,例如,最常见的是从水果堆中选出“苹果”或者“香蕉”。然而由于当时缺少足量的数据,该项研究陷入瓶颈,并出现过度拟合(Overfitting)问题。例如学生希望通过练习相似的题目来掌握一种题型,但是训练量不够大,学生并没有理解题型背后的知识点,因此试题一旦发生些许变化,学生便无法解出答案。后来,科学家通过研究人脑,试图模仿脑神经网络机制来进行图像、声音等分类工作,逐渐演化成如今的深度学习(见图5.9)。

深度学习的发展推动了人工智能基础应用技术的突破,自2010年起,全球包括计算机视觉、语音语义等基础应用技术的专利申请量急速增长。

计算机视觉技术主要是让计算机拥有人类的眼睛,学会“看”图片、文字、视频等,经常用于图像识别、人脸识别等,适用于自动驾驶、安防、人脸支付等领域。从计算机视觉和图像识别相关的技术申请情况来看,截至2018年12月31日,全球共申请14.3万项同族专利,中国、美国、韩国成为全球申请数量排名前三的国家,分别为5.3万项、2.4万项、2.3万项。从技术授权情况来看,美国技术授权量全球最高,达1.3万项,日本和中国排名为第二、第三,分别为1.04万项和1万项。从申请人来看,佳能、东芝、三星为前三位申请人,申请数量分别为2900项、2700项、2300项。

语音语义技术主要是让计算机学会“听、读”文字、段落、文章等,经常用于文字识别、语音情感分析、人机对话、声音定位等,适用于翻译软件、车载操作系统、智能音箱、语音助手等领域。从语音语义技术相关的技术申请情况来看,如图5.10所示,截至2019年12月20日,全球共申请4.3万项专利族,中美两国依然是这个领域的主要申请国,合计占比超过75%。从申请人来看,如图5.11所示,截至2019年12月20日,语音语义领域的申请人以企业为主,其中IBM(美国国际商用机器公司)、三星、微软为前三位申请人,申请专利量分别为1741项、890项、821项。从专利授权人来看,微软、IBM、Nuance(一家领先的语音和语言理解解决方案提供商)为前三位授权人,授权量分别为672项、468项、440项。从国内企业情况来看,百度成为唯一一家在语音语义技术领域申请量和授权量均位列全球前十的企业,分别排名第五和第八。

中国人工智能领域的专利申请量呈逐年上升趋势,根据国家工业信息安全发展研究中心《人工智能中国专利技术分析报告》数据,2018年国内专利申请量达94539件,为2010年申请量的10倍。截至2019年10月,百度、腾讯、微软、浪潮、华为分别以5712、4115、3978、3755、3656件专利申请量位列国内人工智能专利申请量前五。

人工智能芯片的出现显著提高了数据处理速度,支撑了日益复杂的算法处理庞杂数据,是人工智能发展的重要基础。随着处理的数据量增多,从通用场景到各类特定场景,算法模型设计的框架和层数也越来越复杂,这对基础硬件提出了更高的运算要求。从相关专利申请 情况来看,中美两国是申请大国,如图5.12所示,截至2019年10月,中美两国人工智能芯片专利申请量分别为1.6万项和1.1万项。从相关申请人来看,传统芯片和半导体企业更有优势,其中三星、日立和IBM是该领域的前三位专利申请人,从近年申请趋势来看,三星和英特尔表现得更积极。从实际应用产品来看,如表5.1所示,目前较典型的有英特尔EyeQ系列、英伟达Xavier系列、华为昇腾310、寒武纪Cambricon 1M系列、百度昆仑芯片等。

中美两国是全球人工智能企业的聚集地,中国企业集中于应用层,美国企业集中于技术层。截至2019年2月,全球共有人工智能企业3438家。美国以1446家位列第一,全球占比42.1%。中国以745家位列第二,全球占比21.7%。从企业类型来看,如图5.13所示,中国主要为应用层企业,美国主要为技术层企业。中国应用层人工智能企业占比最高,为75.2%;技术层居第二位,占比为22%;基础层企业占比最少,仅为2.8%。而美国更重视技术研发,基础层、技术层、应用层这三类企业占比分别为39.1%、57.7%、3.2%。

五、资本:全球投资持续上升,中美两国人工智能企业最受资本青睐

人工智能技术突破和政策支持吸引资本持续投入,过去10年平均投资年增速约为50%。根据斯坦福大学数据,全球对人工智能初创企业投资金额从2009年的不到10亿美元升至2019年的近400亿美元,其中从2014年开始投资加快,2014—2019年11月,全球人工智能初创企业共获得1.6万笔投资,平均每笔投资金额约860万美元。

从国家和地区来看,如图5.14所示,2018年1月—2019年10月,美国公司和中国公司是全球投资重点。由于美国的技术领先性,美国无论是被投资金额还是被投资企业数量均为世界第一。尽管中国被投企业数量不及美国,但由于每笔投资金额较高(例如,旷视科技2018年3月C轮融资4.6亿美元,商汤科技2018年4月C轮融资6.2亿美元),中国初创企业被投资金额仅次于美国,约为250亿美元。此外,英国、以色列、加拿大、法国、日本、新加坡、德国和印度是被关注较多的国家和地区。

任泽平、马家进、连一席:《新基建》,中信出版社2020年6月版。

本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。