从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

文丨冯嘉(郑大科技园发展规划部助理研究员)

美东时间2月9日,郑州大学杰出校友,原微软中国研发集团CTO,金山CEO,现北京智源人工智能研究院理事长、源码资本投资合伙人张宏江,因“在多媒体计算领域有杰出技术贡献与领导力”而被列入美国国家工程院2021年度增补院士名单。

这份名单延续了美国工程院长期以来注重实践的选人标准,但值得注意的是,在入选的133人中,出身于企业的新增院士的比例已经占到了将近45%,其中包括SpaceX、特斯拉创始人马斯克,微软董事长兼CEO纳德拉。

这充分体现了科技创业者或者说企业核心研发人员,在过去的几十年间对美国乃至人类社会科技发展所做出的巨大贡献,也明示了这一群体正在成为全球科技创新的中坚力量。

从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

美国工程院公布2021年度新晋院士名单

张宏江1960年出生于湖北省武汉市,1977年考入郑州大学无线电系,成为中国恢复高考后的第一批大学生。公开的报道显示,张宏江是当时班上最小的学生,在郑州大学的四年学习生活中,最喜欢的是体育活动,特别是打篮球和长跑。此外,他最主要的业余活动就是上图书馆找一些文史类的书籍看。面对浩瀚的书海,他尽情地汲取着专业以外的知识。张宏江认为,大学时代广泛的涉猎,无论文史、还是数理,都为他以后形成科学的思维方式和快捷的反应打下了良好的基础。而他在图书馆查找图书时,就对书目分类萌发出特别的兴趣,这也许对他日后确定自己的科学研究方向产生了不小的影响。

80年代—90年代,张宏江被推荐至丹麦留学,在外期间“建立了现代视频检索和内容查询的一个基本框架,成为计算机视频检索研究领域的‘开山鼻祖’”,并进入位于美国硅谷的惠普实验室,之后归国与张亚勤、李开复一同建立起后来被称为IT界“黄埔军校”的微软中国研究院(现已升级为微软亚洲研究院,MSRA)。2011年,张宏江在中国互联网从PC到移动端的转型期内离开微软,加入北京金山办公软件股份有限公司,并着手建立金山云。

从2018年起,张宏江在Guide2Research发布的世界顶尖计算机科学家排名中,4度蝉联中国大陆科学家榜首。在我们看来,张宏江的每个抉择几乎都切中了国内互联网发展的转折节点,亲历了计算机技术带给中国的巨大改变和互联网里激动人心的商业变革,并从研发人员转型为一位商业领袖,是中国互联网不断发展的大潮中一个成功的科学家和企业家样本。

1、计算机视频检索研究领域的“开山鼻祖”

从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

在既往的采访中,张宏江曾描述过母亲因担心他被下放到农村而偷偷落泪的场景。参加高考被他视作人生中第一个有了选择权的时刻。

从郑州大学无线电系毕业后,张宏江进入了石家庄电子工业部第54研究所(新中国成立的第一个电信技术研究所)并被推荐至丹麦科技大学。在那里,他选择了学习图像处理和检索,并于1992年开始研究现代视频检索和内容查询。

从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

刘炯天向张宏江致贺信、张宏江向刘炯天致回信

从时代背景来看,他选择这个方向有着极为浓重的现实色彩。1987年前后,Multimedia(多媒体)的正式面世给计算机的发展带来了方向性的变革。

根据张宏江的定义,“多媒体计算是指能够对音频、视频以及文本等通信信号进行获取、生成、存储、分析、管理和运输等综合数字化处理的计算机系统”。这种系统能够对原本单一的媒体信息,如文字、图片、声音和影片等进行整合从而形成更为全面的网络信息世界。

其中,相较于信息的其他形式,视频信息的传播速度更快、影响力更大。但由于视频拥有“数据量大、信息非结构化、信息长度不固定、具有时态特性”等特征[1],因此存在解释多义性、可查询信息繁杂、用户描述多样化等多种问题,从而使得视频检索的精准度相对低下。

上世纪90年代初期,Content-Based Video Retrieval(简称CBVR,基于内容的视频检索)是多媒体技术领域最热门的研究方向之一。

社会学家陈昕认为,恢复高考的那个年代“培养了一批理想主义的青年,并且有很强的社会责任感和使命感。”对参与现实的渴望构成了张宏江人生的底色,这成为他选择能够直接与现实发生作用的CBVR以及之后的研发领域的一个强烈动因。

1993年6月,《多媒体系统杂志》的创刊号上登出了张宏江在CBVR领域的第一篇论文。他放弃了当时通过分析视频内容来检索视频的传统方式,转而进行视频结构分析、关键帧检索,“提出视频结构的自动分析、内容表征和摘要、压缩域视频分析的框架和算法”,“建立了现代视频检索和内容查询的一个基本框架”。随后,以这套算法为基础,他所开发的视频分类系统被新加坡国际科学研究所、新加坡电视公司、柯达和英特尔等公司和机构购买了专利许可并进行应用。

互联网的创造性在这一时期显露无疑,多媒体技术进入了迅猛发展期。根据公开资料,“1994年,美国有700万家庭购买了带CD-ROM的驱动器的多媒体计算机”,网络视频也正是在这一时期开始进入中国,并在短短数年内就成长为互联网最大的应用服务。对科学家来说,选择进入一个朝阳行业则意味着有更广阔的发展空间。

在美国,张宏江先后完善了视频图像分析和编目新技术、提出了机器学习的方法,并利用“相关反馈”的原理,进一步提升了基于内容的图像检索率。

1998年底,他成为“ACM 1999年多媒体世界大会”的技术委员会主席,也是担任此职的第一位华人。

这是一条近乎一帆风顺的事业线,尤其是对一个远离故土的人来说。但张宏江可能也并没有想到,1998年年底,张亚勤的来访唤醒了他对于回国的期望,并最终推动了他从研发领域进入到了产业领域。

2、从研发进入产业的中国第一代互联网人

从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

1998年,微软决定在中国设立微软中国研究院(以下简称MSRA),这是张宏江、李开复、沈向洋等人回国的重要契机。

站在现在的视角回看,张宏江等一批IT精英在一个相对微妙的时间点上介入到了中国正式迎来互联网时代的前夜。1999年前后,距离中国正式接入因特网仅仅过去四年,阿里巴巴、腾讯、当当网、携程、盛大和天涯社区等中国初代互联网公司近乎在同一时间出现,并直接支撑和构建了此后近20年的中国互联网生态。

不过,紧随其后的2000年,互联网泡沫的破裂让中国市场风起云涌,多家满怀信心的企业消失于寒冬,留存下来的企业则开始对核心创新技术与人才更加重视。2004年,MSRA有了150位全职研究员以及200名来自高校的实习生,其中相当数量的一批人在离开这里之后进入到互联网企业。

从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

这也显示了计算机技术与其他科创领域的明显不同:中国互联网的诞生与市场经济始终保持着密切的联系,这使得计算机的研发领域与企业乃至产业有着非常近的距离,这是其核心研发人员进入企业运营的优势之一。

选择进入计算机研发体系的人,大多都希望能与现实产生直接的联系,而这一点,在初代互联网人身上体现得更为明显。

2000年至2012年间,世界互联网格局发生了新的改变:本土互联网企业上演了一个又一个精彩的传说,如腾讯即时通信服务活跃帐户数达到7.982亿,与此同时,“2012年上半年,手机网民规模达3.88亿,首次超越台式电脑成为第一大上网终端”。移动端彻底动摇了PC端在计算机界的绝对地位,也动摇了微软头上的王冠。如同当年对中国市场的期许一样,一个新世界在张宏江等人面前徐徐展开。

MSRA的第一代研发人员后来都在中国互联网企业里留下了自己的足迹与新的创新力量:李开复创办了创新工场、张亚勤成为百度总裁、李世鹏为科大讯飞副总裁、沈向洋担任小冰公司董事长。而张宏江,则进入了金山,并以企业业务管理层的身份转向了在接下来的数年里将持续影响中国的云计算。

2011年,中国网民规模突破5亿,伴随而来的是大数据(又称为“巨量资料”)的爆发:“据IDC和EMC联合出版的数字世界研究报告显示,2013年人类产生、复制和消费的数据量达到4.4ZB。”

爆炸式增加的数据则需要存储空间的扩大与计算能力的提升,从而对硬件提出更高的要求。可以说,互联网所留存的数据构成人类在这个时代的记忆,但其存储的成本远比史书更高。张宏江说,4.4ZB“如果全部存到配有128G存储容量的iPad Air里,那么这些iPad摞在一起的高度将达到地球和月球之间距离的2/3”。

科技研发、金融支付和社交媒体等诸多领域都会产生海量的数据,从而导致多数企业无法承载日渐增多的硬件存储成本和物理空间成本。因此,能够通过虚拟化技术租借计算资源、降低企业运营成本的云计算成为学术界与产业界的关注焦点。

从理论上分析,云计算“是分布式计算、并行处理和网格计算的进一步发展,它是基于互联网的计算,能够向各种互联网应用提供硬件服务、基础架构服务、平台服务、软件服务、存储服务的系统。”[2]

据Gartner咨询公司预测,“未来几年云计算市场平均增长率在18%左右,到2023年云计算市场规模将超过3500亿美元。”

从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

但这种系统背后的使用逻辑并不复杂:有计算资源与能力的企业来部署计算设备,通过资源集中来降低成本,有需要的企业或政府通过付费购买云空间来避免使用昂贵的实体设备。实际上是对互联网资源的管理和重新分配。张宏江判定,“云和大数据就是下一个风口”。

2011年,张宏江接受了雷军的邀请,担任金山软件CEO,开始研发金山云。

“用户数据产生后,云计算可以提供高速存储介质、图型数据库、高密度存储机柜、冷热数据分级技术以及强大的数据分析和弹性计算能力,最终通过CDN分发为数据使用者提供各类数据应用,如人脸识别等。在成本方面,以小米图片数据量计算,500亿张照片的规模下,使用云计算模式,成本不到传统IT模式的一半。”张宏江说。

直至今日,无论是从产业角度还是从科研角度,云计算都仍然是一块还未被完全发掘的宝藏之地。根据新浪财经发布的数据,“去年中国新增8.6万余家云计算相关企业,企业服务领域获得融资1700余次,总额超5000亿元。”而随着“我国互联网、金融、医疗、新能源以及众多传统行业对算力的需求不断增长,数字化转型进程加速,云计算市场规模到2025年将达到万亿级别。”

但我国云计算目前的成绩并不算亮眼。这主要是由于:第一,我国的云计算领域尚未形成统一的定义和管理标准,市场并未发育成熟。第二,企业数据与信息的安全性、隐私性无法受到绝对保障,特别是牵涉到敏感部门的数据。第三,突破云计算的相关技术,如分布式块存储、高吞吐和低时延、稳定性以及故障迁移等仍然存在困难。

但从企业运营角度来看,张宏江和他的团队可谓是交上了一份漂亮的答卷。金山任职期间,在他的带领下,“金山云持续获得C轮及C+轮融资,该轮系列融资总金额超过1亿美元,公司估值则超过11亿美元。”

2021年,据金山云发布的Q3财报数据显示,“截至9月30日,金山Q3营收24.13亿元,同比增长39.6%。”

现在,张宏江又进入了一个具有颠覆性的科技和经济领域:人工智能。

2016年,张宏江从金山退休后,再次选择了新的征途:担任北京智源人工智能研究院理事长并投身于AI的发展。其背景之一是,20世纪70年代以来,人工智能一直被称为世界三大尖端技术之一。2016年AlphaGo与李世石的对弈之后,人工智能已经成为优秀企业乃至国家经济体竞争的关键赛道。

“在做到峰值时离开,然后去做另外的事情。”张宏江曾如此评价自己。

而在一次采访中,他还说,“我们还想做事,还想做很多事”。

参考文献:

[1]陈慧琼,陈慧君,刘宗田.基于内容的视频/多媒体数据库检索技术[J].计算机科学,2002(02):111-114.

[2]张建勋,古志民,郑超.云计算研究进展综述[J].计算机应用研究,2010,27(02):429-433.

(注:本篇文章中涉及到张宏江院士的既往经历的描写,均源自公开报道。)

往期推荐:

郑大生科院教授王爱萍:让团队研制的新冠肺炎疫苗服务于疫情防控

郑州大学化学学院副院长付永柱:电池的发展空间还有无限可能

从郑州大学走出的美国工程院院士:张宏江的初心、光荣与梦想

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注