2019世界创新者年会(World Innovators Meet 2019, 简称WIM2019),于2019年12月6日在北京·国贸大酒店拉开帷幕。本届大会由中国企业联合会指导,亿欧·EqualOcean、工业和信息化科技成果转化联盟联合主办,以“科创4.0:共建全球化新未来”为主题,6000余名来自美国、英国、法国、澳大利亚、瑞士、以色列、俄罗斯、西班牙、葡萄牙、印度、新加坡等二十余个国家和地区的创新者齐聚一堂,共同总结2019年世界科技与产业创新的成果,预测2020年最新创新趋势。
本次大会为期三天(12月6日-8日),采用“9+1”的会议结构,即于8日举办的“1”场创新领袖峰会,于6日和7日举办的“9”场主题论坛。9场论坛分别围绕当下最热门的零售新消费、金融科技、投资新趋势、智能硬科技、医疗大健康、产业互联网等领域,以及青年、女性和科学企业家等群体展开。
在12月8日举办的创新领袖峰会上,眼神科技创始人兼CEO周军发表了主题演讲。他的主要观点如下:
(1)多模态不是非此即彼的组合替代,而是基于数据融合的算法融合,并依托平台决策为支撑。
(2)“多模态”是AI技术的下一步,更是AI落地的必经之路。
以下是周军演讲全文(部分有删减)
感谢主办方的邀请。今天又站在这里,和去年不同,去年是讲人工智能,今天讲的是“十年一顾多模态”。这个单模态是什么,两模态是什么,三模态又是什么?多模态到底是什么?
人工智能发展了这么长时间,大家对他的预期越来越接近实际情况。刚刚一个朋友问我,人工智能到底发展到哪一步了?说实话,我不知道。我突然想讲一个小故事。养宠物的人很多,当你回到家里面,小狗会根据你的情绪做出反应:你开心的时候,它会陪你一起开心;当你累的够呛在沙发上时,它会乖乖的呆在你的身边。我们家有一个小狗叫天球,如果昨晚它把你的拖鞋叼走了,当你早上醒来的时候,它会立刻叼回来;当你走向衣橱的时候,它会立刻跑到门口等着给你开门。这么简单的一个小狗,它能根据你的表情、行为时间,能判断出你是否开心并做出一系列的反应。
我想给大家说一下,就这么一个小狗的智商,人工智能需要花多长时间做到?按照现在的人工智能,或者弱人工智能时代,没有20年很难做到这一步。这意味着,人工智能再过20年都很难达到小狗的水平,那么达到小孩的水平需要多少年?
那么人工智能接下来该怎么做?什么是多模态?
让我讲讲多模态,眼神科技从事人工智能20多年,十多年前就在从事多模态的技术的落地,我有一些感想感悟、落地的案例和经验想分享一下。
多模态在去年开始成为焦点,很多知名企业比如说华为、腾讯、百度,这样的AI大厂,都开始逐渐的把目光瞄向多模态,很多创业公司也在思考这个方向性的问题。华为投资多模态语义理解的公司,腾讯的AI Lab的俞栋博士有那么一句话“多模态是迈向通用人工智能的重要方向”。通用人工智能是弱人工智能时代需要走向的一个方向,弱人工智能是 “见多识广”,解决的是感知的问题,通用人工智能具有几个属性:自学习、增量学习、增强学习,这些内容结合在一块,是强人工智能。从弱人工智能到强人工智能的奇点,截止目前还没有突破。 “见少知多”、“不见而预知”的强人工智能时代,这是很多年国际前沿人工智能公司一直努力的事情,技术遇到了天花板。
多模态指的是多传感器融合,不是非此即彼的组合替代。指纹识别、人脸识别、虹膜识别、指静脉识别,每一个技术、每一个算法用一个传感器解决一个问题叫单模态。随着AI的发展、信息增加,AI被赋能被期待的模态越来越多,比如文本识别,图片识别、文本和图片组合识别、图片和视频组合识别等,各种信息从不同的方位,不同的传感器到来,单一识别技术已经很难满足这样的发展。
如何解决识别误导和传感器感知局限问题,如何让机器像人一样感知和理解这个世界,我认为是多模态才可以解决的问题。眼神科技致力于让机器和人交流的时候,使机器具有像人一样的眼睛,眼神科技因此而得名。
多模态市场需求旺盛,国外领军企业坚持多模态。
国外知名的生物识别企业都在研究多模态,多模态已经成为生物识别发展趋势,EBA(欧洲生物识别行业协会)告诉我一个数据,到2023年欧洲生物识别的诉求达到115亿美金。根据我们公司去年的情况,我们的人脸、虹膜、指纹三种技术在公司业务中已经形成了“三分天下“的收入角色。
眼神科技在多模态生物识别领域已经耕耘了20年时间。从1998年到2005年,公司一直在做指纹识别,在这期间也发现了指纹存在的问题,于是和人脸进行融合。这个阶段是公司指纹技术发展、指纹和人脸融合的发展阶段;2005年到2013年阶段,这也是我来北京创业的阶段。在这个时期,公司利用成熟的指纹识别技术,打开了全国50%的银行市场。之后又开发人脸识别、虹膜识别技术,虹膜识别技术我们从2005年开始研发,到了2009年已经达到了全球顶级程度,这是整个基础算法形成的过程。
在面向市场的推广过程中,我们发现单一技术决策存在的一些问题,更需要打造分层决策,于是我们打造了ABIS多模态统一平台。整个公司技术研发过程中,我们获得了400多项发明专利,获得了国家技术发明二等奖。多模态决策体制是如何形成的?包含了融合算法,平台决策,ABIS平台三个方面,是基于数据融合的算法融合,并依托平台决策为支撑打造。
从AI应用最前线——金融行业看多模态
眼神科技的研发一直是陪伴一个行业长大的,这个行业就是金融行业。公司在1998年就开始研究指纹,2002年,我们开始定位银行并且做试验。指纹的发展存在的最大问题,就是有很多人天生指纹浅、经常参加体育活动和体力劳动的人指纹也非常浅,举例有一家公司有20万人,其中1%的人指纹识别困难,用解决方案也无法解决。“科技不从善“让指纹识别技术遇到了巨大挑战,于是我不得不把指纹和人脸结合在一起解决问题。解决了银行内部风控的问题后,如何降本增效,如何获客成为银行发展的第二阶段。用人脸识别可以解决获客问题,可以做到人脸联网核查和VIP的识别。运营过程中又发现,尤其手机远端获客,在帮着银行降低成本和获客的同时,会遇到防伪的问题,人脸识别不能作为获客的单一的识别手段,于是我们把人脸和虹膜识别组合起来识别。随着银行开放和生态的建设,”追客”和”帮客”成为银行重要的需求,这对生物识别和人工智能提出更大的挑战。如何在场景中识别人、物、客,以及客户需求的把握、精准营销如何去做,让银行服务进入你的消费空间,进入你的生活,这个过程就需要生物识别技术的融合应用。今年,眼神科技中标了工商银行人脸识别产品引入和虹膜、指静脉算法提升服务项目,实现了指纹、人脸、虹膜、指静脉四项核心生物识别技术与工商银行全面合作。多模态是现在很多银行都在努力探索的方式。
到目前为止,眼神科技通过多模态生物识别技术,服务全球2000多家客户,渠道客户1000多家。经历了二十年发展,在国内可以说是陪伴金融成长,也可以说是被金融驱使,一刻没有停过,过去二十年一直在创新。总结一下,眼神多年的发展过程中,遇到问题、解决问题,用多种生物识别技术融合决策、多种技术解决一件事情。
我认为多模态是长期发展的一个方向。希望更多的创新者,在各自领域的单模态上,好好的创新、耕耘,大家一起为人工智能未来的发展创造一个良好的环境,谢谢大家!