冯津伟,声学专家,阿里巴巴iDST智能语音交互团队研究员,世界级音频专家。
南京大学电子科学专业学士,南京大学声学硕士,南洋理工大学电子信号处理硕士,美国弗吉尼亚理工大学声学博士。曾任音视频会议行业领导企业宝利通(Polycom)声学设计和信号处理首席工程师,拥有十余项美国专利。2017年11月,入职阿里巴巴人工智能核心团队iDST。
2017年11月30日,阿里巴巴宣布前Polycom(宝利通)声学设计和信号处理首席工程师(Principal Engineer)冯津伟入职人工智能核心团队iDST(Institute of Data Science and Technologies,数据科学和技术研究院),担任智能语音交互团队研究员,将负责语音交互设备端的声学设计和信号处理研究工作。这是继2017年6月任小枫入职后,iDST迎来的又一位大牛级人物。
冯津伟的研究方向为“下一代人机自然交互技术”,该领域已经得到阿里巴巴重点投入,此前成立的“达摩院”就包含这一研究领域。阿里巴巴iDST透露,冯津伟已参与一秘密项目开发,项目在全球没有先例。
01学在南大
冯津伟曾就读国内顶尖声学研究机构南京大声学研究所,师从音频声学泰斗沙家正先生,并与导师一起研制出了全球第一台扬声器纸盆共振频率的自动测试系统,极大地帮助了国内的电声行业提高生产效率。随后冯津伟博士毕业于在主动降噪领域著名的弗吉尼亚理工大学VAL实验室。
02供职宝利通
冯津伟博士毕业后一直在音视频会议行业领先者宝利通担任声学设计和信号处理首席工程师(Principal Engineer)。
Polycom是语音和视频协作解决方案领域的全球领导者,占全球视频会议市场份额第一。冯津伟在Polycom工作17年,拥有十余项美国专利,大部分已产品化,是名声在外的世界级音频专家。他曾主持开发基于麦克风阵列的视频跟踪系统,即在多人视频会议时,摄像头能基于方位和距离,精准定位发言人,产品创新性引业内效仿。冯津伟为其开发的圆形麦克风阵列算法与音频信号分类器是沿用至今的业界标杆。
03入职阿里
人工智能的崛起,让冯津伟看到了声学处理在下一代人机自然交互领域的价值。2017年11月30日阿里巴巴宣布冯津伟入职人工智能核心团队iDST。冯津伟入职后将依托其在声学与信号处理领域的背景,主持领导语音交互设备端的研究工作。声学是物理学分支学科之一,研究媒质中机械波的产生、传播、接收和效应。以时下最热门的智能音箱为例,如何选择麦克风的材质、摆放位置、结构,就是声学设计要解决的问题。
关于加入阿里巴巴,冯津伟认为是一次全新的机会。他表示,过去自己的专业知识基本用于会议模式,而未来阿里丰富的智能交互场景将为声学设计与信号处理的发展提供宝贵的实战经验。
阿里巴巴iDST语音团队负责人鄢志杰表示:冯博士的入职,是物理学和互联网间的‘跨界’。阿里严肃看待智能语音交互技术全链路,逐步组建世界级专家团队。从源头和信号采集开始,在端上做突破性的智能语音交互体验。
此前,iDST语音团队的技术成果已通过阿里云人工智能ET等对外输出,在法庭庭审识别、智能客服、视频审核和实时字幕转写、声纹验证、物联网等多个场景成功应用。在语音交互产品方面,阿里iDST研究的技术平台能够精准转换用户的语音为对互联网内容和服务的意图,触达手机、IoT设备、互联网汽车、电视、智能音箱等各类终端,如与斑马网络、上汽合作的的荣威互联网汽车、与海尔合作的人工智能电视等。
阿里巴巴在科技创新领域成果斐然。阿里此前重磅宣布将投入1000亿元成立“达摩院”,用于涵盖基础科学和颠覆式技术创新的研究。另外,阿里“强化学习”、“刷脸支付”、NASA计划等突破迅速。正是因为阿里巴巴在科技领域的实力和成就,吸引了全球的科技人才纷至沓来。
04南大声学
南大声学专业是我国唯一的声学重点学科,本科专业也是全国唯一的声学本科专业,是全国唯一的声学本科人才培养基地。是南大最具有国际影响力的专业之一,不少研究在国际上处于领先地位。
南京大学声学研究所是我们最早建立的声学教学与科研基地。1954年,魏荣爵院士在南京大学物理系创办了声学专业,建立国内首个声学教研室;1978年经教育部批准扩建为声学研究所;1988年,被批准为首个国家重点学科和首批博士点授权单位;设有近代声学教育部重点实验室。
南京大学声学研究所在基础研究领域具有很高的国际学术声誉。近年来形成来了光声信息技术、声电子器件与系统、有源噪声控制、通信声学、声学人工材料、医学超声等特色交叉研究方向。南京大学声学研究所学术气氛浓厚、科研设备先进,是国内一流、国际著名的声学研究基地;常年承担各类国家级基金项目。
南京大学声学研究所师资力量雄厚,拥有从本科生到博士、博士后各层次的声学人才培养系列,并与美国、英国、澳大利亚、日本、韩国、德国、比利时、新加坡、香港等国家和地区高校和研究所建立了合作与交流关系。学生就业率高,升学率高。
来源 | 氧分子网、中国日报网、零镜网、“阿里云”公众号、南京大学声学研究所网站
美编、整理 | 饶钊