人工智能领域,深圳实力如何?记者采访了这些高校科研院所

©原创   2018-05-24 18:43   读特记者 王欣 闻坤

人工智能已成为当下最炙手可热的技术,随着算力、算法的等基础技术条件的成熟,人工智能开始得以应用在各行各业。在这场数字革命浪潮中,国内各大城市纷纷发力竞跑,试图抢占人工智能领域的制高点,而在基础研究和底层算法方面,处于AI城市实力第一梯队的深圳情况如何?

连日来,记者采访获悉,从技术发展情况来看,国内人工智能研究领先的大学在深圳基本都有布局并在不同领域形成一定特色和优势。北京大学深圳研究院在机器听觉感知和语音识别,北京大学深圳研究生院在机器人视觉处理,清华大学深圳研究生院在教育和医疗方面应用,深港产学研基地在音频搜索与类人自然语言处理,哈工大深圳研究生院在机器博弈算法,深圳大学在大数据与机器感知传感器,深圳先进院在图像处理、VR和智能医疗等。上述研发机构汇集了多位顶尖学者,包括国家千人计划特聘专家、长江学者、万人计划专家、杰青等,在国内具有重要的影响力。

中科院深圳先进院:视频行为理解技术世界领先

汤晓欧,麻省理工学院博士、香港中文大学信息工程系系主任,全球人脸识别技术的开拓者与探路者。2014年,汤晓欧团队发布的研究成果显示,其原创的人脸识别算法,准确率达到98.52%,首次超越人眼识别能力。2016年,他所率领的人工智能团队,与麻省理工、斯坦福大学等人工智能领域最前沿的研究团队一起,入选世界十大人工智能先锋实验室,成为亚洲唯一入选的实验室。同时,他所创立的人工智能企业商汤科技,也始终位于人工智能产业的第一集团军。

在汤晓欧教授的名片上,记者看到一个熟悉的“深圳元素”——他同时兼任着中国科学院深圳先进技术研究院副院长。这意味着,汤晓欧团队已经在深圳布下了一个积极推进人工智能基础研究的“尖刀连”。

中科院深圳先进院集成所副所长、多媒体集成技术研究中心主任乔宇,正是这支“尖刀连”的领队者。从日本东京大学回国工作的乔宇,举手投足之间仍是学者的谦和与严谨。他告诉记者,在人工智能底层研究的“算法”领域,他们这支“尖刀连”率先提出“轨迹卷积特征TDD”,在一些视频数据集取得领先的识别率,领先国际顶尖的牛津、谷歌、斯坦福、脸谱等课题组当时的结果;他们开发的“运动向量卷积神经网络”将处理速度提升40倍。

该团队在CVPR、ICCV、IJCV等国际顶级视觉会议和期刊上发表20多篇论文,是全世界在行为识别领域发表顶级论文最多的团队之一。

跻身世界最前沿研究团队之列,保持与国际一流科研团队交替领先的局面,这是深圳的新高度,也是中国的新高度。

清华大学深圳研究生院:与医疗、教育碰撞出“火花”

教育部印发的《高等学校人工智能创新行动计划》中,明确提出推动智能教育和智能医疗的应用示范。

2016年4月,清华大学宣布推出的智能教学工具——雨课堂,将PPT、MOOC、手机微信融为一体,预示着我国高校教学信息化将进入一个新的发展阶段 。

教育部在线教育研究中心“混合式教学试点单位”负责人、清华大学深圳研究生院副研究员袁博表示,长期以来,传统的课堂教学类似于一个“黑盒”的运作过程,教师通常只能单方面完成预设的教学环节,而无法深入了解每个学生的学习状态和学习习惯,难以真正做到因材施教。通过雨课堂,课前教师可以将包含慕课(大规模开放在线课程)视频、习题和语音的预习课件推送到学生手机上的客户端;课上,教师可以实时发布习题、开展弹幕互动,并实时查看学生的答题数据;课后,教师可以推送作业和复习材料,并及时掌握学生的完成情况。

随着智慧教学工具的大规模普及,教育数据在数量和维度上都出现了显著的变化。截至2018 年3 月,全球共有超过18 万个班级、298万名师生使用雨课堂开展教学活动,覆盖国家超过60 个,月平均活跃用户数超过137 万。

袁博表示,预计到2020 年,教育行业将发展成为全球大数据应用的第八大市场,仅中国教育市场的规模就将达到3 万亿元。随着以雨课堂为代表的智慧教学工具的飞速发展和广泛应用,前所未有的学习行为数据必将在教育领域产生深远的影响。

人工智能技术呈现与医疗领域不断融合的趋势,深圳高校在此领域的基础研究亦有布局。

清华大学深圳研究生院副教授董宇涵表示,在国内医疗资源不足的情况下,通过人工智能在医疗领域的应用,可以提高医生的诊断准确率和效率,还可以辅助医生进行病变检测,实现疾病早期筛查甚至预防。

董宇涵举例说,目前他正在研究专科疾病特别是一些慢性病,如糖尿病、心脑血管疾病及呼吸睡眠障碍等,可以通过对平时的脑电、心电、血压、血糖、呼吸等数据的分析处理来进行辅助诊断和疾病预警。通过人工智能技术的健康管理,不仅能缓解紧张的医疗资源,还能降低患者的医疗支出和政府医保支出。

北京大学深圳研究生院:计算机视觉紧抓国际前沿

在人工智能的另一个重要领域——计算机视觉方面,北京大学信息工程学院、“图像与视频处理技术”核心成员、市智能多媒体与虚拟现实重点实验室主任王文敏教授团队,在视频生成领域的研究已取得重要进展。

计算机图像处理分为图像识别、图像理解和图像生成三个阶段;视频也分为三个阶段,即视频分析、视频理解和视频生成。如何让计算机去理解图像,甚至根据文字描述生成一张新的图像;如何通过一副或若干幅图像,预测生成一段新的视频……这些都是他们正在研究的人工智能黑科技。其团队在NIPS、ACM Multimedia、IEEE多媒体大数据等国际顶级会议上发表多篇论文,针对视频的时空特性,提出了深度交替神经网络,提出了一个全新的时空金字塔池化层,实现了一个高效的视频动作识别系统。

王文敏告诉记者,视频生成技术的应用场景非常广泛,比如无人驾驶技术就可以通过视频生成进行突发事件的预测,从而及时避险。

深港产学研基地:语音识别领域华南区的“领头羊”

如果你是一家最早介入人工智能的企业,那么你将面临这样一个激动人心的场景:上游平台架构基本开源,基础研究海内外几乎同步,产业前景全人类看多……在这片千帆齐发的局面中,你是就近俯拾一片产业落地的应用场景,快速获利、快速分享行业成果;还是艰难地啃啮底层基础研究,花大力气掌握行业核心技术?

深圳的多家人工智能企业和研究机构不约而同做出了相似的路径选择:立足深圳完整的产业链和丰富的应用场景,积极参与应用落地;同时深挖产业核心技术,努力使自己的前沿技术与国际同类研究并驾齐驱。

深圳语音搜索及应用工程实验室是深港产学研基地麾下一个面向产业应用具有鲜明特色的人工智能领域研发机构。据实验室主任王昕介绍,该实验室的语音识别准确率达到94-95%,语音搜索实时高效,处于国内领先水平。

实验室在语音识别与搜索领域拥有完整核心技术,采用深度学习算法,充分利用大数据资源,承担了一批国家省市重大和重点项目,研发水平在华南地区首屈一指,进入全国第一方阵。

这样一家专业的科研机构与智能硬件和移动互联网产业开展了深度研发合作,形成了完整的核心技术产业转移应用。“智能会议系统是云和端、软件与硬件、产品与服务、语音与图像文本等领域深度结合,对技术和产品及服务应用有很高的要求。深圳,特别是南山产业链完整,我们近水楼台,开展了差异化定制服务,与政府、机构和企业保持长期深度合作,取得了良好的社会和经济效益。”

编辑 曹亮


0 条评论
来说两句吧。。。
最热评论
最新评论
来说两句吧...
已有0人参与,点击查看更多精彩评论
加载中。。。。
表情