报告主题:面向多模态视觉融合任务的深度可解释模型研究
报告时间:
2023年7月6日16:40-17:25
报告地点:
beat365中文官方网站3楼报告厅(B310)
主讲人:
李辉,beat365中文官方网站讲师,研究方向为模式识别、计算机视觉、多模态视觉融合。2020年被评为江南大学第十六届十佳研究生,2022年1月获江南大学控制科学与工程专业博士学位。在IEEE TPAMI,IEEE TIP,Information Fusion,IEEE TCYB,IEEE TIM,ICPR等国内外权威期刊及会议发表论文20余篇,谷歌学术被引次数3000+。获得多项国际学术竞赛奖项,包括2020年国际视觉目标跟踪竞赛RGBT组(VOT-RGBT)冠军,2021年国际反无人机竞赛(Anti-UAV)季军。主持国家自然科学基金青年项目1项,以主要成员身份参与国家自然科学基金联合基金重点项目、国际合作重点项目、军委装备发展部预研项目等多项国家级项目。入选斯坦福大学2022年度全球前2%顶尖科学家榜单。
报告摘要:
在多模态视觉融合领域深度学习已经成为最重要的方法之一,但深度方法始终受到数据、算力等方面的制约,因此轻量级的网络结构设计逐渐受到关注。相比于深度方法,非深度方法(稀疏/低秩表示)仅需要少量的训练数据和算力就能够在小规模数据上取得较好的性能。如何结合非深度方法的这一特点,并设计可解释的轻量级深度模型正是本次报告所要分享的内容。本次报告将介绍团队在深度可解释模型方面的研究,并将其应用于多模态视觉融合任务中。