国际视频技术评测武大团队获最高检索准确率
新闻网讯(通讯员张晋东)由美国国家标准技术研究所主办的国际视频分析与检索技术评测近日举行,我校计算机学院团队获最高检索准确率。
团队由计算机学院院长胡瑞敏教授领衔,由学院研究生、本科生与中国科学院自动化研究所、武汉大千信息技术有限公司组成联合团队,已连续四次参加此项测评。
本次测评,团队在30个检索课题中,获得平均检索准确率0.758的成绩。实例检索任务要求评测团队从海量视频数据(47万多段视频片断)中检索出某一特定人物在某一特定场景出现的视频片段,评测任务具有很大的挑战性。团队利用多媒体检索、计算机视觉、机器学习等技术对视频内容进行分析与理解,并找出官方规定的评测课题内容,找到越多越准,检索平均准确率越高,被评测系统就越好。这一任务支持用户提出人物和场景两方面的检索条件,评测系统在海量视频中找出同时满足这两个条件的视频片断。比如,用户想从海量视频中获取“奥巴马在白宫总统办公室”的视频,由于“奥巴马”的衣着不一、姿态变化,找到他出现的视频已是不易,系统还需在“奥巴马”出现的众多类似场景中,挑选出“白宫总统办公室”信息的那些。
参赛者面临检索人物大小不一、姿态变化多、背景干扰大等困难,提出了多尺度反卷积回归人脸检测网络和深度嵌入的人脸识别网络,获得高精度人脸识别结果;在面临场景光照变化大、遮挡严重等情况,提出了基于局部视角和全局视角相融合的场景检索方法,有效降低了场景漏检率。在此基础上,团队进一步融合人类先验知识,配合多源跨模态信息,过滤大量无人脸、户外场景和车辆等无关信息,从而大幅减少噪声信息源。评测主办方认为,该团队“系统独特,有趣,聪明,并且极富信息量”。
本次评测的相关技术已运用在面向监控视频的特定目标检索中,帮助公安人员在海量监控视频中排除不相关目标,关注重点目标,聚焦、观察、分析嫌疑对象,显著提高海量监控视频浏览效率,对提高公安部门应急处置能力和社会治安综合防控能力具有重要意义。相关技术成果转化后的产品目前已在1个省会城市和7个省的12个县级以上单位推广应用,取得了良好的社会效益和经济效益。产品多次在实际案例中发挥重大作用,对维护人民生命财产安全具有重大意义。
据了解,国际视频分析与检索技术评测,是由美国国家标准技术研究所于2001年开始组织实施的视频检索评测项目,已连续举办16届,代表了视频检索领域最前沿的研究方向、最先进的技术水平。评测过程中,组委会向参评团队发布标准测试数据,参评团队以此测试自己设计的系统,在规定时间内向组委会提交运行结果,然后由美国国家标准技术研究所进行评价和比较。全球相关研究领域的高校、研究所以及商业公司等都参与了历年的评测。
(编辑:严航)