6月18日,三大世界顶级计算机视觉会议之一-计算机视觉与模式识别会议(Conference on Computer Vision and Pattern Recognition 2019,CVPR 2019)在美国长滩拉开帷幕,苏宁美国硅谷研究院人工智能专家Honglong Cai携论文“Multi-Scale Body-Part Mask Guided Attention for Person Re-identification”(多尺度人体掩膜引导下的行人重识别)参与会议并作主题报告。
作为计算机视觉和模式识别领域的顶级会议,CVPR 2019吸引超过9200位顶尖专家、研究学者以及产业界人士参与,共同推进 CV 技术的发展与落地。CVPR保持着一贯严苛的论文录取审核标准,其录取率通常不超过30%,而能有幸在CVPR上进行报告的论文比例更是不高于5%。
今年,一共有 5160 篇论文向CVPR进行投稿,但仅接收 1294 篇论文,接受率为 25.5%,苏宁美国硅谷研究院项目团队的论文被顶会成功接收并受邀进行口头报告,体现了研究项目所具备的极大价值,这不仅是苏宁美国硅谷研究院获得的一份荣誉,更向业界展现出苏宁科技在行人重识别相关领域的大量研究和产品化探索。
行人重识别是要识别不同图片中的行人是否为同一个人,主要用来解决不同角度,不同摄像头下的行人匹配和跟踪问题,该技术可以通过侧脸、局部的动作、姿态等进行识别,主要用于智能安防、门店客流统计、无人店客户跟踪、智能寻人等方面;人流量较多的大型公共场所,如超市、火车站、展览馆等,也是比较具象的行人重识别应用场景。
由于不同摄像设备之间的差异,同时行人兼具刚性和柔性的特性,行人重识别容易受到背景环境、行人姿态、穿着、视角和遮挡等因素影响。苏宁科技美国硅谷研究院这篇论文创新性的提出借助在深度神经网络中加入注意力机制,使得我们的深度神经网络可以过滤掉背景噪声,更好的注意在行人身上。
Honglong Cai讲解到,“我们借助多尺度的人体掩膜来训练我们的注意力机制,在多尺度人体掩膜的引导下,我们的注意力机制可以识别出行人的不同部位,更好的克服行人姿态变化和行人局部被遮挡的问题,更好的提取行人的局部特征和全局特征。可以说,我们的模型达到了行业最高水平”。