近日,ECCV官网发布了2018年最新COCO竞赛的结果,结果显示,在实例分割、全景分割、人体关键点检测、DensePose以及今年最新的街景检测和分割任务中,全部6项冠军均由中国团队包揽。
其中,旷视获得了实例分割(并列第一)、全景分割、人体关键点检测,以及Mapillary街景全景分割4项冠军(含1项并列第一);北京邮电大学自动化学院模式识别与测控技术实验室(BUTP-PRIV)获得了DensePose任务的冠军;滴滴团队(DiDi Map Vision)获得了Mapillary街景检测冠军。此外,其他中国团队也获得了不菲的成绩:微软亚洲研究院团队(MSRA)获得了人体关键点检测亚军;北京大学和360组成的团队(PKU_360)获得了全景分割任务的亚军。
据介绍,COCO 2018竞赛与ECCV 2018一同举办,而且新增了两项街景识别的新任务——Mapillary Vistas,这是是新近推出的街景集图像数据集,专注于图像的高阶语义理解,推动自动驾驶和机器人导航等领域的技术落地。在数据集和应用任务方面,两者有很多不同,而后者对前者起补足作用。通常来讲,COCO 是自然场景下的物体识别,Mapillary 则聚焦于街景场景识别,因此联合挑战赛的形式有利于计算机视觉技术更贴近现实场景,更具应用价值。
COCO 2018 挑战赛的具体任务包括:(1) 利用分割掩模进行目标检测(实例分割),(2) 全景分割,(3) 人体关键点检测,(4)DensePose。
关于MS COCO:
MS COCO 的全称是常见物体图像识别(Microsoft Common Objects in Context),起源于微软2014年出资标注的Microsoft COCO数据集,同名竞赛与此前著名的 ImageNet 竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。
COCO 是一个旨在促进目标检测研究的图像数据集,重点关注检测上下文中的目标。COCO 的注释包括 80 个类别对象的实例分割,91 个类别的物品分割,人物实例的关键点检测,以及每个图像都有 5 个图像标题(image captions)。