近日,在国际顶级赛事Pascal VOC挑战赛目标检测 comp4上,来自中国的搜狗视觉研究团队获得了第一名的成绩,其single model和ensemble model均展现出了具有明显优势的精准度,刷新了此前的世界最好成绩,彰显了搜狗在人工智能领域的领先地位与技术积累。
据了解,PASCAL VOC挑战赛是全球计算机视觉领域知名的数据库和权威赛事,其数据集标注质量高、场景复杂、目标多样、检测难度大,是快速检验算法有效性的首选。在计算视觉领域,Pascal VOC挑战赛与ImageNet同为世界顶级的比赛,是国内外AI公司竞相展开激烈竞争的主赛场。截至目前,PASCAL VOC挑战赛吸引了全球近百支专业队伍参赛,包括Facebook、谷歌、微软研究院、CMU(美国卡耐基-梅隆大学)、清华大学、阿里、平安等国内外语音合成领域的顶尖团队。
PASCAL VOC的数据集包括 20 个类别:人类,动物(鸟、猫、牛、狗、马、羊),交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车),室内物体(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。其中,搜狗视觉研究团队参加了Object Detection(Competition4)子任务,在20类不同的目标上获得了大多数的最优结果,体现了参赛团队的模型设计和技术功底。
通过近一年的算法积累与迭代,搜狗目前已经建立了一套高效易用的通用检测分割框架,可以针对任务快速迁移算法模型,达到实际应用需求。而除了VOC外,搜狗在包括CVPR2018 WAD和Cityscapes的赛事中取得了优秀的成绩,这充分表明搜狗的通用检测分割框架已基本成熟,可高效复用到各任务场景中,满足实际的需求。