人脸识别技术是目前安防领域乃至全球保安系统最热门的研究方向之一,有着广阔的应用前景和实现需求。而人脸识别技术的应用与创新,则是今后人们在人脸识别方面有所进步的重要分析环节,也是理论与实践相结合的重要依据,它是使人脸识别技术取得突破和完善的有力后盾。本文着重介绍了人脸识别技术应用与创新的应用背景、原理以及需要创新的方向和创新实现的结果。
人脸识别创新特点
创新点一——快速动态多视角人脸检测定位
在人流密集以及画面中同时出现多个人脸的场合,系统对移动中不配合的布控对象的人脸进行快速的动态检测和定位。
1、创新程度
众所周知,生物特征的检测采集和预处理是生物识别技术中工作量最大最耗时的环节,大部分同类产品和技术都需要用户在镜头前停顿以配合识别比对,才能顺利地完成人脸检测定位。而快速动态多视角人脸检测定位技术的创新点在基于统计分析的特征检测方法基础上,采用连续自适应Boost算法训练由强分类器组成的瀑布型检测器,以及通过姿态预估计和多分辨率搜索技术提高检测速度,可以非常准确而又快速地完成检测定位工作。在P4 2GHZ的PC上,对一幅640×480的图片进行准确的人脸检测定位的处理时间平均不超过60ms。
此外,为了优化对多姿态多角度人脸的检测,需要先对图像进行梯度处理,再对局部直方图进行统计,以局部直方图作为特征,提高多姿态检测的稳定性。
在用户不主动配合以及人流不受控制的实际布控场合,该技术项目系统能对每秒钟20-30帧的实时视频流进行快速的人脸检测和预处理,也就是需要在每秒钟连续完成20-30次基于视图的人脸检测定位处理工作。考虑到人流密集、人脸运动、以及画面中同时出现多个人脸时,同时定位带来的工作量和处理难度,该系统进行快速动态多姿态人脸检测和定位的核心技术已经进行了优化,且已达到国际领先水平(如图1)。
2、创新难度和需要重点解决的问题
快速准确的多姿态实时人脸检测,长期以来一直是理论研究和实际应用领域的难点问题,为了准确有效地进行人脸检测,可以采用连续自适应Boost算法替代训练整合得到强分类器,并组成基于视图的瀑布型检测器进行逐层人脸样本筛选。同时为了大幅度地提高检测速度,将瀑布的前几层作为姿态预估计器,使姿态预估计和人脸检测同步进行,并且按搜索量化步长的大小,对图像进行金字塔式逐次细化的多分辨率搜索。
然而检测技术的优化往往需要在准确率和速度之间进行折衷,加速策略会导致正确率的下降。姿态估计器和多分辨率搜索,能够将检测速度提高两倍甚至更多,但是这会造成在检测率相当的情况下误报率会有所上升。[nextpage]
需要重点解决的问题在于根据实际监控系统的应用需求对目前的方法进行进一步的优化,设计出最佳性能的姿态估计器,以及能够在正确率和速度之间取得最佳平衡的多分辨率搜索参数,如搜索步长和分辨率层次的选择。
上述工作需要深入掌握连续自适应Boost算法、分类器设计、ANN训练、统计学习方法等模式识别领域的知识技能,以及进行相关的科研实验和实验数据的统计分析,并能完成基于实时视频流的应用设计及开发,具有比较高的难度。
创新点二——光线归一化预处理及阴影消除
光线变化是目前限制人脸识别技术性能的最关键因素之一。唯有克服其强度变化和方向变化对人脸图像的影响,才能使得系统进行人脸识别辨认的精确度在正常光线环境变化的情况下保持稳定。
1、创新程度
一些专业研究人员在目前最新的光照锥和球谐函数,以及基于商图像的光照归一化方法的基础上,提出基于全局光照子空间的光照归一化方法,建立能够表示人脸在固定姿态任意光线情况下的图像集合的低维线性人脸光照子空间,进而合成虚拟光照图像,使比较的两幅图像几乎处于相同的光照条件下。同时通过对在监控现场长时间获得的且灰度变化的图像序列反射边缘和阴影边缘进行分析,利用边缘图中值消除阴影边缘,并根据不含阴影的人脸图像拥有类似反射边缘的原理,进一步用梯度光照子空间消除光线造成的阴影。通过有效的归一化和阴影消除,该技术项目可以做到识别效果基本不受正常光线变化的影响(如图2)。
2、创新难度和需要重点解决的问题
美国国土安全部门对生物护照进行的首轮测试以及国际权威的FRVT-2002测试均表明,在光线变化的情况下,人脸识别的错误率可能达到50%。而对于光线问题,迄今为止尚无理想的解决方法和实质性的进展。
一些专家尝试从三维的角度对光线问题进行分析,并在光照锥、球谐函数以及商图像理论的基础上,提出了新的基于全局光照子空间的光线归一化方法。并充分利用监控布控应用能够用静止摄像机采集到固定场景长时间的不同光线图像序列的优势,采用基于图像序列的极大似然估计算法,结合梯度光照子空间来消除人脸图像中的光照阴影。
但是全局光照子空间的归一化方法的性能会受到样本不足的限制,而用梯度光照子空间约束来消除阴影的方法需要正面光照的人脸图像最为训练集,因此寻找人脸的其他约束,进一步提高光线预处理的效果是深入研究需要解决的问题。
上述工作是目前整个人脸识别领域的重点难点课题,需要开发人员对目前为止该领域的研究成果和进展具有深入了解,并能在此基础上创造性地提出更加行之有效的方法。研究过程中还需要收集大量的人脸光线样本数据进行复杂的统计学习研究,具有非常高的难度。[nextpage]
创新点三——远距离低分辨率下的精确匹配
与普通的近距离主动配合式身份验证应用(如门禁、信息安全登陆等)不同,基于普通通用监控摄像机进行远距离(5米之外)布控,同时考虑到人脸可能出现的范围,所捕获的人脸在有限分辨率(例如640×480、720×576)的视频画面中仅占一定比例的大小。因此需要在人脸分辨率较低的情况下(两眼瞳孔之间约20-30像素)完成准确识别。
1、创新程度
首先,基于SIFT(Scale Invariant Feature Transform)算法原理,从利用高斯差分函数极值粗略定位图像尺度空间极值开始,在局部图像梯度分析的基础上,采用瀑布式筛选过滤的方法,快速有效地逐层提取那些与图像缩放和尺度无关的、稳定的关键特征点。并通过多尺度滤波实现尺度不变性,通过8个方向的梯度直方图实现旋转不变性和部分仿射不变。从而可以在有限分辨率,以及尺度变化的人脸图像中分析提取出能够进行精确人脸识别的特征信息。因此,该系统可以在国内普通分辨率监控摄像机的平台上,以及由于人脸出现时与摄像机距离不固定造成的人脸大小(即分辨率)变化的情况下,仍然保持识别正确率的稳定性。
2、创新难度和需要重点解决的问题
关于提取与尺度旋转等变化无关的稳定特征点的研究,目前还处在完善和提高阶段,还需要大量的进一步研究和探索。尤其是在监控应用中,人脸的不清晰和大小变化往往受三维角度的变化和光线变化的影响。因此需要在对理想化图像的尺度无关特征提取的基础上,针对人脸这一类识别对象共有的特征约束进行优化,并考虑光线和角度变化等复杂情形下的稳定性。
上述工作需要开发人员在深入了解和掌握SIFT算法原理及技巧的基础上,从人脸识别的全局角度配合光线角度等因素的优化处理解决尺度问题,需要进行大量创新性的尝试研究工作,具有比较高的难度。
创新点四——长时间跨度的准确人脸分析
在实际监控布控应用中,通常无法让布控对象主动配合进行人脸注册,也很难获取其近期的照片,往往手头能找到的照片具有很长的时间跨度。因此需要在布控识别对象不同年龄的人脸样本之间完成准确的识别匹配。
1、创新程度
由于该技术的核心识别算法主要基于图像中所体现出的人脸骨骼特征信息的提取和对比,而将皮肤皱纹、皮肤颜色深浅、两腮胖瘦、发型胡须等时间所能造成的变化排除在外。成人的骨骼不会随时间发生明显或过大的变化,然而由于脸部肌肉、纹理会随着年龄的变化而有所改变,因而导致人脸图像的变化。在这里,大家采用非线性流形学习的方法(Nonlinear Manifold Learning),将同一个人不同时间段的样本用最近邻的方法,连接成为一个复杂的流形,这样每个人都有一个流形。然后采用区分分析法,寻求不同人的流形的最佳投影方向,从而达到良好的分类效果,实现跨时间段识别。
在此基础上,研发人员还基于统计分析方法在大量的不同年龄的人脸样本的基础上进行算法学习和训练,提取出不随时间变化的稳定特征点,同时淘汰那些容易受年龄影响的面部特征信息,对时间跨度下的识别性能进行进一步的优化。该技术系统目前已经可以在监控应用中用平均3年之内的照片准确识别现场人脸,部分样本实验可以识别10年以上的人脸(如图3)。
[nextpage]
2、创新难度和需要重点解决的问题
目前,所有的几何骨骼特征信息,都是从受到光线及其他因素影响的图像中提取出来的,尤其是人脸的骨骼凹凸在光照下产生的阴影,这样在没有很好地解决光线影响的情况下,必然会影响正确率。此外,年龄跨度的研究和进一步完善,需要建立在对大量不同人在不同时间的人脸样本的统计分析的基础之上,如何获取足够丰富的样本,就构成了进一步研究的难度。
上述工作需要开发人员在很好地解决光线影响的基础之上对人脸随年龄变化的规律进行研究,并对非线性流形学习和区分判别分析法有深入的了解和掌握,同时还需要收集大量的人脸样本进行进一步的统计分析学习,具有比较高的理论和实际操作难度。
创新点五——高效稳定的系统结构
1、创新程度
独立模块化的体系结构,高度灵活的可扩展性,基于网络的数据传输,支持服务器组并行处理存储的系统架构,高容错能力以及局部发生故障时,整个系统的照常运转(如图4、图5)。
2、创新难度和需要重点解决的问题
对整个算法和功能流程,以及系统架构进行模块化设计和划分,使各个系统单元独立运行,并制定单元之间的通讯握手标准,以及为容错性考虑设计好,各个计算节点的冗余分配方案。
上述工作,需要开发人员深入掌握服务器组和并行计算集群的分析设计原理,数据库维护和优化方法,以及计算机接口和网络通讯协议,且需要具有相当程度的技巧,具有一定难度。(本文作者:黄晓斌 现任职于北京时代鼎典信息技术有限公司)