3.黄河连线:我们可以经常听到人脸识别,而且猴子和人类都属于灵长类动物,那么猴脸识别的原理与人脸识别类似么?是什么原理?
苗启广:金丝猴的面部特征和人脸的面部特征存在一定的相似之处,但同时也存在较大的差异,主要表现在面部结构和面部的纹理。当我们初次听说或看到猴脸识别时,多数人的直观的想法就是利用现有的人脸识别方法进行猴脸识别。而人脸特征和动物面部特征之间存在较大差异,如果将现有的人脸检测和识别方法直接应用于动物面部检测与识别会产生一系列问题。
虽然金丝猴面部特征与人脸特征之间存在一定的相似之处,但在面部结构、器官形状和面部纹理特征等诸多方面存在较大差异,主要体现在三个方面:
■ 第一,相对于人脸,金丝猴面部由毛发和皮肤两个部分组成;
■ 第二,金丝猴的面部(特别是面部毛发区域)具有更复杂的纹理特征;
■ 第三,相对于人脸特征的全局相似性,金丝猴面部特征具有显著的局部差异性。
因此,针对金丝猴面部图像的检测与识别,不能直接采用现有的人脸检测与识别的方法。
图1 金丝猴面部图像与人脸图像对比
基于深度学习的猴脸识别的基本原理其实是和人脸识别类似的,也就是利用深度学习算法提取金丝猴面部的有效特征,进而对其进行更有效的个体识别。但是我们不能直接使用现有的人脸识别的方法进行猴脸识别,我们需要根据具体的任务,对算法模型进行相应的改进,使其更适合于猴脸识别任务。
4.黄河连线:与人脸识别相比,猴脸识别的难度如何?精确度如何?
苗启广:相对于人脸识别,猴脸识别还是存在一定难度的,除了上边提到的环境复杂,面部角度和形态多样性之外,还有就是猴脸的相似性。相对于人脸,猴脸识别就类似于"多胞胎"的识别,相同年龄阶段同一性别的金丝猴的长相非常相似,人类仅凭视觉难以准确识别,这也给我们设计猴脸识别算法提出了较高的要求,也就是如何能够提取出长相相似的不同金丝猴个体面部的差异性特征,以及同一金丝猴个体在不同因素影响下面部的相似性特征。
好在目前具有多隐层的人工神经网络有着优异的特征学习能力,学习到的特征对数据有着更本质的刻画,更有利于对金丝猴个体的识别。相比于一些传统的学习方法,在精度上,有了很大的提高。目前已经对197只金丝猴进行了识别,识别准确率在97%以上,包括秦岭皇冠朝阳沟保护区的23只金丝猴,佛坪熊猫谷的48只金丝猴和周至的126只金丝猴。
5.黄河连线:猴子的活跃度远高于人,且不受控制,能否顺利识别?在技术上有什么解决办法?
苗启广:在野外,猴子的活跃度高,不受控制,但是事实上我们并不需要和猴子近距离接触,只需要拍摄记录下猴子的照片或视频即可,在图像或视频帧中猴脸分辨率在100×100左右,且不存在运动模糊和大面积遮挡,就可以进行识别。目前常用的有200万像素的智能手机就可以满足要求,当然单反相机就更好了。因此,获取猴脸图像在设备上不存在问题。而主要的问题在于如何能够拍到侧脸角度较小,也就是小于30°的侧脸,没有大面积遮挡的猴脸。对于不听指令,活跃度很高的金丝猴,这一任务具有较大的挑战。
在单个人拍摄的情况下,我们总结了相应的拍摄策略和参数要求,并且形成了相应的规范。目前我们在进行多物种动物拍摄过程中,基本都是按照这一规范进行的。我们可以在已拍摄的图像和视频中实现金丝猴面部的检测与识别,并且已经实现了基于浅层ResNet模型的金丝猴面部识别的实用软件,这个软件运行在基于Tegra K1的Jetson TK1嵌入式系统开发平台上。
而在后期,我们将会尝试多摄像头组合的方式(即布置摄像头点阵),这样就可以在不同方向对金丝猴进行拍摄,就能够很大程度上拍摄到他们的有效面部图像。进一步,再进行视频拼接,三维建模等研究,以更好地实现在大场景下对金丝猴进行面部检测、识别与追踪。