人脸识别产业链上游为基础层,包括人工智能芯片、算法技术和数据集;中游由视频人脸识别、图片人脸识别和数据库对比检验等技术层构成,大体包括人脸检测、活体检测、人脸识别、视频对象提取与分析等技术;下游则是具体的场景应用,即应用方案、消费类终端或服务等。下游以摄像头为主的硬件采集端和应用端采集人脸数据,为数据集丰富数据,对于基础层算法的更新迭代形成正反馈。
日前,国外巨头公司大多呈现全产业布局的特征,即上中下游均有布局。国内人脸识别创业公司基本缺席上游的芯片和算法开发环节,除了少量在中游有技术突破外,大多数集中于下游场景应用层,这很大程度上得益于国内庞大的应用场景支持。
在具体的场景应用商业化落地环节,以BAT为代表的国内互联网巨头,由于无法将计算机视觉的某一个子模块拿出来单独盈利。因此在应用落地上并没有明显的优势,而是创业公司突破能力更强。但互联网巨头拥有最大的数据源,人脸识别的后续发展动力十足。
人脸识别产业链上游分析
人脸识别产业链上游,即基础层,影响发展的三大要素是数据量、计算力和算法模型。2000年后,数据量的上涨、计算力的提升和深度学习算法的出现促进了计算机视觉行业的发展。作为计算机视觉中重要的人脸识别,以摄像头为主的采集终端的大规模普及带来了数据量的增长,深度学习算法的出现可以实现精准的识别功能。
此外,云计算技术、服务器和人工智能芯片等相关硬件性能的提升,对于处理数据的计算力有很强的助力作用,从而人脸识别应用方案走入人们的生活成为现实。
而在算法领域,算法领域,美国互联网巨头谷歌、FACEBOOK、微软都推出了深度学习算法开源平台,在深度学习算法方面有着明显的技术优势。
2016年以来,以谷歌、微软为首的巨头为了抢占市场,将自己研发的算法技术进行开源,导致很多企业免去人工智能基础技术研发投入,只需要采用开源算法或经过训练的人工智能芯片,再结合行业数据进行训练,就可开展行业应用落地。与之对比,百度PaddlePaddle是国内巨头中唯一开放的深度学习算法开源平台。
人脸识别产业链中游分析
中游人脸识别技术的进步,是推动下游场景应用拓展的关键所在。目前,人脸识别市场的解决方案主要包括2D识别、3D识别技术。
市场上主流的识别方案是采用摄像头的2D方案,但由于人的脸部并非平坦,因此2D识别在将3D人脸信息平面化投影的过程中存在特征信息损失。3D识别使用三维人脸立体建模方法,可最大程度保留有效信息,因此3D人脸识别技术的算法比2D算法更合理并拥有更高精度。
人脸识别产业链下游分析
人脸识别对场境要求非常强,产品能否达到实际使用要求,核心并不只在于算法本身,还在于对场景的深耕。算法水平对于识别率的有力证明,也仅仅是停留在训练集与测试集之间,存在于实验室的“理论数值”。
而现实生活中人脸的获取过程有大量不可控因素,光的方向、强度,是否有胡须、发型的变化,是否有表情都会影响识别效果。多种因素叠加后,真实环境下测得的准确率可能只有75%左右,甚至更低。
因此,需要针对场景的不同特点收集大量场景数据,不断调试参数、组合算法、方法,甚至使用外围硬件辅助以提升效果,不断迭代以实现产品化。除此之外,还要在工程上满足计算量、延迟、可维护性等需求。