上周五晚,第四季《最强大脑》在江苏卫视首播。百度研发的“小度机器人”成为公认“脑王”,不仅在人脸识别赛题中,仅根据童年照片比对就发现了蜜蜂少女队中隐藏的同卵双胞胎队员,依靠万分之一的区别概率选出了正确答案,人类“最强大脑”王峰2:3惜败于人工智能机器人“小度”。
《最强大脑》幕后首席科学团总顾问、北京师范大学心理学院院长刘嘉称:“小度在人脸识别领域暂时排名世界第一,从计算的难度来讲,甚至可能会超过现在特别火的AlphaGo。”
在“小度”参与“人机大战”前,机器与人类的PK多在下棋、答题等领域,从1997年IBM深蓝战胜卡斯帕罗夫起,似乎就意味着人类智力在棋类游戏中不敌人工智能。随着人工智能的不断进化,机器还会从程序运算走向抽象思维认知全新阶段,在更多的领域超越人类。“小度”此次战胜人类对手正是机器探索抽象思维认知的阶段性成果。
人脸识别与下棋大有不同。简单说,人脸识别包含两种技术:一种是1:1 的人脸比对,比如像银行的应用场景,通过比对希望知道这张人脸是不是身份证上面的那个人;还有一种更通用的 1:N 人脸识别,N 可以是几千、几万或者几十万进行比对,这叫 1:N 的比对或者是 1:N 的人脸识别。“小度”在《最强大脑4》中与名人堂轮值主席王峰PK时展现出的人工智能技术,则属于第二种,而且是其中最复杂的跨年龄识别。
众所周知,人类童年时的照片与成年后的脸部相比有明显区别。虽然人脑传承了祖先上百万年积累的脸部识别天赋,但跨年龄识别仍是很难完成的挑战。百度深度学习实验室(IDL)科学家们选择了用度量学习的方法破解这一难题,即通过学习非线性投影函数将图像空间投影到特征空间中,在大量样本中,缩小同一个人跨年龄的两张人脸的距离。考虑到跨年龄人脸的稀缺性,IDL还采用了一个用大规模人脸数据训练好的模型底座,并用跨年龄数据对其进行更新,从而大幅提升跨年龄识别的识别率。通俗一点说,“小度”采用的技术手段是在脸部骨骼上取尽可能多的采样点,把其与需要筛选的大量人脸逐个比较。当然,双胞胎由于骨骼相似差别细微,所以识别的难度也要比普通人更大。
技术原理看似轻描淡写,实际情况是,尽管百度大脑经过了两亿多习题的人脸识别训练,在该领域的能力目前世界领先,但跨年龄识别等技术对计算能力要求极高,“为了这次比赛,我们也收集了一些跨年龄的数据,根据跨年龄这个场景再进一步优化模型,跨年龄数据大概在几千张这个级别,并不算特别的多。” 百度深度学习实验室(IDL)主任林元庆表示“小度”获胜并非易事,而且在现场识别人脸时,光照、人脸姿态、遮挡程度等因素会对人脸检测带来干扰,光照、表情、遮挡、年龄、模糊也会影响到人脸识别的精度,特别是面对年龄跨度较大的情况,由于缺乏两个年龄中间的足够数据,所以“小度”更难学习和掌握人脸的变化。
关于“小度”的实际应用,拥有超强人脸识别功能的“小度”,不仅能识别双胞胎,更能在高年龄跨度之下掌握人脸的变化,因此,对于走失儿童的寻找和匹配,将有很大的意义。
尽管受节目效果影响有吹捧百度之意,但无论是互联网企业还是安防企业,以及一系列真正拥有深度学习算法的人脸识别公司的崛起,人工智能的发展,将在未来几年迈向新的高峰期。