IBM认为用于训练面部识别系统的数据不够多样化。
这家科技巨头发布了大量数据,其中包含从Flickr数据集中获取的100万张面孔图像,其中包含1亿张照片和视频。
图像标注有与特征相关的标签,包括颅面测量,面部对称,年龄和性别。
该公司的研究人员希望这些具体细节能够帮助开发人员培训他们的人工智能面部识别系统,以更公平,更准确地识别人脸。
“面部识别技术应该是公平和准确的”IBM的研究员兼首席科学家约翰史密斯通过电子邮件告诉CNBC。“为了使技术进步,需要建立在各种培训数据之上。”
史密斯强调了面部识别系统数据集的多样性对于反映现实世界多样性和降低面部与人匹配的误差率的重要性。
专家警告说,人工智能可能存在偏见。研究表明,面部识别技术在制作白人男性面部方面要比在少数人面前更加擅长。
IBM本身一直是批评 其面部识别系统的目标。一纸由麻省理工学院的研究人员乔伊Buolamwini去年出版,发现IBM沃森的视觉识别平台有一个几乎35%的错误率,当它来识别深色皮肤的女性,以及识别肤色较浅的男性不到1%的错误率。
像Buolamwini这样的研究引起了人们对在执法等领域使用面部识别的担忧,以及人工智能驱动的种族貌相的可能性。英国大都会警察正在测试面部识别,而中国人工智能公司SenseTime通过使用面部识别技术协助地方当局识别犯罪嫌疑人。
一个2016报告由该中心对隐私和技术在乔治敦大学法学院说,非裔美国人会不成比例地受到警方的人脸识别系统,因为它们是不成比例针对逮捕。