早在2013年,全世界每天会上传超过5亿张图片、上传20万小时长的视频到互联网。但是人们每天在Instagram分享近6000万张照片,在Facebook分享近3亿张——当然,还没算上Snapchat、 Google 、 Twitter等大量产图的应用。据估计,一年后就可达到18亿,所以在三年后的今天,这个数值必然远超乎我们的想象。确实,人们相比过去,互联网的数据每年都在爆炸式增长。IBM 的研究称,整个人类文明所获得的全部数据中, 有 90%是过去两年内产生的,等到了 2020 年,全世界所产生的数据规模将达到今天的 44 倍。
可以看得出,图片和视频内容已成为用户表达、事件记录分析中 不可或缺的部分,在多方面发挥越来越重要的价值。但随着互联网的发展,内容安全成为互联网不得不面临的严峻挑战。因此,面对互联网的基础需求——内容审核,图像识别技术可以以此为契机,为互联网图像内容稳定高效的发展保驾护航。
图像识别技术与人工智能
说起图像识别,我们知道,人的图像识别能力是非常强大的。图像距离的改变或图像在感觉器官上作用位置的改变,都会造成图像在视网膜上的大小和形状的改变。即使在这种情况下,人们仍然可以认出他们过去知觉过的图像。甚至图像识别可以不受感觉通道的限制。例如,人眼可以看字,当别人在他手上写字时,他也可以认出这个字。
而计算机图像识别技术是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。
图像识别技术是人工智能的一个重要领域。简单来说,图像识别就是计算机如何像人一样读懂图片的内容。而图像识别所研究的问题,是如何用计算机代替人类去自动处理大量的物理信息,解决人类所无法识别或者识别过于耗费资源的问题,从而很大程度上解放人类的劳动力。
图像识别技术与内容审核技术的融合
因此,对于互联网如此大量的图像内容审核需求,图像识别技术如何实现其中的融合与发展,从而解放大量每日做着简单重复的工作的内容审核人员是非常值得我们期待。
传统的图像审核方式主要有三种:1、纯人工审核:企业员工“三班倒”工作,人眼鉴别该图片或视频是否违规;2、建立MD5数据库:DNA是人类唯一的身份识别码,而图片、视频的DNA无疑是MD5,网监建立了存储违规图片、视频的MD5数据库,用户上传后自动分析MD5是否合法,则可避免涉黄内容重复分享。3、传统的智能审核:如识别色情图像,基本是通过图片 RGB 值识别肤色比例、通过建模识别异常动作、敏感部位等。
但是三个审核方式都存在较大的漏洞,“三班倒”的人工容易导致审核效率低、误判漏判多等主观性问题;MD5则非常容易被篡改,在视频中加入文字或者修改任意一帧就能实现;传统智能识别色情图片准确率低、经常误报等。而且这三种审核方式对近两年热门的视频直播审核需求更难以满足。
但以图普科技为代表的互联网图像内容审核专家,基于人工智能与图像识别技术领域最新的算法:深度学习算法,通过模拟人脑神经网络,构建具有高层次表现力的模型,能够对高复杂度数据形成良好的解读。通过大数据持续训练、频繁的迭代,图普科技的图像识别云平台的内容审核产品的精确度达到 99.5%,有效节省超过 90%的人工复审工作。
目前,图普科技基于图像识别技术的主要的内容审核产品有:
色情识别
智能识别图片和视频内容,并对色情程度进行打分,方便用户对涉黄内容进行快速处理,帮助用户减少审核人力,有效降低涉黄风险。
暴恐识别
识别ISIS、基地组织、东突等各类国家命令禁止的暴恐图片及视频内容。
时政敏感内容识别
建立敏感数据库,提供定制化的解决方案,如识别国家领导人、政治运动场景等时政敏感性内容。
OCR
主要针对广告内容过滤,自动识别图像内容是属于正常、二维码或者带文字的广告等图片内容。
图普科技通过图像识别技术,将图片与样本库中的海量样本图进行对比判断,根据判断返回图片的状态,可判断一张图片是否为正常、色情、暴恐、广告或其他的敏感内容等。
并且,图普科技的图像识别云平台还可以帮助企业定制自己的图像识别引擎,使用机器来代替人工对需要审核图片和视频进行鉴别。就无需聘请人工智能识别的专家组建研发团队,通过接入API调用识别服务即可。这在极大程度上降低了互联网行业应用图像识别服务的门槛,从而为更多互联网企业使用人工智能图像识别技术提供了更大的机会。
内容审核对于互联网图像内容发展来说是一项艰巨而又关键的任务,是后续的图像内容运营与发展的最基础保障。图普科技深知将要将图像识别技术更好地融合到内容审核领域,实现更高的准确率,是非常值得重视的,因此,尽管在业界已经拥有一定的知名度,图普科技仍然深耕于内容审核与图像识别技术领域,把图像识别技术视为内容审核及互联网图像内容发展领域的未来,在将图像识别技术更好地应用于具体的行业需求方面,为其他的人工智能应用提供了一条有价值的参考途径。