大数据是全球信息化进程中的产物,特别是今年两会中李克强总理提出的“互联网+”概念之后,大数据的应用应该可以说正式被推向了国家经济发展的战略高度。安防领域每天产生的信息体量巨大,但就整个环境而言,大数据在安防与其他应用领域几乎没有多大的差别,基本上处于一个探索阶段,相关的业务模式也都在逐步落实。所以在此有必要分析安防大数据的相关问题,厘清安防大数据的应用思路。
文/ 张涛 中国电信(广东分公司)研究院视频实验室主任
大数据的数据来源
• 视频数据。包括各地平安城市建设的视频监控数据、交警、城管、金融、海关、检验检疫等部门建设的视频监控数据以及接入到电信运营商公共平台的视频数据等等。而各企业、商铺、家庭等自建的相对独立的视频数据则难以采集、整合。随着高清时代的到来,视频数据已成为最重要的安防数据。
• 卡口、电子警察数据。车辆、驾驶、通行数据。
• 用户日常社交数据。包括用户日常上网浏览记录、消费记录、社交记录等数据。
• 用户基站数据。包括用户位置数据、通信数据、访问数据等等。
实施安防大数据整合利用问题
数据整合问题
不同来源的大数据,分别存储于相互独立的系统中,将这些数据集中于统一的平台,是安防大数据实施的基础性工作,但行业、部门壁垒是最大障碍。即使只是公安内部的视频数据,各省、地市也互不相通,想采集集中也不是一件容易的事。即使集中后,如何找到这些不同类型数据之间的关系,从而挖掘出有价值的数据,也是难点。
数据挖掘、分析算法的成熟度问题
对于安防数据中最重要的视频数据,对其进行智能视频分析和挖掘是很困难的事情。目前,除了车牌识别、人数统计等算法较为成熟外,对视频进行事件分析、人脸识别、摘要等技术都还没达到大规模的商用水平,这也极大地制约了安防大数据的实施。
时效性问题
安防大数据的目的之一就是要解决现有安防系统内以事后查看、分析为主的数据(特别是视频数据)应用形式,还要增加以事前预警、实时处理,这对大数据处理技术的实时性要求很高。这种时效性就决定了视频安防大数据的高运算量、高传输带宽的要求。
信息安全与用户隐私问题
安防行业,特别是公安行业对数据的安全性要求非常高,这也是造成数据的区域隔离的重要原因。同时,在利用安防大数据上,如何保护用户的隐私,也是一个非常重要的课题,目前主要采用数据脱敏的办法。当务之急就是将安防数据安全级别需要有明确的分级定义,不能一味强调安全而各自封闭,否则必将导致安防大数据分析成为无源之水。
安防大数据实施
按照安防大数据实施的难易程度,从纵横两个角度进行分析。
纵向实施
大数据与云计算密不可分,可以先进行安防大数据的云存储,逐步将各细分行业的数据集中存储于云平台。对于公安内部而言,可以先将各地分散的平安城市的视频数据进行集中云化存储,云化再利用云计算技术进行数据的挖掘、分析。
横向实施
横向实施很重要的是和移动互联网平台、电信运营商的横向合作,打通人员通信、上网、交友、交易数据进行横向合作和综合分析。这样的大数据带来的效力将是惊人的,不过这样的系统建设、实施、运营的难度也将是极大的,需要各方共同努力。
分步骤重点先行
在对数据进行挖掘、分析时,要考虑算法的成熟度和市场的需求。优先进行算法成熟高、市场需要紧迫的方向,如道路的拥堵分析、重要场所安全预警和智能布防、治安高危区域预处理并进行特征提取入库、嫌疑车辆全程轨迹跟踪查询等等。
安防大数据从管理的复杂度、数据整合的难度、数据模型、数据挖掘技术的成熟度、投资的规模等多方面注定它不是一蹴而就的工程,甚至初期建设后也很难保证有立竿见影的效果,不过安防大数据有市场是肯定的,因此在市场普及的过程中,需要大家共同努力、政府和安防企业合作逐步推进。