前言:2018年全国公安厅局长会议明确指出,公安机关必须将大数据作为创新发展的大引擎,大力实施公安大数据战略,着力打造数据警务、建设智慧公安。这两年来,各地公安机关也都在积极推进公安大数据战略。但现阶段来看,由于跨部门、跨警种、跨平台系统等一系列因素,公安大数据建设依然存在“数据孤岛”的问题,数据共享范围和程度不够,也给数据治理和应用带来了不少困难,造成数据治理弱、数据应用水平不高的现象。
公安数据中台建设的核心内容
为解决这些问题,就需要整合挖掘数据,打造数据中台,渐渐让各个体系融合在一起,建立统一的体系。后续的业务扩展同样也是基于这个中台,用相同的技术和模式进行运营。数据中台的内核应该包括两方面:一个是应用数据的技术能力,另一个是数据资产的管理。
公安数据中台是以辅助公安实战应用为目标,因此需要综合考虑各警种不同实战业务的具体需求。在统筹数据资产的管理方面,一是要实现对多源、海量、异构数据的实时和离线接入,打破数据孤岛。二是要解决数据标准化和管理问题,提升数据质量,管控数据资产,增益数据效能。另外,在打造应用数据的技术能力方面,首先要实现数据深度加工,融合关联全量异构数据形成知识图谱,挖掘沉淀数据知识,为智能化分析及应用提供数据支撑,然后再基于警务知识图谱面向全警提供大数据资源服务,用数据驱动业务决策。
具体而言,公安数据中台应该包含以下几个方面:
◆数据接入和融合:在分层解耦的前提下,对公安网络大数据平台和信息资源服务平台数据资源,以及其他公安外部社会数据进行接入和融合,实现数据资源的集中汇聚;
◆数据关联和统一:将数据中心、技术、数据库等的海量数据信息采集、计算、加工,对数据的标准和质量进行统一;
◆数据资产积累:所有数据被整理后会形成行业特有的数据标准,再进行深入的挖掘,产出业务逻辑,算法模型和抽象统一,后储存起来,生成原始库、资源库、主题库、知识库等大数据资产,为业务服务;
◆数据服务:基于前三步的准备,开始定义服务中心和服务,提供数据资产管理目录,根据实际需求提供实际业务。
数据治理是公安数据中台搭建的前提
因为公安数据的数据类型复杂,有上百种实体(人、案、物、地、组织等)、数十大类关系、成千上万的事件类型,这也给构建公安数据中台带来了巨大的困难。
在构建公安数据中台过程中,核心技术方面当然离不开人工智能、云计算及物联网等技术引擎。另外有一套能够大规模、自动化地采集、清洗、归类和关联所有数据,形成统一数据视图及行业知识图谱的数据治理工具也成为必须。
数据治理是任何公安系统建设的底层工作,当面对大量原有公安业务系统中近千张表,通过传统数据治理工具需要半年以上才能完成的工作量,凭借CONA(明略科技自主研发的业内首款支持结构化与非结构化数据的自动化治理工具)依靠AI驱动的自动数据治理能够将过程缩短到2周以内,极大地提高了数据治理和关联的效率,从而可以极大程度地降低行业大数据和行业人工智能的实施成本。
构建基于全域知识图谱的数据中台 赋能公共安全
经过数据治理后形成的行业知识图谱可以更直观的推进公安数据中台的应用价值。知识图谱可以说是数据中台最核心的技术,知识图谱技术通过“图”的方式,整理多源异构的数据之间的关系,实现探索式分析,中台响应速度更快。基于行业知识图谱构建的数据中台,不只是处理、整合、挖掘数据的工具,也是驱动行业数字化转型的“引擎”与“大脑”。
近些年公安大数据建设、各垂直系统的纵向业务拉通,各单位横向数据的融合&分层解耦奠定了公安业务数据规范化、标准化的基础,同时感知智能的快速发展,基于人脸特征的聚类、分类,一人一档、一车一档,视图库的建设,图像不仅能辨认人,更能连接人、管理人。视频网和公安信息网的内容融合趋势愈发强烈,构建全域感知图谱的时机日益成熟。
通过将海量感知数据纳入知识构建与积累,打造了认知力更强、时效性更快、更具行动力的全域知识图谱,可以让机器更好的进行推理与规划,从而从平台服务、数据服务到应用服务构建了由感知到认知再到行动的完整闭环,形成基于AI技术的警务支撑体系和安全保障体系,为公共安全建设保驾护航。
(本文观点由明略科技提供,安防知识网做主题编辑整理)