图像内容分析、主要是利用图像信息的时间分辨能力,理解图像,进行目标行为的分析。
图像内容分析是智能监控的切入点。
图像内容分析,自主的定义(简单)特征、不与原始输入相对比;通过目标状态和行为的分析,理解图像内容(判断正常/不正常、预测趋势);通过图像关联,实现目标的识别。
图像内容分析分为两个层次:
视频探测,模拟电视技术中就已得到了应用。在一幅图像上开一个窗口,检测其亮度电平的变化,就可以实现探测。
通过一系列窗口的监测,就可以实现运动探测。
但它不是真正的视频探测,因为不能确定目标。
在数字视频基础上,首先确认图像中的探测目标,然后再进行其行为的分析,判断图像中是否出现“不正常”情况,及时提示、警告,记录、传送警情(图像),提高实时监控的效率,避免重要信息的遗漏。
真正的视频探测,准确地判断事件,是真实探测。
视频探测还非常适于空间多维探测和多参数探测,同时处理来自不同方位摄像设备的图像信号,可以作到对目标多方位的监控;
实现对特定空间和目标的完全封闭。
视频语义解释,阅读一段图像,理解图像的内容,并表述出来,它描述的不是图像本身,而是图像的结构及表现的内容、情节,既视频语义。
根据语义可以对图像信息进行标引,在记录图像的同时,生成镜像的标引文件,然后通过标引文件对存贮信息进行快速和准确的检索;或实现按事件记录图像信息和以事件为特征检索。进而实现图像信息间的关联,图像与声音、图形、文本之间的关联。
是图像信息深化应用、多媒体关联的前提。
图像内容分析研究的过程分四个阶段,产品和应用也分四个层面;
一、将(运动)目标从视频图像中分离出这来。并能在简单环境下(单目标、背景单纯)对目标分类;
二、在简单环境下对目标进行行为分析,判定其运动的方向、方式、目标的复合或离散,发现和告警异常的行为;产生目标的运动轨迹,并能进行目标的自动跟踪;目标的统计、关联、过滤、趋势预测等。
三、在复杂环境(既通常的视频监控环境)下实现上述功能,并实现(单源、多源)图像的关联。
四、实现视频语义的解析,通过对一个图像序列的理解,做出视频语义解释。目前已有了一些成果,但尚不具实用性。
第三个阶段是技术实用性的关键,这样系统才具有应用价值,目前大多数产品还达不到这一阶段。
视频语义解释是内容分析的最高境界,它表明机器具有了与人一样理解图像的能力,但具有人所不能达到的效率,目前还达不到这个程度。
图像结构和内容的描述还需要目视解释的帮助。
前三阶段可称为视频的半语义解释。主要是判断图像中是否出现了不正常的情况,还不能准确、充分地理解图像内容。
综上所述,智能监控的主要课题有视频探测、图像识别和视频语义解释,也是物联网亟待突破的技术。