在音频编码的基础上,支持识别特征参数编码,避免编码失真对语音/声纹识别的影响;
识别特征参数采用MFCC方案;
识别特征参数编码支持两种模式:
1、直接编码模式:无需计算重建信号,直接编码原始信号特征矢量,计算复杂度低, 码率4.8kbps。
绝对时间信息通过专门语法与视音频压缩数据一起传输和存储,便于检索查询、视音频同步和多路视频同步,还可以避免在图像上叠加OSD破坏图像原始内容;
特殊监控事件类型及参数通过专门语法与视音频压缩数据一起传输和存储,便于检索查询,对于大规模监控网络和数据库更为重要;
利用安全参数集定义加密和认证的方法及保护范围,可以实现不同级别保护;
利用NAL单元头中特定标志位标记加密和认证是否生效;
以统一的语法格式支持多种加密和认证算法,具备灵活的可扩展性。
SVAC视频划分为简单、主要、高级3个档次(profile):
1、简单档次支持帧模式编码、4:2:0数据采样格式、8-bit数据精度、帧内预测和前向预测(I/P-pic)、VLC编码、监控专用信息等,满足监控视频编解码的基础应用;
2、主要档次增加支持场模式编码、4:0:0数据采样格式、9/10-bit数据精度、双向预测(B-pic)、CABAC编码、ROI、加密和认证等,满足典型监控应用的视频编解码需求;
3、高级档次进一步增加支持4:2:2数据采样格式、SVC等, 功能更强大。
SVAC视频主要根据图像分辨率、数据格式和最大编码比特率划分为8个级别(level)
SVAC音频划分为简单、主要、高级3个档次(profile)
1、简单档次支持ACELP和BWE编码,可满足一般监控场景对语音信号的编码需求;
2、主要档次增加支持识别特征参数的直接编码,实现复杂度有所增加;
3、高级档次进一步增加支持TVC编码和识别特征参数的预测编码,实现复杂度高,但编码效率更高。
SVAC音频主要根据采样频率划分为3个级别(level)