数字监控系统在中国的应用可以追朔到上个世纪九十年代,但是真正的快速发展是从2000年开始的,由于多媒体芯片技术的发展以及国内几家掌握核心编码技术的企业参与到安防产业中来,使得作为数字监控系统的核心部件--音视频编码卡自2000年以来得到了快速的发展。主要表现在如下几个方面:核心音视频编码算法、技术方案和板卡功能的完善。
●核心音视频编码算法
音视频编码卡的视频编码算法从JPEG发展到MPEG-1、MPEG-2、MPEG-4和H.264。JPEG是一种著名的图像压缩方法,最初由Joint Photographic Experts Group在1986年提出并于1992年正式成为ISO标准(ISO/IEC 10918),主要应用于静态图像压缩,如果把它用在运动图像压缩的时候,就是我们通常所说的Motion-JPEG,由于JPEG相当于MPEG的帧内压缩,因而没有去除时域上的冗余,所以在保证一定图像质量的时候,压缩比不高,通常只有10-30倍,但是它有一个固定的优点,就是延迟在40ms,实时性很好,所以在某些特殊应用的场合仍然可以看到它的踪影。MPEG运动图像编码技术标准是由Motion Picture Experts Group在1988年提出,并于1992年11月通过,1993年8月作为ISO/IEC 11172标准公布,这就是通常所说的MPEG-1。MPEG-1为了追求更高的压缩效率,更注重去除图像系列的时间冗余度。因此引入了I帧(帧内编码)、P帧(前向预测编码)、B帧(双向预测编码)。P帧由前一个I帧或P帧图像来预测,而B帧由前后的两个P帧或一个I帧和一个P帧来预测,因而编解码和帧的显示顺序有所不同,如图1所示
I B B P B B P…B B I I P B B P B B … I B B
1 2 3 4 5 6 7 … 1 4 2 3 7 5 6 …
(a) 显示顺序 (b) 编解码顺序
图 1
在此有两个问题需要说明:首先是插多少B帧最合适?理论上说I、P之间插入的B帧越多,压缩比越高,但是编解码器所需的帧存储器也越大,因此实际应用中一般最多两个。其次,B帧的引入会增加编解码端的延迟,如果追求网络监视的时延,最好是不使用B帧。MPEG-1标准的一个成功应用范例是小型激光视盘(VCD)。由于它的压缩比相对于M-JPEG大为提高,因而在数字监控系统中得到广泛的应用。但是并不是最适合数字监控系统的应用,主要表现在码率固定,代价是引起图像质量的抖动,而数字监控系统最需要的不是恒定码率,而是恒定质量。同时MPEG-1本身的技术限制,其压缩比也没有达到用户满意的程度。而2000年提出的MPEG-4不仅是一个非常开放的标准,而且增加了许多新的工具,以达到降低某些应用或图像场景中要求的图像质量所需的比特率。值得注意的是虽然大部分用来降低比特率的工具是为非实时应用开发的,无法使用到数字监控系统中,但是相对MPEG-1,由于使用半像素和1/4像素图像匹配、帧内预测、高级运动矢量预测等新的技术,因而采用MPEG-4的压缩标准之后,在PAL CIF 25fps情况下,大部分情况下码率在300k-500k的MPEG-4压缩图像质量超过1.25Mbit的MPEG-1图像,因而在数字监控系统中得到最广泛和成功的应用。
●技术方案
技术方案的发展和变化是伴随着多媒体芯片技术的发展而发展。压缩方式从纯软件(PC图像压缩)和纯硬件(ASIC芯片图像压缩)发展到DSP。目前流行压缩卡可分为软压缩卡、低端硬压缩卡和高端硬压缩卡。纯软件压缩就是我们通常所说的软压缩卡,使用一块视频捕捉卡把模拟视频信号变成数字视频信号,然后利用PC机完成视频压缩。在早期由于DSP技术的限制,软压缩卡是一个比较好的方案,但是由于方案本身的限制,软压缩卡的稳定性和压缩效率是它的两大固有缺点。由于实时数据流需要从板卡经过PCI总线传输到PC机系统内存中,PCI2.1的峰值传输率是133Mbyte/s,以一个8路卡的系统为例,完成PAL CIF 25fps的图像压缩的话,PCI总线的负载高达40Mbyte/s,而PCI总线还要负责传输预览图象(约39Mbyte/s)和送往显卡的图像以及IDE硬盘的数据,如此高的负荷很难保证能够稳定工作。相对于MPEG-1,MPEG-4的编码和解码复杂度大为提高,要完成8路MPEG-4的实时压缩在PC机上几乎不可能实现,因此目前的软压缩卡采用了大量简化压缩算法的处理,因此数据量是目前流行的基于DSP的硬压缩卡的2-3倍,换句话说同样的录像时间,所花硬盘的容量增加2-3倍。
针对软压缩卡的固疾,从2003年底,低端硬压缩卡的方案浮出水面,总的来说主要有两种方案:ASIC和DSP,由于监控市场的特殊需求,比如说动态侦测、中文字符时间戳叠加、屏幕遮挡、动态调整帧率等等,使得ASIC方案没有被市场接受。DSP方案以采用Blackfin21532加多媒体PCI Bridge SAA7146的方案和PNX1302加画面分割芯片AQ424的方案为代表。他们的共同特点是简化了板卡的功能,同时简化了压缩算法,预览效果也比较差。以PNX1302为例,由于平均每路可用资源从180MIPS降到50MIPS,通常都会采用简化压缩算法的方法来满足实时压缩处理的需求,因而压缩效率会降低,数据量增大。预览效果也比较差,都是采用CIF图像预览。但是,它原封不动的继承了硬压缩卡的稳定性,同时又有较低的价格,因此逐步被用户接受,越来越多的取代了软压卡的市场。
高端硬压缩卡目前主要有三种方案: 1颗PNX1301处理一路音视频信号、1颗PNX1501处理四路音视频信号、1颗DM642处理四路音视频信号。第一种方案已经得到广泛应用,在此不再赘述。他们相对低端硬压缩卡来说,预览采用D1格式,回放质量也相对好很多。其中后两种方案在2004年6月份后各板卡厂家推出的新产品中分别被采用,成本和价格有所降低,促进了数字监控系统的普及。这两种方案相比较起来各有优势,PNX1501处理能力和DM642相比稍微逊色,但是由于有多个协处理器,因此DSP Core无需参与图像的滤波和缩放处理,所以用这种方案的板卡不需要显卡具有缩放能力,稳定性和兼容性更具优势。为什么这么说呢? PNX1501是从PNX13XX系列发展而来,PNX13XX系列已经得到广泛的应用和认可,其稳定性、兼容性已毋庸置疑。在PNX13XX系列基础上,PNX1501采用了0.13um工艺生产,架构上使用和PNX1301相同的TM3260VLIW内核,在征集全球PNX13XX开发者意见和依据H.264编码算法的需求基础上新增加了27条高效多媒体处理指令,使用先进的DDR技术,可以用较低的外频得到与使用SDRAM技术相同的数据吞吐率,主要改进了视频输入处理器和内置图像缩放和滤波协处理器,视频输入处理器支持格式转换和滤波处理,支持两路视频输入,图像缩放和滤波协处理器从PNX1301的5-Tap的32相滤波器发展到6-Tap的64相滤波器,可以获得更好的图像缩放效果,无论全屏显示还是缩小到小画面,都具有良好的视觉效果。内置协处理器使得图像预览的时候在多路的情况下PCI总线数据吞吐率固定在39MByte/s以下(1024x768x2x25Byte/s),反之,如果不使用内置协处理器缩放的话,随着路数的增多,PCI总线数据吞吐率成倍上升,而支持PCI2.1标准的总线数据吞吐峰值只有133Mbyte/s。当然,采用DM642的方案也有它的优点,600MHz的主频可以使它具有处理超过4路CIF图像的能力,有资料显示编码一路实时MPEG-4 D1图像大概占到DM642(600Mhz)的70%的资源。
●板卡功能的完善
随着国内安防产业的成熟,业内用户关注的焦点已经不再是“什么样的压缩标准最好”了,这是一个巨大的进步,用户、DVR软件开发商、板卡厂商也跟随着这个产业一同进步,回到了理性的轨道。使用高科技的数字化监控系统的目的是为了使我们的生活变得更简单,开发出满足用户需求的产品才是成为DVR软件厂商和板卡厂商追求的目标。因此,使用DSP方案的板卡由于技术的灵活性,可以方便的附加许多新的功能来满足市场的不断需求,如:水印、中文OSD叠加、时间戳叠加、Mosaic遮蔽、强制关键帧输出、动态改变压缩帧率参数、动态检测、双码流、板载加密区等。简单的功能在此不赘述,而动态检测和双码流是适应用户需求而产生的新功能的代表,在这里详细介绍一下。
动态检测的需求是DVR软件开发商和用户都渴望已久的,但是由于方案本身的限制,一直达不到实用的要求。直到使用DSP的方案之后,解决动态检测这种技术问题变得易如反掌,而且检测的灵敏度很高,同时误报率很小,因而在有些系统中甚至部分替代了红外探测器。除此之外,使用动态检测技术还可以显据减少数据存储量,特别是夜间噪声比较大的时候。有物体运动的时候才录像,只要处理好预录和延迟录像的话,效果和连续录像一样。其实,它对数据量减少的贡献不亚于采用新的压缩标准。而双码流功能则是板卡行业的新星武汉恒亿为了满足用户对网络监看的需求与带宽的矛盾而在2001年率先提出,并且在行业内得到广泛应用。采用这种技术开发出来的DVR产品也得到用户的认可。
双码流是指在压缩一个高清晰度格式(D1/HALFD1/MD/CIF)的码流用于存储之外,再启动一个可以独立控制帧率和数据量的QCIF格式的码流用于网络传输。众所周知,DVR已经从单纯的音视频记录设备发展到音视频记录和网络视频服务复用的设备。有很多用户希望在1M ADSL上看4路以上的图像,而兼顾本地录像质量的情况下,一般每路设定数据量应该不低于500Kbps,而1M ADSL的上行速率实际上会在400K-600Kbps之间,因此,这样的需求很难被满足,可是如果使用QCIF的双码流功能,这个问题就迎刃而解了。而聪明的软件开发人员稍微作点技术处理的话,会更加完美的满足用户的需求。因为通常多路图像分割显示的时候每个画面很小,此时无论是D1分辨率还是CIF、QCIF分辨率的图像显示的效果并没有太大差别,而放大到单路显示效果差别就大了。因此,在这种情况下可以考虑对放大显示的图像传送CIF格式的码流,其他路仍然传送QCIF码流或直接停止传送。当然,为了保证切换的时候有足够快的反应速度,必须在服务器端调用板卡的强制关键帧输出功能。因为通常关键帧设置为每100帧产生一个,而解码端又必须从关键帧开始解码,因此在最坏的情况下,要等待4秒钟才能看到图像,显然这是用户无法接受。所以,当板卡提供强制关键帧输出功能时,只要在网络开始连接的时候使用这个功能就可以实现快速连接。
此外,DVR系统在扩展一些新的功能,比如说加入人脸识别和目标跟踪,而这些功能的实现依赖于实时图像的捕捉,因此,目前有些板卡提供实时图像捕获接口,但是目前还不成熟,主要表现在CPU占用率太高,无法满足实用的需求。
总之,由于DVR产业已经基本形成了从芯片制造商à板卡制造商àDVR软件开发商à工程商à用户的产业链,分工日益明确,板卡厂商可以不断吸取用户的需求,发挥DSP的灵活性,开发出满足用户需求的新功能,从而推动数字监控系统的发展。 |