当前位置:文档之家› 物联网中智能视频技术的现状与分析

物联网中智能视频技术的现状与分析

82010年11月一、视频监控是物联网的重要组成部分二、视频监控的智能化是物联网应用的必然要求视频监控只是安防行业的其中一个重要应用领域,以往并没有融入系统、互联这些概念。

但是近年来,由于平安工程、电力变电站、银行网点监控联网等对互联网需求的不断增长,打破了传统视频监控的狭窄领域,在物联网的大背景下提出了新的应用需求。

我们可以理解为:摄像头本质就是信息的采集点,编码设备则是信息数字化的变换点,它们结合起来共同完成“物联网”的第一步功能,那么随之而来的应该是全面的IT化、互联网化,即IP化之后的架构、技术和系统。

如果说物联网是大趋势,那么IT和安防的融合就是必然的,所以对于监控而言,联网是不可避免的。

这就是三者之间的逻辑关系。

如平安城市的联网监控,是将原本各个区域和楼宇分散的监控资源整合成一个地域范围的一体化监控资源,然后再将城域的资源整合成一个广域的资源。

在物联网的前提下,信息可以传送和集中的价值并不仅仅是跨越空间距离获取信息,更关键的是在这个基础上可以扩展各种各样的智能分析应用,这正是物联网之于监控联网的最大好处,如同互联网的价值,我们得以对大量信息进行处理、加工以及应用。

可以预见的是,随着物联网应用范围的扩大,未来几年,各行各业的视频监控业务发展都将沿着这条路前进。

物联网是指通过射频识别、红外感应器、全球定位系统等信息传感设备,按约定的协议,把任何物品与互联网连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络。

如果把摄像机看作人的眼睛,而智能视频系统或设备则可以看作人的大脑。

视频监控就是物联网的感知环节少不了的“眼睛”。

然而,监控探头拥有数量和监控数据存储量非常巨大,随之而来的问题是如果完全依靠人工分析和监控,会存在效率低下,识别率不高,以及存储困难等问题,常常不能实时发现突发事故的发生情况。

随着国内“平安城市、和谐社会”的迫切需要、城市安防“3111”工程建设的进一步发展,数以万计的摄像监控设备在同时工作,如此庞大的监视系统,需要成千上万的人紧盯着屏幕。

仅依靠视频监控中的人眼检测,即使是专业操作人员也难以构成真正有效的安全系统。

智能视频(IV,IntelligentVideo)源自计算机视觉(CV,ComputerVision)技术。

计算机视觉技术是人工智能(AI,ArtificialIntelligent)研究的分支之一,它能够在图像及图像描述之间建立映射关系,从而使计算能够通过数字图像处理和分析来理解视频画面中的内容。

视频监控中所提到的智能视频技术主要是指:“自动的分析和抽取视频源中的关键信息。

”随着物联网的逐步推广,以及人们对智能化的强烈要求,智能视频监控迎来巨大的发展机遇,物联网必将对视频监控产生深刻影响,包括其理念、技术、形态和效果。

视频监控的智能化给计算机视觉在公共安全领域中应用提供了广阔的前景,智能视觉监控成为一个逐渐兴起的研究方向。

当前视频监控已全面进入全数字化时代,即网络化视频监视系统,它基于标准的TCP/IP协议,所以又称为IP监控系统,最早出现于2001年。

数字化视频监控的优点是克服了模拟闭路电视监控的局限性:数字化视频可以在计算机网络上传输图像数据,基本上不受距离限制,信号三、智能视频监控在物联网中的发展现状摘要:关键词:在物联网的前提下,视频信息可以传送和集中的价值并不仅仅是跨越空间距离获取信息,更关键的是在这个基础上可以扩展各种各样的智能分析应用,这正是物联网之于监控联网的最大好处。

本文分析了智能视频监控在物联网中的应用现状,总结了当前智能视频监控的关键技术,并展望了其发展趋势。

物联网智能视频安防监控图像识别物联网中智能视频技术的现状与分析李万才9PToliceechnology2010年11月物联网技术在警务领域的应用不易受干扰,可大幅度提高图像品质和稳定性;数字视频可利用计算机网络联网,网络带宽可复用,无须重复布线;数字化存储成为可能,经过压缩的视频数据可存储在磁盘阵列中或保存在光盘中,查询简便快捷。

在智能化方面,当前视频监控系统试图利用计算机视觉技术对摄像机采集的视频信息进行分析、理解和处理,将无关的信息滤除,只将提取出的有用的信息报告给监控人员进行处理,从而实现预警、防范和主动监测的功能,以达到代替人完成监控任务的目的。

一种基本的智能视频系统结构如下图1所示。

智能视频技术目前已在如下的几个地方得到应用:1.高级视频移动侦测:在复杂的天气环境中(例如雨雪、大雾、大风等)精确地侦测和识别单个物体或多个物体的运动情况,包括运动方向、运动特征等。

2.物体追踪:侦测到移动物体之后,根据物体的运动情况,自动发送PTZ控制指令,使摄像机能够自动跟踪物体,在物体超出该摄像机监控范围之后,自动通知物体所在区域的摄像机继续进行追踪。

3.人物面部识别:自动识别人物的脸部特征,并通过与数据库档案进行比较来识别或验证人物的身份。

此类应用又可以细分为“合作型”和“非合作型”两大类。

“合作型”应用需要被监控者在摄像机前停留一段时间,通常与门禁系统配合使用;“非合作型”则可以在人群中识别出特定的个体,此类应用可以在机场、火车站、体育场馆等安防应用场景中发挥很大的作用。

4.车辆识别:识别车辆的形状、颜色、车牌号码等特征,并反馈给监控者。

此类应用可以用在被盗车辆追踪等场景中。

5.非法滞留:当一个物体(如箱子、包裹、车辆、人物等)在敏感区域停留的时间过长,或超过了预定义的时间长度就产生报警。

典型应用场景包括机场、火车站、地铁站等。

6.交通流量控制:用于在公路上监视交通情况,例如统计通过的车数、平均车速、是否有非法停靠、是否有故障车辆等等。

对于智能视频处理的研究,日本、德国和美国等发达国家早在上世纪六十年代就开始了,但直到上世纪九十年代后期,随着光电子技术和计算机技术的发展才取得了广泛的应用,其市场潜力十分巨大。

据“视觉系统国际公司”的一份调研报告显示:1999-2004年北美的智能视频系统市场规模从16.8亿美元增长到19亿美元。

至于智能摄像机,NI、SONY、霍尼韦尔、松下等公司的产品占据了很大的市场。

以美国国家仪器有限公司(NationalInstruments,简称NI)推出的NI1742智能相机为例:NI智能相机是一种连接了工业控制器和图像传感器的嵌入式装置,并且集成了NI视觉软件,可直接在相机上实现图像处理。

NI1742有一个533MHZ的处理器,它们都可专门用于苛刻的工业环境。

运用于这种照相机的单色VGA(640x480)图像传感器是一个高质量的Sony电荷藕合器。

该相机还有内置工业I/O,包括两个光隔离数字输人和两个光隔离数字输出,一个RS232串行端口和两个包括ModbusTCP在内的支持工业协议的千兆以太网端口。

另外,NI1742包括正交编码器支持功能和一个以NI直接驱动光源技术为特性的内置控制器。

通过正交编码支持功能,工程师可以轻松地通过线性或旋转驱动系统来实现同步监测。

这些高清晰度的智能摄像机将使监控系统更上一层楼。

就国内来说,随着近十年的学习进步,出现了海康威视、大华等一些视频监控产品提供商,并都已进入全球前十的行列,在这个领域做出了很大的贡献。

比如海康威视的智能可控摄像机,运动过程中图像平稳、预置定位精确,还实现了报警联动、巡航扫描、花样扫描、定时启动、两点扫描等功能,满足了大多数场合的需要。

但是,我们还是必须看到,国内的产品所使用的机芯大多仍是由SONY等国外提供是供应的,另外在智能算法方面缺乏专利权,同国外先进水平仍有相当的差距。

智能视频监控技术涉及图像处理、图像分析、机器视四、智能视频监控的关键技术介绍102010年11月觉、模式识别、人工智能等众多研究领域,是一个跨学科的综合问题。

它的主要组成部分如下图2所示。

运动目标检测,是将目标物体所在区域从视频序列的图像中分离出来。

后续工作中的运动目标提取,以及运动目标的跟踪和行为理解都是在正确检测识别目标物体的基础上进行的。

运动目标检测是视频监控系统中的前导步骤。

运动目标检测分背景检测和目标检测,现有的背景检测方法大致有四种:背景统计法、Surendra背景更新算法、卡尔曼滤波法以及背景模型法。

背景统计法通过在一段时间内对像素点的灰度统计,取其平均值作为背景点的灰度估计,滤去变化剧烈的部分;Surendra背景更新算法通过计算帧差图像得到物体的运动区域,对该区域内的背景保持不变,对非运动区域的背景点进行加权迭代更新,得到背景的估计图像;卡尔曼滤波法(Kelman)是将每个像素点的灰度时间序列视为带有噪声的背景灰度观测值,通过时域递归低通滤波来估计出缓变的实际背景图像。

背景模型法对每个像素点建立统计模型,认为像素点的灰度分布符合某种概率分布,如高斯分布模型,混合高斯分布模型,非参数化模型。

目标检测算法中常用的主要有三种:光流法、帧间差分法和背景减法。

光流法,是采用运动目标随时间变化的光流特性,通过计算图像序列的光流场提取运动目标。

计算复杂、耗时,难以满足实时性检测;帧间差分法,通过比较相邻两帧图像灰度值的不同,来提取运动的目标。

计算简单,对运动变化区域敏感,但是检测出的物体在运动方向上被拉伸,运动目标位置不精确,部分运动目标信息被去除,不能完整地提取运动目标;背景减法,是将当前帧图像和背景帧图像相减,若某点像素差值大于某一阈值,则判定为出现在运动目标上的点,相减的结果直接给出了目标的位置、大小和形状等信息。

主要涉及背景估计和更新,定位精确,但对光照和环境变化敏感。

在运动区域中将多个运动目标提取出来,通常使用形态学操作来进行目标的标记和计数。

形态学的基本运算有四种:膨胀,腐蚀,开运算和闭运算。

二值形态学中的运算对象是集合,通常给出一个图像集合和一个结构元素集合,利用结构元对图像进行操作。

结构元是一个用来定义形态操作中所用到的邻域的形状和大小的矩阵,该矩阵由0和1组成,可以有任意的大小和维数,数值1代表邻域内(一)运动目标检测(二)运动目标提取和特征表示的像素,形态学是对数值为1的区域进行的运算。

在对得到的二值图像消除噪声后,则对图像中的运动区域进行标记和计数。

基于矩阵的标记方法,主要通过对每个像素作一个标记,使得属于同一个连通组元的像素有相同的标记,一幅标记图像用一个矩阵表示。

提出基于像素标记的方法,对一幅二值图像从左向右、从上向下进行扫描。

标记当前正被扫描的像素,检查其与之前扫描到的若干个近邻像素的连通性。

将所有等价的标记归入等价组,对每个组赋一个唯一的标记,然后第二次扫描图像,将每个标记用它所在等价组的标记代替。

在确定目标区域轮廓时可使用外接矩形方法,通过提取运动目标外接矩形的特征来表述物体特征,如外接矩形的重心,面积等。

但是会导致得到物体的特征不准确,如当物体不能充满矩形框的大部分区域时,则外接矩形面积不能很好地表述物体。

相关主题