当前位置：文档之家› 10-视频内容的结构化

10-视频内容的结构化

17
The Schema of Video Shot Detection
18
视频镜头边缘检测方法
基本思想：对比相邻帧间的特征认为有重大变化的地方是镜头边缘的发生之处
Although cut detection appears to be a simple task for a human being, it is a non-trivial task for computers. Cut detection would be a trivial problem if each frame of a video was enriched with additional information about when and by which camera it was taken.

如果相邻图像帧之间的特征发生了明显变化，则认为发生了镜头变化，需要对视频进行切分
10
镜头分类示例

长镜头(LS)：显示场景的全貌中镜头(MS)：表现人物的动作，如谈话等短镜头(CU) ：近距离刻画人物的表情
长镜头中镜头短镜头
注：一般在电影中镜头常被分为7类，即特长(XLS)、长(LS)、中长(MLS)、中(MS)、中短(MCU)、短(CU)和特短(XCU)，
N
31
32
压缩域差法

不对图像解压，而是直接用JPEG压缩图像帧的DCT系数作为帧相似度衡量的标准。省去解压步骤，直接从原始视频数据流中提取特征，从而加快检测速度。每个压缩域系数保留了原始图像帧中或图像帧间最重要特征，所以压缩域系数可以有效分析视频数据。
33
矩不变量法

图像矩不变量具有比例、旋转和过渡不变性的特点，可以用来进行镜头边缘检测。图像 f(x,y) 的矩定义为:
j 0
29
直方图求交
( f , f ') s ( f , f ') min( H ( f , j ), H ( f ', j ))
j 0 N
IS
color
从而d ( f , f ')
s ( f , f ')
H ( f , j)
j 0
N
30
直方图平方差
( H ( f , j ) H ( f ', j ))2 d ( f , f ') H ( f , j) j 0
28
均值化后的颜色直方图
N
d ( f , f ')
e e H ( f , j ) H ( f ', j ) j 0
w wmin 其中，veq Int .(l 1) 0.5 1 wmin v 1 w N 1 H ( f , j) j 0 H ( f , j )
矩不变量法

根据以上定义，使用以下三个矩不变量：
1 n20 n02
2 (n20 n02 ) 4n
2
2 11
3 (n30 3n12 )2 (3n21 n03 )2
矩不变量法
从相邻图像帧 f 和 f ’ 中提取矩不变特征，计算这些矩不变特征的欧氏距离：
d ( f , f ) f f
镜头边界检测常用算法

20
绝对帧间差法图像像素差法图像数值差法颜色直方图法压缩域差法矩不变量法边界跟踪法运动矢量法
绝对帧差法

判断相信图像之间特征的绝对差是否大具体实现时，判断两个相信帧差别的方法可以是：计算相邻两个图像中所有像素的色彩亮度之和注意：
16
In this kind of transitions the two shots are combined using chromatic, spatial or spatialchromatic effects which gradually replace one shot by another.
11
场景
场景：语义上相关和时间上相邻的若干镜头组成了一个场景，场景是视频所蕴涵的高层抽象概念和语义表达，如“学校运动会”这个场景可以由“运动员入场”、“运动员比赛”和“ 观众呐喊”等镜头组成。场景可以用属于这个场景的若干个镜头所对应的关键帧来表示。（为什么不使用文字信息？）

12
场景聚类示意图
While most algorithms achieve good results with hard cuts, many fail with recognizing soft cuts. Hard cuts usually go together with sudden and extensive changes in the visual content while soft cuts feature 19 slow and gradual changes.
3
结构化视频的作用

建立索引

视频表征视频相似度比较

便于浏览和检索视频结构化目的：

自动分析视频流中蕴涵的这种结构切分有意义的视频段
4
视频结构化的基本概念
书章节视频场景镜头
页
帧
5
视频结构化的基本概念
若干镜头或场景的集合语义上相关,时间上相近的若干镜头在时间和空间上连续数帧的集合基本组成单位独立的图象
边界跟踪法

在该算法中，如果用 pin 表示帧 f 和 f ’ 中最近边中像素点距离超过阈值 r 的像素点数目在 f 中所占百分比， pout 表示帧 f ’ 和 f 中最近边中像素点距离超过阈值 r 的像素点在 f ’ 中所占百分比，则相邻帧 f 和 f ’ 的差为：
d ( f , f ) max(pin , pout )

39
Zabih，Miller和Mai在边界识别的基础上提出了比较颜色直方图和颜色比例的镜头边缘检测方法。该方法为：把连续帧排列成一行以减少镜头移动造成的影响，然后比较图像中边的个数和位置，同时计算相邻两帧间进入或者离开图像的边所占百分比，百分比最大的是镜头的切点。是否为Dissolve或fade也可以通过百分比的相关值判断。该方法对运动的敏感度不大。
15
镜头变化分类
This is a sudden transition from one shot to another, i. e. one frame belongs to the first shot, the next frame belongs to the second shot. They are be also known as hard cuts or simply cuts.
视频场景镜头
帧
6
体育视频结构示意图
7
新闻结构示意图
8
研究点
镜头边界检测（shot boundary detection）场景聚类（scene clustering）镜头分类（shot clustering）关键帧提取（Key frame extraction）
镜头边界检测示意图
9
镜头
视频内容的结构化
1
背景
Large multimedia database video 24 hours Broadcast videos
Online videos
2
2
视频的特点

时间上依赖的图象帧序列流很强的情节发展性但是其制作过程中存在“场景”“分镜头”，且其间存在内容层次，只是在最后节目中消失了

镜头：摄像机拍下的不间断帧序列，是视频数据流进一步结构化的基础结构层

如，在拍摄“飞机起飞”这组镜头时，画面的色彩和纹理等图像特征将保持不变镜头是对视频流进行处理的最小物理单元，而视频帧是视频流的基本单元，镜头包含少许的语义内容由于在同一组镜头中，属于同一组镜头的图像帧之间的特征保持稳定
N
( H ( f , j ) H ( f ', j ))2 d ( f , f ') H ( f ', j ) j 0
N
( H ( f , j ) H ( f ', j )) 2 d ( f , f ') j 0 max( H ( f , j ), H ( f ', j ))

如果 d ( f , f ’) 超过一定阈值，则认为在 f 和 f ’ 处应该进行镜头切割。
imd1 = rgb2gray(im1); Imd2 = rgb2gray(im2); % black background image bw1 = edge(imd1, 'sobel'); bw2 = edge(imd2, 'sobel'); % invert image to white background ibw2 = 1-bw2; ibw1 = 1-bw1; s1 = size(find(bw1),1); s2 = size(find(bw1),1); % dilate se = strel('square',3); dbw1 = imdilate(bw1, se); dbw2 = imdilate(bw2, se);
步骤

22
23
图像像素差法（2）
缺点

对镜头的移动敏感对噪声的容错性小
改进

3*3 滤波针对不同的视频流选不同的阈值
24
图像像素差法（３）

将图像分成若干子块区域分别比较

e商务文档

10-视频内容的结构化

相关文档推荐：