图片简介:
本技术提供了一种视频采集方法。获取用户的检索词,确定所述检索词的同义词集合;根据所述同义词集合构
建检索视频的约束模型,根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合;根据所述同义
词集合在所述视频集合中对应内容出现的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,
得到目标视频集合。本技术介绍了一种视频的采集方法,主要用于用户采集大量同类视频;通过对视频的同义
词进行提取能够最大限度的获取与检索词相关的视频。
技术要求
1.
一种视频采集方法,其特征在于,包括:
获取用户的检索词,确定所述检索词的同义词集合;
根据所述同义词集合构建检索视频的约束模型,通过所述约束模型检索并获取与所述同义词集合对应的检索
视频集合;
获取所述同义词集合在所述检索视频集合中对应内容的特征,通过预设的特征参数对所述检索视频集合中的
视频进行筛检,得到目标视频集合。
2.
如权利要求1
所述的一种视频采集方法,其特征在于,所述获取用户的检索词,确定所述检索词的同义词集
合,包括:
获取检索词;
根据词典获取所述检索词的第一同义词集合A
={a1,a2……ax}
;
根据网页标签获取所述检索词的第二同义词集合B
={b1,b2……by}
;
根据文本关系获取所述检索词的第三同义词集合C
={c1,c2……cz}
;
对所述第一同义词集合A
、第二同义词集合B
和第三同义词集合C
进行相同项分析,得到相同项集合S(A,B,C):
其中,所述ax
表示所述第一同义词集合A
中的第x
项;所述by
表示所述第二同义词集合B
中的第y
项;所述cz
表
示所述第一同义词集合C
中的第z
项;所述x
=1,2,3……x
;所述y
=1,2,3……y
;所述z
=1,2,3,……z
;
根据所述相同项集合S(A,B,C)
,确定所述同义词集合。
3.
如权利要求1
所述的一种视频采集方法,其特征在于,所述根据所述同义词集合构建视频的约束模型,包
括:
步骤1
:确定所述同义词集合与所述检索词的距离D
:
D
=(G-si)P-1(G-si)
;
其中,所述G
表示所述检索词;所述P-1
为所述同义词集合的协方差矩阵,所述si
表示所述同义词集合的第i
个
同义词;
步骤2:构建所述同义词集合的线性回归方程;
其中,所述ξ
为所述同义词集合内积;所述表示所述同义词集合的均值;
步骤3
:根据所述距离D
合线性回归方程确定所述视频的约束模型F:
其中,所述kj
表示检索视频集合的第j
个视频;所述表示检索视频集合的均值;所述β
表示所述检索视频集
合的误差系数。
4.
如权利要求1
所述的一种视频采集方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合
对应的检索视频集合,包括:根据所述同义词集合在任意视频检索网站获取第一检索视频集合;
确定所述第一检索视频集合的均值;
根据所述均值,将所述检索视频集合中检索的视频的参数导入所述约束模型,得到约束值;
获取所述约束值中的正值和与所述正值对应的视频,确定所述检索视频合集。
5.
如权利要求1
所述的一种视频采集方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合
对应的检索视频集合,还包括:
根据所述同义词集合在任意视频检索网站进行检索视频;
获取所述检索视频的链接地址;
根据所述链接地址,确定所述链接地址对应的视频网页;
当所述链接地址没有对应的视频网页时,删除所述链接地址;
对所述视频网页中的视频进行触发,响应对所述视频网页触发行为,当所述视频网页的触发行为具有响应
时,获取所述视频网页的视频,构成所述检索视频集合;
当所述视频网页的触发行为没有有响应时,判断所述视频网页为无效网页。
6.
如权利要求5
所述的一种视频采集方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合
对应的检索视频集合,还包括:
获取所述检索视频的网络传输协议;
根据所述网络传输协议判断所述检索视频的获取方式;
根据所述检索视频的获取方式,获取对应的视频加载工具;
根据所述加载工具,获取所述检索视频集合。
7.
如权利要求6
所述的一种视频采集方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合
对应的检索视频集合,还包括:
获取检索视频对应的视频网页;
判断所述视频网页异常弹窗的次数;
根据所述异常弹窗的次数,判断所述视频网页是否为异常网页;
当所述视频网页为异常网页时,删除所述视频网页;
当所述视频网页为正常网页时,获取所述视频网页的视频,构成检索视频集合。8.
如权利要求1
所述的一种视频采集方法,其特征在于,所述根据所述同义词集合在所述检索视频集合中对应
内容的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合,包括:
在所述检索视频集合确定后,获取所述同义词集合中每个同义词的语意;
根据所述同义词集合中每个同义词的语意,判断与同义词对应的视频的特征;
根据所述同义词对应视频的特征与预设的特征参数对比,确定最终的目标视频集合。
9.
如权利要求1
所述的一种视频采集方法,其特征在于,所述预设特征参数通过以下步骤确定:
步骤S1
:获取检索视频集合E
={e1,e2……eg}
;所述g
表示第g
个视频;所述g
=1,2,3……g
;
步骤S2
:根据所述检索视频集合E
,确定所述检索视频集合的特征矩阵R:
其中,所述rgl
表示第g
个视频的第l
个特征;
步骤S3
:根据所述检索视频集合的特征矩阵R
,计算所述检索视频集合的差值系数η:
其中,所述em
为模板视频的特征参数,所述N
为检索视频集合的个数;
步骤S4
:根据所述差值系数η
和模板视频确定所述目标视频的阀值ε
=emη
:当所述检索视频集合中的视频的特征参数大于等于所述目标视频的阀值时,确定所所述检索视频集合中的视
频为目标视频;
当所述检索视频集合中的视频eg
的特征参数小于所述目标视频的阀值时,删除所述检索视频集合中的视频eg
。
10.
如权利要求9
所述的一种视频采集方法,其特征在于,所述步骤S2
中,确定所述检索视频集合的特征矩阵,
包括以下步骤:
步骤S10:
根据所检索视频集合中视频对应的同义词,获取同义词语义;
步骤S11
:根据所述同义词语义,在所述检索视频集合的视频中进行语义标记;
步骤S12:
根据所述语义标记,提取所述语义标记的帧图像,并获取所述帧图像的特征;
步骤S13
:根据所述帧图像的特征,构建所述检索视频集合的特征矩阵。
技术说明书
一种视频采集方法
技术领域
本技术涉及视频检索技术领域,特别涉及一种视频采集方法。
背景技术
目前,短视频行业兴盛,因为短视频的制作需要大量素材。然而,各个公司还是通过普通的视频下载和花费
资金购买来完成视频数据的检索和收集,这使得成本大量增加。而且在视频的获取上效率极低很难获取到自
己的意向视频。
技术内容
本技术提供一种视频采集方法。用以解决视频采集困难的的情况。
一种视频采集方法,其特征在于,包括:
获取用户的检索词,确定所述检索词的同义词集合;
根据所述同义词集合构建视频的约束模型,根据所述约束模型检索并获取与所述同义词集合对应的检索视频
集合;
获取所述同义词集合中同义词在所述检索视频集合中对应内容的特征,并通过预设的特征参数对所述检索视
频集合中的视频进行筛检,得到目标视频集合。
作为本技术的一种实施例:所述获取用户的检索词,确定所述检索词的同义词集合,包括:获取检索词;
根据词典获取所述检索词的第一同义词集合A
={a1,a2……ax}
;
根据网页标签获取所述检索词的第二同义词集合B
={b1,b2……by}
;
根据文本关系获取所述检索词的第三同义词集合C
={c1,c2……cz}
;
对所述第一同义词集合A
、第二同义词集合B
和第三同义词集合C
进行相同项分析,得到相同项集合S(A,B,C):
其中,所述ax
表示所述第一同义词集合A
中的第x
项;所述by
表示所述第二同义词集合B
中的第y
项;所述cz
表
示所述第一同义词集合C
中的第z
项;所述x
=1,2,3……x
;所述y
=1,2,3……y
;所述z
=1,2,3,……z
;
根据所述相同项集合S(A,B,C)
,确定所述同义词集合。
作为本技术的一种实施例:所述根据所述同义词集合构建视频的约束模型,包括:
步骤1
:通过所述同义词集合与所述检索词的距离D
:
D
=(G-si)P-1(G-si)
;
其中,所述G
表示所述检索词;所述P-1
为所述同义词集合的协方差矩阵,所述si
表示所述同义词集合的第i
个
同义词;
步骤2:构建所述同义词集合的线性回归方程;
其中,所述ξ
为所述同义词集合内积;所述表示所述同义词集合的均值;
步骤3
:根据所述距离D
合线性回归方程确定所述视频的约束模型F: