当前位置:文档之家› 一种基于SVD的DCT域音频水印算法

一种基于SVD的DCT域音频水印算法

第24卷第8期 V01.24 No.8 重庆理工大学学报(自然科学) Journal of Chongqing University of Technology(Natural Science) 2010年8月 Aug.2010 

一种基于SVD的DCT域音频水印算法 

暴晋飞,柏森,尤春艳,柏玉保 

(重庆通信学院,重庆400035) 

摘 要:提出了一种基于SVD的音频水印算法。对载体音频进行分段DCT变换,根据人耳 

听觉的频率掩蔽效应,选择出人耳听觉容差最大的DC直流系数。利用奇异特征值良好的稳定 

性,通过改变SVD奇异特征来值嵌入水印。实验结果表明,嵌入水印后的音频文件不仅具有良 

好的不可感知性,而且对诸如加噪、低通滤波、重采样、回声和Mp3压缩等具有很强的鲁棒性, 

算法的鲁棒性和不可感知性达到了平衡。 

关键词:音频水印;DCT;SVD;鲁棒性 

中图分类号:TP391 文献标识码:A 文章编号:1674—8425(2010)08—0091—06 

Audio Watermarking Algorithm Based on SVD in DCT Domain 

BAO Jin—fei,BAI Sen,YOU Chun-yan,BAI Yu-bao 

(Chongqing Communication Institute,Chongqing 400035,China) 

Abstract:A novel audio waterrmarking algorithm based on SVD is proposed.First the host audio is 

divided into several segments which are simultaneously convened to DCT domain,then the DC coeffi- 

cients which is insensitivity to the human ear heating and has the biggest hearing margin are selected. 

Based on the stability of SVD,the watermark is embedded by changing SVD.Experimental results show that the watermarked audio has good imperceptibility and is robust against different kinds of at- 

tacks,such as noise adding,low—pass filtering,re—sampling,echo and Mp3 compression.The robust- 

ness and the imperceptibility of watermarked audio reach a good balance. 

Key words:audio watermarking;DCT;SVD;robustness; 

随着通信技术和网络多媒体技术的飞速发 

展,数字音频已经相当普及,对音频文件的版权保 

护也显得越来越重要。通过在音频载体中嵌入水 印,可以实现盗版确认、使用跟踪等功能,因此,音 

频水印受到越来越多的重视。经过十几年的发 

展,音频水印取得了很大的进步,出现了许多有代 

收稿日期:2010—02—15 基金项目:重庆市自然科学基金资助项目(CSTC,2008BB2296) 作者简介:暴晋飞(1983一),男,硕士研究生,主要从事语音信息隐藏和数字音频水印研究。

 重庆理工大学学报 

表性的算法。这些算法基本可以分为2类:时域 

算法和变换域算法。时域算法的主要代表有LSB 

算法…和回声隐藏算法 J。LSB算法实现简单,容 

量较大,但其鲁棒性差。也有一些算法具有很好 的鲁棒性,如时域能量算法 ]、时域编码算法|4]、 

采样点倒置算法 等。变换域算法比较多,代表 

性的有通过改变DFT[ 、DCT[ 、小波变换 “] 

等变换域的系数来嵌入水印的算法。 

DCT域水印算法计算量比较小,受到学界越 

来越多的重视。为使嵌入水印的音频在不可感知 性与鲁棒性之间取得较好的平衡,文献[8]通过 

DCT噪声信号模型,定义DCT系数的噪声敏感 

度,建立水印嵌入位置和嵌入水印后的音频信号 

的听觉感知性之间的关系,根据音频水印的不可 

感知性的要求选择最优的嵌入系数,然后通过调 

节水印强度来满足鲁棒性的要求,从而保证了音 

频水印的不可感知性和鲁棒性。文献[9]根据 

DCT的能量特性,将音频文件的DCT系数进行分 

块,用每一块能量特性系数构造水印嵌入的强度 

因子,自适应地改变DCT系数来嵌入水印。文献 

[10]借助于卷积码的编、解码思想,利用扩频技术 

自适应地改变DCT中低频段系数嵌入水印,并采 

用Viterbi软判决的盲检水印提取方案,提高了水 

印检测精度。分析发现,大部分DCT域的音频水 

印算法是通过修改DCT低频或中频系数来实现 

的,这样的算法有一定的鲁棒的,并且不可感知性 比较好。为了进一步提高水印的鲁棒性,并保持 

鲁棒性和不可感知性之间的平衡,文献[11]根据 

人耳听觉掩蔽效应分析了DCT域各系数的听觉容 

差,选择听觉容差最大的直流系数作为水印嵌入 

位置,通过修改直流系数值来嵌入水印,具有较强 

的鲁棒性。但该方法对DC直流系数改变较大,即 

对原始音频改变较大,从而影响其不可感知性。 

本文根据DCT域直流系数具有较大听觉容差 

的特点,结合SVD奇异特征值的稳定性,通过改变 

奇异特征值的方法来嵌入水印信息。通过该算法 

嵌入水印信息对原始音频的改变较小,且具有很 

好的鲁棒性,在鲁棒性和不可感知性之间达到了 很好的平衡。实验结果表明,水印音频在不可感 

知性和鲁棒性方面都达到了比较好的效果。 

1 嵌入系数的选取及同步策略 

1.1奇异值分解理论 

奇异值分解(sigular value decomposition)是一 种特殊的矩阵变换。奇异值定义如下n :设A∈ 

R ,由于n×/2矩阵 是半正定的,其特征值 

的非负平方根称为 的奇异值,记作A。≥A ≥… 

≥A >10,并用A(A)表示 的奇异值全体: 

A(A)兰{A≥0;ATAx=A , ∈R, ≠0) 

(1) 

定义矩阵A∈R ,其中R表示实数域,则矩 阵 的奇异值可以定义为 A:USvT=[u】,M2,…, ]・ 

A1 

其中:U=[u1,u2,…,“ ]∈R~ 和V=[ 1, 2,…, 

]∈R 是正交矩阵, , 分别称为A的左,右 

奇异列向量;S E R 是对角矩阵,对角线上的元 

素满足A1≥A2≥…≥A,>A r+1=…=A =0;r是A 的秩。A 是由该分解唯一确定,叫做A的奇异值, 

它是 特征值的平方根。矩阵 的分解式(2) 称作 的奇异值分解。将式(2)用向量外积的形 

式表示为 

A=∑.2t ‘= 

lA1 1 T+ 2A2 2T+… + A, ,T: A1 1 I T+ 2 2 2T+… +A, , T (3) 

奇异值分解定理:设A∈R 的秩为r,则存 

在酉矩阵U∈R~ 和酉矩阵V∈R~ ,使得 

=∑ ㈩ 

式(4)中∑,=diag(A ,…,A,),其中:A,≥ 

A ≥…≥A 是A的全部非零奇异值;0 ,0 ,0 分 暴晋飞,等:一种基于SVD的DCT域音频水印算法 93 

另0是(m—r)×(凡一r),(,n—r)x r,r x( —r)的零 

矩阵。 矩阵的奇异值分解是一种将矩阵对角化的正 

交变换,矩阵的奇异值作为矩阵的一中有效特征, 具有3个优良的特性:①奇异值所表现的是矩阵 

的固有特性;②奇异值具有非常好的稳定性,当矩 

阵中的元素发生小的变化时,奇异值的变化很小; 

③在矩阵做奇异值分解得到的奇异值序列中,第 

1个奇异值比其他奇异值大很多,对矩阵的作用也 

最重要。 1.2特征值系数的选取 

本文根据人耳听觉的掩蔽效应,选择了DCT 系数中容差最大的DC直流系数构成矩阵,以满足 

算法的不可感知性。为了提高算法的鲁棒性,在 

选取嵌人系数时要考虑:一方面,选取嵌入水印的 系数的改变要对原矩阵元素值的改变较大;另一 

方面,矩阵中的元素发生小的变化,对所选系数的 

影响要小。 设式(2)中: 

则有: A= 

U= 

S= 

V= 0l,1 0,1,2 口2,1 a2,2 

a3,1 a3,2 tZ4,1 C/,4,2 

U1,1 U1,2 

U2,1 //'2,2 11"3,1 1,b3,2 /Z4.1 M4.2 

A1 0 

0 A2 

0 0 

0 0 0 0 

0 0 

A 3 0 

0 A 。2,1 U2,1/ ̄1v1.1+U2,2 ̄2/)1.2+ 2,3A3 1,3+U2,4/ ̄4v1.4 

,4 U4,1A1 4.1+U4,2A2 4,2+U4,3}[3v4。3+U4,4/ ̄4v4.4 (5) 

由式(5)可以看出,A中的每一个系数都是A 

(i:1,2,3,4)的函数,又A ≥A2≥A 3≥A4≥0,且 A.≥A ;i=2,3,4,所以A 的改变对原矩阵系数影 

响最大,因此选取A 作为嵌入水印的系数。 

利用以上结论,结合听觉容差与鲁棒性的关 

系,本文选择直流系数矩阵的第一个奇异特征值 作为水印嵌入位置。这样将会使水印的鲁棒性和 

不可感知性达到非常好的平衡。 

1.3 同步策略 引入同步机制来确定秘密信息嵌入的位置, 

从而确保秘密信息的正确提取。同步方案设计是 

利用文献[13]的算法原理,将一段随机序列嵌入 

语音信息小波变换后低频系数的起始位置,提取 秘密信息时首先用相关检测找到秘密信息嵌人的 

起始位置,然后再对应的提取秘密信息。本文选 

用m序列作为同步的伪随机序列。因为m序列 

容易产生,规律性强,有许多优良的特性(如周期 性、自相关性等),且在扩频通信中有广泛的应用。 

2水印算法 

本文选择直流系数矩阵的奇异特征值嵌入水 

印。由于在一些信号处理(如Mp3压缩)中会出 

现原始音频序列长度和处理后的音频序列长度不 

等的情况,因此有必要引入同步机制,进一步保证 

水印的正确提取。同步方案设计是根据文献[13] 的算法,利用嵌入水印的起始位置之前的若干个 

点,在小波域嵌入一段序列(随机序列或m序 

列)。本文选择嵌入一段m序列。提取水印时首 

先用相关检测的方法找到水印嵌入的起始位置, 

然后再进行水印的提取。 4 4 1 2 4 4 、^ 几 』 4 + + 3 3 l 2 1 3 几、^ 1J 3 + + 2 2 l 2 2 2 、^、几 2 2 U + + l 2 、^、几 = = 1 2 l l ● 0 0 ¨ 3 3 3 3 3 3 3 3m m m 

咖 m 咖

相关主题