当前位置：文档之家› 一种基于SVD的DCT域音频水印算法

一种基于SVD的DCT域音频水印算法

第２４卷第８期　Ｖ０１．２４　Ｎｏ．８　重庆理工大学学报（自然科学）　Ｊｏｕｒｎａｌ　ｏｆ　Ｃｈｏｎｇｑｉｎｇ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｔｅｃｈｎｏｌｏｇｙ（Ｎａｔｕｒａｌ　Ｓｃｉｅｎｃｅ）　２０１０年８月　Ａｕｇ．２０１０　

一种基于ＳＶＤ的ＤＣＴ域音频水印算法　

暴晋飞，柏森，尤春艳，柏玉保　

（重庆通信学院，重庆４０００３５）　

摘　要：提出了一种基于ＳＶＤ的音频水印算法。对载体音频进行分段ＤＣＴ变换，根据人耳　

听觉的频率掩蔽效应，选择出人耳听觉容差最大的ＤＣ直流系数。利用奇异特征值良好的稳定　

性，通过改变ＳＶＤ奇异特征来值嵌入水印。实验结果表明，嵌入水印后的音频文件不仅具有良　

好的不可感知性，而且对诸如加噪、低通滤波、重采样、回声和Ｍｐ３压缩等具有很强的鲁棒性，　

算法的鲁棒性和不可感知性达到了平衡。　

关键词：音频水印；ＤＣＴ；ＳＶＤ；鲁棒性　

中图分类号：ＴＰ３９１　文献标识码：Ａ　文章编号：１６７４—８４２５（２０１０）０８—００９１—０６　

Ａｕｄｉｏ　Ｗａｔｅｒｍａｒｋｉｎｇ　Ａｌｇｏｒｉｔｈｍ　Ｂａｓｅｄ　ｏｎ　ＳＶＤ　ｉｎ　ＤＣＴ　Ｄｏｍａｉｎ　

ＢＡＯ　Ｊｉｎ—ｆｅｉ，ＢＡＩ　Ｓｅｎ，ＹＯＵ　Ｃｈｕｎ－ｙａｎ，ＢＡＩ　Ｙｕ－ｂａｏ　

（Ｃｈｏｎｇｑｉｎｇ　Ｃｏｍｍｕｎｉｃａｔｉｏｎ　Ｉｎｓｔｉｔｕｔｅ，Ｃｈｏｎｇｑｉｎｇ　４０００３５，Ｃｈｉｎａ）　

Ａｂｓｔｒａｃｔ：Ａ　ｎｏｖｅｌ　ａｕｄｉｏ　ｗａｔｅｒｒｍａｒｋｉｎｇ　ａｌｇｏｒｉｔｈｍ　ｂａｓｅｄ　ｏｎ　ＳＶＤ　ｉｓ　ｐｒｏｐｏｓｅｄ．Ｆｉｒｓｔ　ｔｈｅ　ｈｏｓｔ　ａｕｄｉｏ　ｉｓ　

ｄｉｖｉｄｅｄ　ｉｎｔｏ　ｓｅｖｅｒａｌ　ｓｅｇｍｅｎｔｓ　ｗｈｉｃｈ　ａｒｅ　ｓｉｍｕｌｔａｎｅｏｕｓｌｙ　ｃｏｎｖｅｎｅｄ　ｔｏ　ＤＣＴ　ｄｏｍａｉｎ，ｔｈｅｎ　ｔｈｅ　ＤＣ　ｃｏｅｆｆｉ－　

ｃｉｅｎｔｓ　ｗｈｉｃｈ　ｉｓ　ｉｎｓｅｎｓｉｔｉｖｉｔｙ　ｔｏ　ｔｈｅ　ｈｕｍａｎ　ｅａｒ　ｈｅａｔｉｎｇ　ａｎｄ　ｈａｓ　ｔｈｅ　ｂｉｇｇｅｓｔ　ｈｅａｒｉｎｇ　ｍａｒｇｉｎ　ａｒｅ　ｓｅｌｅｃｔｅｄ．　

Ｂａｓｅｄ　ｏｎ　ｔｈｅ　ｓｔａｂｉｌｉｔｙ　ｏｆ　ＳＶＤ，ｔｈｅ　ｗａｔｅｒｍａｒｋ　ｉｓ　ｅｍｂｅｄｄｅｄ　ｂｙ　ｃｈａｎｇｉｎｇ　ＳＶＤ．Ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｓｈｏｗ　ｔｈａｔ　ｔｈｅ　ｗａｔｅｒｍａｒｋｅｄ　ａｕｄｉｏ　ｈａｓ　ｇｏｏｄ　ｉｍｐｅｒｃｅｐｔｉｂｉｌｉｔｙ　ａｎｄ　ｉｓ　ｒｏｂｕｓｔ　ａｇａｉｎｓｔ　ｄｉｆｆｅｒｅｎｔ　ｋｉｎｄｓ　ｏｆ　ａｔ－　

ｔａｃｋｓ，ｓｕｃｈ　ａｓ　ｎｏｉｓｅ　ａｄｄｉｎｇ，ｌｏｗ—ｐａｓｓ　ｆｉｌｔｅｒｉｎｇ，ｒｅ—ｓａｍｐｌｉｎｇ，ｅｃｈｏ　ａｎｄ　Ｍｐ３　ｃｏｍｐｒｅｓｓｉｏｎ．Ｔｈｅ　ｒｏｂｕｓｔ－　

ｎｅｓｓ　ａｎｄ　ｔｈｅ　ｉｍｐｅｒｃｅｐｔｉｂｉｌｉｔｙ　ｏｆ　ｗａｔｅｒｍａｒｋｅｄ　ａｕｄｉｏ　ｒｅａｃｈ　ａ　ｇｏｏｄ　ｂａｌａｎｃｅ．　

Ｋｅｙ　ｗｏｒｄｓ：ａｕｄｉｏ　ｗａｔｅｒｍａｒｋｉｎｇ；ＤＣＴ；ＳＶＤ；ｒｏｂｕｓｔｎｅｓｓ；　

随着通信技术和网络多媒体技术的飞速发　

展，数字音频已经相当普及，对音频文件的版权保　

护也显得越来越重要。通过在音频载体中嵌入水　印，可以实现盗版确认、使用跟踪等功能，因此，音　

频水印受到越来越多的重视。经过十几年的发　

展，音频水印取得了很大的进步，出现了许多有代　

收稿日期：２０１０—０２—１５　基金项目：重庆市自然科学基金资助项目（ＣＳＴＣ，２００８ＢＢ２２９６）　作者简介：暴晋飞（１９８３一），男，硕士研究生，主要从事语音信息隐藏和数字音频水印研究。

　重庆理工大学学报　

表性的算法。这些算法基本可以分为２类：时域　

算法和变换域算法。时域算法的主要代表有ＬＳＢ　

算法…和回声隐藏算法　Ｊ。ＬＳＢ算法实现简单，容　

量较大，但其鲁棒性差。也有一些算法具有很好　的鲁棒性，如时域能量算法　］、时域编码算法｜４］、　

采样点倒置算法　等。变换域算法比较多，代表　

性的有通过改变ＤＦＴ［　、ＤＣＴ［　、小波变换　“］　

等变换域的系数来嵌入水印的算法。　

ＤＣＴ域水印算法计算量比较小，受到学界越　

来越多的重视。为使嵌入水印的音频在不可感知　性与鲁棒性之间取得较好的平衡，文献［８］通过　

ＤＣＴ噪声信号模型，定义ＤＣＴ系数的噪声敏感　

度，建立水印嵌入位置和嵌入水印后的音频信号　

的听觉感知性之间的关系，根据音频水印的不可　

感知性的要求选择最优的嵌入系数，然后通过调　

节水印强度来满足鲁棒性的要求，从而保证了音　

频水印的不可感知性和鲁棒性。文献［９］根据　

ＤＣＴ的能量特性，将音频文件的ＤＣＴ系数进行分　

块，用每一块能量特性系数构造水印嵌入的强度　

因子，自适应地改变ＤＣＴ系数来嵌入水印。文献　

［１０］借助于卷积码的编、解码思想，利用扩频技术　

自适应地改变ＤＣＴ中低频段系数嵌入水印，并采　

用Ｖｉｔｅｒｂｉ软判决的盲检水印提取方案，提高了水　

印检测精度。分析发现，大部分ＤＣＴ域的音频水　

印算法是通过修改ＤＣＴ低频或中频系数来实现　

的，这样的算法有一定的鲁棒的，并且不可感知性　比较好。为了进一步提高水印的鲁棒性，并保持　

鲁棒性和不可感知性之间的平衡，文献［１１］根据　

人耳听觉掩蔽效应分析了ＤＣＴ域各系数的听觉容　

差，选择听觉容差最大的直流系数作为水印嵌入　

位置，通过修改直流系数值来嵌入水印，具有较强　

的鲁棒性。但该方法对ＤＣ直流系数改变较大，即　

对原始音频改变较大，从而影响其不可感知性。　

本文根据ＤＣＴ域直流系数具有较大听觉容差　

的特点，结合ＳＶＤ奇异特征值的稳定性，通过改变　

奇异特征值的方法来嵌入水印信息。通过该算法　

嵌入水印信息对原始音频的改变较小，且具有很　

好的鲁棒性，在鲁棒性和不可感知性之间达到了　很好的平衡。实验结果表明，水印音频在不可感　

知性和鲁棒性方面都达到了比较好的效果。　

１　嵌入系数的选取及同步策略　

１．１奇异值分解理论　

奇异值分解（ｓｉｇｕｌａｒ　ｖａｌｕｅ　ｄｅｃｏｍｐｏｓｉｔｉｏｎ）是一　种特殊的矩阵变换。奇异值定义如下ｎ　：设Ａ∈　

Ｒ　，由于ｎ×／２矩阵　是半正定的，其特征值　

的非负平方根称为　的奇异值，记作Ａ。≥Ａ　≥…　

≥Ａ　＞１０，并用Ａ（Ａ）表示　的奇异值全体：　

Ａ（Ａ）兰｛Ａ≥０；ＡＴＡｘ＝Ａ　，　∈Ｒ，　≠０）　

（１）　

定义矩阵Ａ∈Ｒ　，其中Ｒ表示实数域，则矩　阵　的奇异值可以定义为　Ａ：ＵＳｖＴ＝［ｕ】，Ｍ２，…，　］・　

Ａ１　

其中：Ｕ＝［ｕ１，ｕ２，…，“　］∈Ｒ～　和Ｖ＝［　１，　２，…，　

］∈Ｒ　是正交矩阵，　，　分别称为Ａ的左，右　

奇异列向量；Ｓ　Ｅ　Ｒ　是对角矩阵，对角线上的元　

素满足Ａ１≥Ａ２≥…≥Ａ，＞Ａ　ｒ＋１＝…＝Ａ　＝０；ｒ是Ａ　的秩。Ａ　是由该分解唯一确定，叫做Ａ的奇异值，　

它是　特征值的平方根。矩阵　的分解式（２）　称作　的奇异值分解。将式（２）用向量外积的形　

式表示为　

Ａ＝∑．２ｔ　‘＝　

ｌＡ１　１　Ｔ＋　２Ａ２　２Ｔ＋…　＋　Ａ，　，Ｔ：　Ａ１　１　Ｉ　Ｔ＋　２　２　２Ｔ＋…　＋Ａ，　，　Ｔ　（３）　

奇异值分解定理：设Ａ∈Ｒ　的秩为ｒ，则存　

在酉矩阵Ｕ∈Ｒ～　和酉矩阵Ｖ∈Ｒ～　，使得　

＝∑　㈩　

式（４）中∑，＝ｄｉａｇ（Ａ　，…，Ａ，），其中：Ａ，≥　

Ａ　≥…≥Ａ　是Ａ的全部非零奇异值；０　，０　，０　分　暴晋飞，等：一种基于ＳＶＤ的ＤＣＴ域音频水印算法　９３　

另０是（ｍ—ｒ）×（凡一ｒ），（，ｎ—ｒ）ｘ　ｒ，ｒ　ｘ（　—ｒ）的零　

矩阵。　矩阵的奇异值分解是一种将矩阵对角化的正　

交变换，矩阵的奇异值作为矩阵的一中有效特征，　具有３个优良的特性：①奇异值所表现的是矩阵　

的固有特性；②奇异值具有非常好的稳定性，当矩　

阵中的元素发生小的变化时，奇异值的变化很小；　

③在矩阵做奇异值分解得到的奇异值序列中，第　

１个奇异值比其他奇异值大很多，对矩阵的作用也　

最重要。　１．２特征值系数的选取　

本文根据人耳听觉的掩蔽效应，选择了ＤＣＴ　系数中容差最大的ＤＣ直流系数构成矩阵，以满足　

算法的不可感知性。为了提高算法的鲁棒性，在　

选取嵌人系数时要考虑：一方面，选取嵌入水印的　系数的改变要对原矩阵元素值的改变较大；另一　

方面，矩阵中的元素发生小的变化，对所选系数的　

影响要小。　设式（２）中：　

则有：　Ａ＝　

Ｕ＝　

Ｓ＝　

Ｖ＝　０ｌ，１　０，１，２　口２，１　ａ２，２　

ａ３，１　ａ３，２　ｔＺ４，１　Ｃ／，４，２　

Ｕ１，１　Ｕ１，２　

Ｕ２，１　／／＇２，２　１１＂３，１　１，ｂ３，２　／Ｚ４．１　Ｍ４．２　

Ａ１　０　

０　Ａ２　

０　０　

０　０　０　０　

０　０　

Ａ　３　０　

０　Ａ　。２，１　Ｕ２，１／￣１ｖ１．１＋Ｕ２，２￣２／）１．２＋　２，３Ａ３　１，３＋Ｕ２，４／￣４ｖ１．４　

，４　Ｕ４，１Ａ１　４．１＋Ｕ４，２Ａ２　４，２＋Ｕ４，３｝［３ｖ４。３＋Ｕ４，４／￣４ｖ４．４　（５）　

由式（５）可以看出，Ａ中的每一个系数都是Ａ　

（ｉ：１，２，３，４）的函数，又Ａ　≥Ａ２≥Ａ　３≥Ａ４≥０，且　Ａ．≥Ａ　；ｉ＝２，３，４，所以Ａ　的改变对原矩阵系数影　

响最大，因此选取Ａ　作为嵌入水印的系数。　

利用以上结论，结合听觉容差与鲁棒性的关　

系，本文选择直流系数矩阵的第一个奇异特征值　作为水印嵌入位置。这样将会使水印的鲁棒性和　

不可感知性达到非常好的平衡。　

１．３　同步策略　引入同步机制来确定秘密信息嵌入的位置，　

从而确保秘密信息的正确提取。同步方案设计是　

利用文献［１３］的算法原理，将一段随机序列嵌入　

语音信息小波变换后低频系数的起始位置，提取　秘密信息时首先用相关检测找到秘密信息嵌人的　

起始位置，然后再对应的提取秘密信息。本文选　

用ｍ序列作为同步的伪随机序列。因为ｍ序列　

容易产生，规律性强，有许多优良的特性（如周期　性、自相关性等），且在扩频通信中有广泛的应用。　

２水印算法　

本文选择直流系数矩阵的奇异特征值嵌入水　

印。由于在一些信号处理（如Ｍｐ３压缩）中会出　

现原始音频序列长度和处理后的音频序列长度不　

等的情况，因此有必要引入同步机制，进一步保证　

水印的正确提取。同步方案设计是根据文献［１３］　的算法，利用嵌入水印的起始位置之前的若干个　

点，在小波域嵌入一段序列（随机序列或ｍ序　

列）。本文选择嵌入一段ｍ序列。提取水印时首　

先用相关检测的方法找到水印嵌入的起始位置，　

然后再进行水印的提取。　４　４　１　２　４　４　、＾　几　』　４　＋　＋　３　３　ｌ　２　１　３　几、＾　１Ｊ　３　＋　＋　２　２　ｌ　２　２　２　、＾、几　２　２　Ｕ　＋　＋　ｌ　２　、＾、几　＝　＝　１　２　ｌ　ｌ　●　０　０　¨　３　３　３　３　３　３　３　３ｍ　ｍ　ｍ　

咖　ｍ　咖

e商务文档

一种基于SVD的DCT域音频水印算法

相关文档推荐：