第2卷第1期 解放军理工大学学报 V o l .2N o .12001年2月 Jou rnal of PLA U n iversity of Science and T echno logy Feb .2001文章编号:100923443(2001)0120032205数字水印技术与图像版权保护王焕伟, 陈向东, 陈显治(解放军理工大学通信工程学院,江苏南京210016)摘 要:数字水印技术是一种新型的图像版权保护技术,它通过在原始图像中嵌入一定的数字信息,实现对图像的版权保护。
主要介绍这一技术的原理、要求、发展、分类及典型算法,概述水印技术所面临的种种攻击手段,并讨论其发展方向和应用前景。
关键词:数字水印;版权保护;完全水印;不完全水印;图像攻击中图分类号:T P 309文献标识码:AD ig ita lW a te r m a rk ing a nd I m a ge C opy right P ro te c tionW A N G H uan 2w ei , CH EN X iang 2d ong , CH EN X ian 2z h i(In stitu te of Comm un icati on s Engineering ,PLAU ST ,N an jing 210016,Ch ina )Abs tra c t :D igital w aterm ark ing ,a new techn ique fo r i m age cop yrigh t p ro tecti on ,is p erfo rm ed by em bed 2ding certain digital info rm ati on in to the o riginal i m age .In th is p ap er ,the p rinci p le ,the techn ical requ ire 2m en t ,the developm en t ,the classificati on and the typ ical algo rithm s of digital w aterm ark ing are in tro 2duced ,the attack s that confron t it are summ arized ,and its developm en t tendency and app licati on p ro sp ects are also discu ssed .Ke y w o rds :digital w aterm ark ing ;cop yrigh t p ro tecti on ;com p lete w aterm ark ;incom p lete w aterm ark ;i m 2age attack 收稿日期:2000204211.作者简介:王焕伟(1973-),男,硕士生. 随着数字技术的发展,In ternet 应用日益广泛,越来越多的人利用计算机通过互联网发布自己的作品,进行传播、交流和商业运作。
但是,各种数字媒体因其数字特征极易被复制、篡改、非法传播以及蓄意攻击,其版权保护,已日益引起人们的关注。
近年来国际上提出了一种新型的版权保护技术——数字水印技术,利用人类的听觉、视觉系统的特点,在图像、音频、视频中加入一定的信息,使人们很难分辨出加密后的资料与原始资料的区别,而通过专门的检验步骤又能提取出所加信息,以此证明原创者对数字媒体的版权。
本文着重介绍数字图像的水印技术。
1 数字水印的要求及发展数字水印技术不仅要实现有效的版权保护,而且水印后的图像必须与原始图像具有同样的应用价值。
因此,数字图像的内嵌水印必须满足下列条件:(1)透明性:水印后图像不能有视觉质量的下降,与原始图像对比,很难发现二者的差别;(2)鲁棒性:加入图像中的水印必须能够承受施加于图像的变换操作(如:加入噪声、滤波、有损压缩、重采样、D A 或A D 转换等),不会因变换处理而丢失,水印信息经检验提取后应清晰可辨;(3)安全性:数字水印应能抵抗各种蓄意的攻击,必须能够唯一地标志原始图像的相关信息,任何第三方都不能伪造他人的水印图像。
数字水印可以是图像、签名、文本文件、符号序列等。
从安全和作为证据的角度出发,水印最好取意义明显的标志物。
从信息量上考虑,一方面,嵌入水印的信息量越大,其鲁棒性越好;另一方面,水印的信息量越少,其透明性越高。
因此,数字水印的选取应兼顾鲁棒性与透明性的要求,通常采用比原始图像小的二值图像、灰度级图像或具有一定长度的正态分布序列。
到目前为止,数字水印技术已有不下十几种算法,出现了各种不同的水印方案。
根据水印的可见性可分为“可视水印”与“不可视水印”,目前我们所关注的都是“不可视水印”。
从水印的提取是否需要原始图像可分为“完全水印技术”(提取水印时不需要原始图像)与“不完全水印技术”(提取水印时需要原始图像)。
目前所研究的大多是“不完全水印技术”,但是考虑到In ternet 网络的环境及应用的便利性,对彻底的媒体版权保护而言,只有“完全水印技术”才是可行的。
2 不完全数字水印不完全数字水印技术的实现过程可用图1表示,其算法大体可分为两类:时域(空域)算法与变换域(频域)算法。
图1 不完全数字水印系统F ig .1 Incomp lete digital w aterm ark ing system2.1 时(空)域算法时域算法是最早最简单的水印算法,典型的有L SB (L east Sign ifican t B its )算法等,其原理是通过简单地改变图像中感觉器官不易觉察的象素值来加入水印信息,再通过原始的记录来检测水印信息的存在,以此证明对图像的所有权。
后来,又相继提出了几种空域水印算法,但加入的水印很容易受到有损压缩、量化、有噪信道传输的影响而丢失,因而现在已经基本不用。
2.2 变换域水印算法变换域水印技术在图像从时域到频域的变换过程中,对水印信息进行一定的频域调制,使其很好地隐藏在图像重要的能量部分,同时又不引起图像质量的明显下降。
由于它较好地满足了数字水印技术透明性和鲁棒性的要求而成为当前最重要的水印算法。
变换域算法,以Cox 于1995年提出的水印算法为典型代表,随后人们相继提出了结合小波变换、W alsh 变换、分形变换的数字水印算法和块分类法、中频段嵌入法等数字水印技术。
下面介绍两个典型的频域数字水印的例子。
2.2.1 采用块变换水印的例子本例中图像是512×512像素的,水印为128×128像素的二值图像,其水印步骤如下:(1)离散余弦变换。
将原始图像分成8×8的块,逐块进行DCT 变换,共产生4096个块的变换系数。
(2)DCT 块重新排列。
随机地调整块的次序,使水印信息更广泛地分布在原始图像上。
这不仅解开了水印位与原图像素的相关性,有助于防止标注图像中出现局部区域具有相近的中频调制系数,而且随机水印序列充当了一个安全密钥。
(3)提取中频系数。
接下来要从排列次序不同的变换域系数块中选择所需要的中频系数。
对这个算法而言,需要采用两倍于水印比特数的可供选择的中频系数。
由于水印是128×128的二进制矩阵,所以需要提取一个256×128的中频系数矩阵进行调制,从而有4096个4×2的块需要提取,就是说,每个64像素的块中必须选出8个系数。
图2中给出了一个如何进行该操作的例子。
(4)修正系数。
选出了可供修正的中频系数后,接下来要用嵌入的水印调整它们的值。
对水印阵中每个块(i ,j )而言,其中频矩阵中(k ,l )和(m ,n )块如图3所示(k =i ×2,l =j ,m =k +1,n =j )。
残留值的函数是:R m ,n (p ,q )=sgn [Z m ,n (p ,q )-Z k ,l (p ,q )](1)R m n (p ,q )是与块(m ,n )、系数(p ,q )(0≤p <2,0≤q <4)相应的残留值,Z m ,n (p ,q )是与块(m ,n )、系数(p ,q )相应的中频矩阵值。
当括弧内的值为1时,sgn 函数值为1,否则sgn 函数值为0。
33第1期 王焕伟,等:数字水印技术与图像版权保护图2 中频系数选择图3 矩阵索引F ig.2 M idband coefficien t selecti on F ig.3 A rray index ing (5)修改后的系数回归原序列。
这一步正好与第(3)步中提取中频系数过程相反。
(6)恢复块的次序及I DCT变换。
重新组织DCT块,使之恢复原来次序,进行I DCT变换产生含有水印的标注图像。
2.2.2 利用扩频技术的变换域水印算法该算法是受通信中扩频技术的启发而得到的,最早由Cox提出。
其主要思想是将整幅图像看作一个块进行变换。
例如,对一幅512×512像素的原始图像,水印过程如下:(1)图像变换。
原始图像进行DCT变换,得到一个具有512×512个变换域系数的块,并从中抽取要加入水印的DCT域系数序列V={V i}。
(2)产生水印。
水印序列X由N(本方案中N 取为1000)个服从均值为0、方差为1的正态分布的随机数组成(因为正态分布的水印信息能够更好地抵抗“多文件联合攻击”)。
(3)对水印中的每一个随机数X i进行如下计算,以修正图像的变换系数:V′i=V i(1+Α X i)(2)这里,V′i和V i分别是修正后的DCT系数和原始DCT系数,Α代表水印浓度,其推荐值是0.1~0.2。
(4)对修正后的变换域系数V′组成的矩阵进行I DCT变换,得到含有水印信息的标注图像。
修改DCT系数使得水印信息广泛分布在图像上,从而该方案对裁剪(C ropp ing)等攻击具有相当的抵抗能力。
(5)水印恢复。
对一幅待检测的图像V3,通过与上述4个步骤相反的操作可以得到一列随机数X3。
(6)对提取的“水印”X3跟原来的水印进行相关分析:si m(X,X3)=X X3 (X3X3)(3) 一幅未被攻击的图像,其si m值通常在30左右,其统计显著性水平约为6(技术细节见文献[3])。
因此,如果水印的si m值在6以上就可以认为已有水印,如果低于6,则认为没有水印。
显然,原始图像的介入,使水印提取变得比较简单,但这意味着任何需要确认所有权的人都必须得到原始图像才行,管理大量未经水印的原始图像无疑是件困难的事情,而且未经水印的图像数据库的存在,为非法访问提供了方便。
所以,许多学者已经将研究重点转移到了“完全数字水印技术”。