第一章数字水印概述随着Internet和数字技术的发展,各种形式的数字作品纷纷以网络形式发表,然而数字作品的便利性和不安全性是并存的。
它可以低成本、高速度地被复制、传播和公开。
盗版者正是利用这些途径侵犯数字产品制造商和用户的合法权利和利益。
数字水印技术就在这种应用要求下迅速发展起来。
这是一种有效的数字产品版权保护和数据安全维护技术,是信息隐藏技术领域的一个重要分支。
数字水印技术是指将特定的信息嵌入数字信号中,数字信号可能是音频、图片或是影片等。
若要拷贝有数字水印的信号,所嵌入的信息也会一并被拷贝。
可以用于判别对象是否受到保护,监视被保护数据的传播,鉴别真伪,解决版权纠纷并为法庭提供认证证据。
1.1数字水印系统的基本框架一个典型的数字水印系统由嵌入器和检测器组成。
嵌入器至少具有两个输入量:一个是原始信息,它通过适当的变换后作为待嵌入的水印信号;另一个就是要在其中嵌入水印的载体作品。
水印嵌入器的输出结果为含水印的载体作品。
它通常用于传输和转录,之后这件作品或另一件未经过这个嵌入器的作品可作为水印检测器的输出量。
大多数检测器试图尽可能地判断出水印存在与否。
若存在,则输出为所嵌入的水印信号。
图1-1给出了数字水印处理系统基本框架的详细示意图。
它可以定义为九元体(M, X, W, K, G, Em, At, D, Ex),分别定义如下:1、M代表所有可能原始信息的集合;2、X代表所要保护的数字产品x的集合,即内容;3、W代表所有可能水印信号w的集合;4、K代表水印密钥k的集合;5、G代表利用原始信息m、密钥k和原始数字产品x共同生成水印的算法,即G:M×X×K→W,w=G(m, x, K)需要说明的是,原始数字产品不一定参与水印的生成过程,因此图1-1中用细线表示。
6、Em表示将水印w嵌入数字产品x中的嵌入算法,即Em: X×W→X, x w=Em(x, w)这里,x代表原始,x w代表含水印产品,为提高安全性,有时在嵌入算法中包含嵌入密钥。
7、A t表示对含水印产品x w d的攻击算法,即At:X×K→X, x’表示被攻击后的含水印产品。
8、D表示水印检测算法,即D:X×K→{0,1},D(x’,K)={1 如果x′中存在w (H1) 0 若x′中不存在w (H0)这里,H1和H0代表二值假设,分别表示水印的有无。
9、Ex表示水印提取算法,即Ex:X×K→W, w′=Ex(x′,K)图1-11.2 数字水印的主要性质数字水印技术作为信息隐藏技术的一个分支,除了应该具备信息隐藏技术的一般特点外,还有一些其他的特征。
一般认为具有版权保护功能的数字水印应具备以下几个特征:1、不可见性(Fidelity,透明性)不可见包含两方面的意思,一个只视觉上的不可见性,即因嵌入水印导致图像的变化对观察者的视觉系统来讲是不可觉察的,数字水印的存在不应影响被保护数据的正常使用;另一方面,水印信息不被观察者察觉,如果水印可见,则为可见水印。
2、安全性(Safety)水印嵌入的算法是公开的,安全性建立在密钥管理基础之上,所以密钥空间需要足够大,而且分布比较均匀。
水印还应是统计上不可检测的,对于通过改变水印载体来消除和破坏水印的企图,水印应该保持存在知道数字产品丧失利用价值为止。
另外,脆弱水印要能抵抗“伪认证”攻击。
3、鲁棒性(Robustness)鲁棒性是指水印能够抵御对嵌入后数据的一定操作,而不因为一些细微的操作而磨灭。
包括数据的传输中产生的个别位错误,图像或视频、音频的压缩以及篡改水印、伪造水印、多重水印等恶意攻击。
不具备这一特性的水印,称为脆弱水印。
4、确定性恢复出的水印或水印判决的结果应能充分可靠地证明所有者对数字产品的所有权,不会发生多重所有权的纠纷。
5、数据容量(Data Payload)数据容量是指在单位时间或一幅作品中能嵌入的水印的比特数。
嵌入的水印必须唯一地标识一个多媒体信息。
6、错误率错误率是指不含信号的宿主信号中,错误地检测出水印的概率。
只有错误率足够低,系统才能安全可靠地使用。
7、计算复杂度不同应用对水印嵌入算法和提取算法的计算复杂度有不同的要求。
如数字指纹要求嵌入算法速度快,但对检测算法则不需要很快;其他的水印一般对嵌入速度要求不高,但对检测的速度要求快。
其中,不可见性和鲁棒性是对数字水印的最基本要求。
DCT(离散余弦变换)数字水印是目前研究最多的一种数字水印,它具有鲁棒性强、隐蔽性好的特点。
其主要思想是在图像的DCT变换域上选择中低频系数叠加水印信息。
之所以选择中、低频系数,是因为人眼的感觉主要集中在这一频段,攻击者在破坏水印的过程中,不可避免地会引起图像质量的严重下降,一般的图像处理过程也不会改变这部分数据。
由于JPEG、MPEG等压缩算法的核心是在DCT变换域上进行数据量化,所以通过巧妙地融合水印过程与量化过程,就可以使水印抵御有损压缩。
此外,DCT变换域系数的统计分布有比较好的数学模型,可以从理论上估计水印的信息量。
1.3 数字水印的分类数字水印的分类方法有很多种,分类的出发点不同导致了分类的不同,它们之间既有联系又有区别。
最常见的分类方法包括以下几类:1、按水印特性划分从人类视觉系统来看,按照数字水印在数字作中是否可见分为可见水印和不可见水印。
可见水印指水印在数字产品中可见,但是不太醒目。
不可见水印指将水印信息嵌入到数字图像、视频或音频中,从表面上很难觉察到数字作品的变化。
不可见水印又有以下两种分类:○1脆弱水印或易碎水印(Fraigile watermark)当嵌入水印的载体数据被修改时,通过对水印的检测,可以对载体是否进行了修改或进行了何种修改进行判定。
○2稳健水印(Robust watermark)○3半脆弱水印半脆弱水印是介于脆弱水印与健壮水印之间的一种水印,它要求能够抵抗一定程度的数字信号处理操作,如JPEG压缩和VQ压缩等,比脆弱水印稍微鲁棒一些,是在一定程度上的完整性检验。
2、按水印所负载的载体数据划分按水印所附载的载体数据,我们可以将水印划分为图像水印、音频水印、视频水印、文本水印以及用于三维网格模型的网格水印等。
随着数字技术的不断发展,会有更多种类的数字媒体出现,同时也会产生相应载体的水印技术。
3、按水印检测过程划分在水印提取或检测过程中,如果需要原始数据来提取水印信息,称为非盲水印算法;如果不需要原始数据参与,可直接根据含水印的数据来提取水印信息,称为盲水印算法。
半盲水印的检测只需要密钥,不需要原始数据。
4、按水印隐藏位置划分按数字水印的隐藏位置,我们可以将其划分为时/空域数字水印、频域数字水印。
时/空域数字水印是直接在信号空间上叠加水印信息,这类水印算法一般较为简单,嵌入的信息量较大,但是稳健性较弱。
频域的数字水印是先进行某种变换,如DCT、DWT、DFT,通过修改变换域系数来达到嵌入水印的目的。
这类水印算法一般较为复杂,但是它们往往具有较强的稳健性。
1.4 数字水印的原理分析数字水印系统包含嵌入器和检测器两大部分,其中,嵌入器将水印信息嵌入到载体作品中,检测器是从含水印的载体作品中检测出或提取出水印信息。
1、水印信息的嵌入从图像处理的角度看,嵌入水印可以视为在原图像下叠加一个弱信号(水印)。
由于人的视觉系统(HVS)分辨率受到一定的限制,只要叠加信号的幅度低于HVS的对比度门限,人眼就无法感觉到信号的存在。
对比度门限受视觉系统的空间、时问和频率特性的影响,因此,通过对原始图像做一定的调整,有可能在不改变视觉效果的情况下嵌入一些信息。
设载体图像为I,水印信号为w,密钥为K,含水印图像为I w,则水印嵌入过程可用公式表示为:I w=F(I,W,K)式中F为所采用的嵌入算法。
嵌入流程图如图1-2所示:图1-22、水印信息的检测水印的检测可看成一个有噪信道中弱信号的检测问题,它一般包含水印的提取和水印的判定两个部分。
水印判决通常是用相关性检测来实现的,选择一个相关性判别标准,计算提取出的水印与指定水印的相关值,如果相关值足够高,则可以基本判定被检测数据含有指定的水印。
根据检测过程中需不需要原始载体的参与,可以把水印检测分为需要原始载体参与的非盲检测和不需要原始载体参与的盲检测。
水印的盲提取一般需要设定一个阈值,由含水印数据与阈值进行比较得到水印信息。
水印的非盲提取过程一般是水印嵌入过程的逆过程。
图1-3为水印的提取流程,其中非盲水印的检测原始载体不参与检测。
图1-31.5 数字图像水印的典型算法1、时空域算法早期人们对数字水印的研究基本上是基于时空域的,算法相对简单,实时性较强,但在稳健性上不如变换域算法和压缩域算法。
实际上,在时空域算法中,重要的一类算法是脆弱水印或半脆弱水印算法,因为这类算法具有对攻击的时间或空间位置的定位能力。
因此,后期人们研究的时空域算法多用于内容认证或篡改提示。
○1最低有效位方法(LSB)早期,水印设计者关注的是如何把信息隐藏在数字媒体中并不被发现。
为此,水印信息被置于二进制数据的最低位中,这类方案被统称为最低有效位调制。
最低有效位内的信息容易在常用的信号处理中丢失,水印的鲁棒性差。
这是一种典型的空间域数据隐藏算法,利用此方法将特定的标记隐藏于数字音频和数字图像内。
该方法是利用原始数据的最低几位来隐藏信息的。
LSB方法的优点是有较大的信息隐藏量,但采用此方法实现的数字水印是很脆弱的,无法经受一些无损和有损的信息处理,而且如果确切地知道水印隐藏在几位LSB中,数字水印很容易被擦除或绕过。
○2Pachwork图像信息隐藏Pachwork是指从载体数据中选择一些数据组成两个集合,然后通过修改这两个集合之间的某种关系来携带水印信息。
这两个集合可以是两个系数、两组系数或是两个特征量。
两个集合之间的关系可以是大小关系、能量关系、逻辑关系和奇偶性关系等。
Pachwork方法嵌入水印时,通过修改集合之间的某种关系来嵌入水印;提取水印时,根据对应的关系来提取嵌入的水印信息。
Pachwork方法最大的优点之一就是可以实现盲检测。
2、变换域算法时空域数字水印算法的普遍缺点是嵌入的信息量不能太多,稳健性差,尤其对滤波、量化和压缩攻击,为此,变换域水印算法成为当前研究的重点。
变换域算法主要通过修改载体的变换域系数来实现水印嵌入过程,它具有物理意义清晰、可充分利用人类的感知特性、不可见性和稳健性好及可与压缩标准兼容等优点。
○1DFT域水印算法傅里叶变换在时域和频域上都呈离散的形式,将信号的时域采样变换为其DTFT的频域采样。
在形式上,变换两端(时域和频域上)的序列是有限长的,而实际上这两组序列都应当被认为是离散周期信号的主值序列。
即使对有限长的离散信号作DFT,也应当将其看作其周期延拓的变换。