数字音频水印技术研究综述
等内容( 例如, 一首音乐作品的录制时间和地点等) 以水印形式嵌入该作品中, 这种隐式注释不需要额 外的带宽, 且不容易丢失.
© 保密通信 可以将需要传递的秘密信息嵌 入到允许公开的数字音频作品之中. 由于嵌入秘密 信息的音频作品在主观听觉上并未发生变化, 察觉 到秘密信息存在的概率非常小.
ª 数字广播控制 在广播领域中, 可用数字音 频水印技术以不依赖于特定频段的方式执行自动任 务, 包括广播站P节目类型的标识、广告效果的统计 分析、广播覆盖范围的分析研究等.
数字音频信号 s ( n) 之能量要求按比例调制二进制
水印并得到数字水印信息 w ( n) ; 最后再调制水印 w ( n) 使之等于 r ( n) 或等于- r ( n) ( 取决于 v= 1 或
v = 0 ) , 并将调整信号加到原始信号上, 以产生含水
印的数字音频信号 x ( n) , 如
x ( n) = s ( n) + aw ( n ) . 检测方法利用了线性相关性, 因为伪随机序列
号等等. 实际上, 扩频方法是在数字音频信号上嵌入伪
随机序列, 无论采用哪种变换( DFT、DCT、DWT 等) ,
多种频率的噪 声都能嵌入时域信号或 变换域信号
中. 首先, 由伪随机序列 r ( n) 调节得到二进制水印 信息 v= { 0, 1} ( 其中, r ( n) 由密钥产生) ; 然后根据
近几年, 对图像水印技术和视频水印技术( 尤其 是图像水印技术) 的研究很多, 而对于数字音频水印 技术的研究却鲜有报道[ 2,3] , 这是由于: ¥ 与图像和 视频相比, 音频信号在每个时间间隔内采样的点数 要少得多, 意味着音频信号中可嵌入的信息量要比 可视媒体少得多. ¦ 人类听觉系统( HAS) 要比人类 视觉系统( HVS) 灵敏得多, 听觉上的不可知觉性实 现起来要比视觉上困难得多. § 数字音频水印对信 号的同步有比较高的要求. 然而, 随着 MP3、MPEG、
基本方面: 水印的生成、水印的嵌入和水印的提取或 检测. 数字音频水印技术实际上是通过对原始数字 音频的分析、水印信息的预处理、嵌入位置的选择、 嵌入方式的设计、嵌入调制的控制等几个相关技术 环节进行合理优化, 寻求满足透明性、安全可靠性、 鲁棒性等诸条件( 参见 2. 2 节) 约束下的准最优化设 计问题. 而作为数字音频水印信息的重要组成部分 ) ) ) 密钥, 则是每个设计方案的一个重要特色所在. 往往可以在水印预处理、嵌入位置选择和调制控制 等不同环节入手完成密钥的嵌入.
§ 非法拷贝防护 在数字音频作品录P放设备
的设计中应用音频水印技术, 当录P放设备工作时,
检查音频作品上是否有水印存在, 以决定该数字音
频作品应不应该被录P放, 从而拒绝非法拷贝音频作
第4期
王向阳, 等: 数字音频水印技术研究综述
1 21
品的流行和使用. ¨ 隐蔽标识 即将数字音频作品的标题、注释
第 31 卷 第 4 期 2005 年 10 月
曲 阜师 范大学 学报 Journal of Qufu Normal University
Vol. 31 No. 4 Oct. 2005
数字音频水印技术研究综述X
王向阳¹ º , 杨红颖¹
( ¹ 辽宁师范大学计算机与信息技术学院, 116029, 辽宁省大连市; º 中国科学院软件研究所信息安全国家重点实验室, 100039, 北京市)
由图 2 可以定义水印检测过程的通用公式为
( Ñ) 有原始数字音频 I 时:
O
O
W = D( IW , I, K) ,
( Ò) 有原始数字水印 W 时:
O
O
W = D ( I W, W, K ) ,
( Ó) 没有原始信息时:
O
O
W = D( I W, K) ,
O
O
其中, W表示估计水印, D 为数字水印检测算法, I W
基于扩频技术的数字音频水印方法是一种相关 性处理方法, 该方法是通过预测伪随机噪声序列与 含水印音频信号的相关性嵌入伪随机序列和检测水 印信息的. 扩频方法是最为流行的数字音频水印嵌 入方法之一, 其具有容易实现之优点, 但也存在一些
较为严重的缺陷和不足, 如为了减少听觉噪声需进
行有关心理听觉模型的大量计算、很难加入同步信
r( n) 是已知的, 而且能凭借密钥重新产生. 水印可
以通过 x ( n) 与 r( n) 的相关性检测到, 如
N
E c =
1 N
i= 1
x(
i)
r(
i),
其中 N 表示信号长度.
3. 2 基于回声隐藏的数字音频水印方法[12~ 14]
回声隐藏( Echo Hiding) 是通过引入回声将水印
信息嵌入到原始数字音频信号内. 它利用了人类听
摘要: 对数字音频水印技术的相关概念和现有 各类算 法进行 了较为 系统地 描述与 分析, 并对数 字音频
水印技术的未来发展方向和前景进行了预测, 以期进一步推动我国在此前沿领域的研究工作.
关键词: 知识产权保护; 数字音频水印; 透明性; 鲁棒性
中图分类号: TP391
文献标识码: A
文章编号: 1001_5337( 2005) 04_0119_06
整个数字音频水印系统[4] 的基本框架如图 1 和 图 2 所示.
图 1 展示了数字音频水印的嵌入过程. 该系统 的输入是水印信息 W、原始数字音频 I 和一个可选 的私有公有密钥 K . 其中水印信息可以是任何形式
X 收稿日期: 2005- 10- 04 基金项目: 辽宁省自然科学基金( 20032100) 和信息安全国家重点实验室开放基金( 03- 02) 资助. 作者简介: 王向阳, 男, 1965- , 硕士, 教授; 主要研究方向: 网络信息安全技术、多媒体信息处理技术.
或含水印版数字音频中获取水印信号作为依据, 从
而保护所有者的权益. ¦ 数字指纹 为了避免未经授权的拷贝制作
和发行, 数字音频作品的出版人可以将不同用户的
ID 或序列号作为不同的水印( 数字指纹) 嵌入到音
频作品的合法拷贝中, 一旦发现未经授权的拷贝, 就
可以根据此拷贝所恢复出的指纹来确定它的来源.
图 1 水印嵌入的一般过程基本框架
图 2 水印检测的一般过程基本框架
由图 1 可以定义水印嵌入过程的通用公式:
IW = E ( I, W, K )
其中, IW 表示嵌入水印后的数字音频, I 表示原始数
字音频, W 表示水印集合, K 表示密钥集合. 这里密
钥 K 是可选项, 一般用于水印信号的再生.
AC- 3 等新一代压缩标准的广泛应用, 对数字音频 作品( 例如音乐作品等) 的知识产权保护显得越来越 重要.
为了推动数字音频水印技术研究领域的发展, 本文通过系统整理分析相关研究文献, 对数字音频 水印技术的相关概念、研究现状、未来研究方向进行 了综述.
2 数字音频水印技术简介
2. 1 典型数字音频水印系统模型 一般说来, 完整的数字音频水印系统包括三个
觉系统的时域掩蔽特性, 即高能量信号前后短时间 发生的少量畸变难以被察觉, 且超前掩蔽区( Pre-
masking) 持续时间较短( 大约 5~ 20 ms) , 而滞后掩蔽
区( Post- masking) 持续时间较长( 大约 50~ 200 ms) ,
参见图 3.
图 3 时域掩蔽区示意图 原始数字音频和经过回声隐藏的含水印数字音频对 于人耳来说, 前者就像是从耳机里听到的声音, 没有 回声. 而后者就像是从扬声器里听到的声音, 包含有 所处空间诸如墙壁、家具等物体产生的回声. 因此, 回声隐藏与其他数字音频水印方法不同, 它不是将 水印信息当作随机噪声嵌入到原始数字音频, 而是 作为原始数字音频的环境条件.
扩频( Spread Spectrum) 技术是一种信息 处理技 术, 它是利用与待传输数据( 信息) 无关的扩频码对 被传输信号进行频谱扩展, 使之远远超过被传输信 息所必需的带宽, 在接收端采用相同的解扩和恢复 数据. 通常, 扩频系统具有以下特点: ¥ 扩频信号是 不可预测的伪随机宽带信号, 扩频系统具有很高的 抗干扰能力; ¦ 扩频信号的功率相当均匀地被分 布在很宽的频率范围, 以至被传输信号功率密度很 低; § 扩频系统具有良好的码分多址通信能力, 对 不同的用户使用不同的码, 别人无法窃听. 这些特点 对于数字水印技术特别有用.
1前言
伴随着网络技术( 特别是 Internet 技术) 与多媒 体技术的飞速发展, 数字信息的传输与利用日益变 得频繁与广泛. 鉴于数字信息极易被无限制任意编 辑、复制与散布, 从而导致数字媒体作品的原创者蒙 受巨大经济损失, 数字作品的知识产权保护已经成 为一个迫切需要解决的关键问题. 而传统加密技术 只能提供小范围保护, 且具有安全性不足和流通性 较差等弱点. 数字水印( Digital Watermarking) 作为一 种潜在的解决方案受到了广泛关注, 并成为国际学 术界研究的一个热点[ 1] . 所谓数字水印技术, 就是将 一种特殊标志信息( 伪随机序列或可识别图案文字) 嵌入到数字媒体中, 用以辨识数据的版权、合法使用 者, 从而认证或控制数据的使用. 数字水印的分类方 法多种多样. 依据应用范围, 通常可以把数字水印技 术划分为图像水印技术、视频水印技术和音频水印 技术.
检验的通用公式为:
O
Sim = W* W 或Sim = W* W
O
W* W
O
O
W* W W* W
O
其中, W表示估计水印, W 表示原始水印, Sim 表示
不同信号的相似度.
2. 2 数字音频水印系统的设计要求
通常, 设计数字音频水印系统需要满足以下几
个方面要求:
¥ 可证明性 水印应该能为受到版权保护的