基于内容的英文文本数字水印算法设计与实现

作者:肖湘蓉;孙星明 刊名:计算机工程 上传者:吕学武

【摘要】基于英文字母的文字特征,提出一种用希腊字母替换以嵌入水印的新方法,并将水印编码与差错控制码绑定,实现了对英文文本水印的盲提取、检测和恢复操作,突破了现有水印方法中水印信息无法嵌入文本内容之中的难题。攻击实验数据证明水印的容量得到扩充,鲁棒性有所提高。

全文阅读

近年来,随着计算机技术的迅猛发展、信息化建设的加快,人们广泛使用数字设备制作、处理、传输和存储各种信息(如图像、语音、文本、视频等内容),与此同时产生了数字信息传输的安全性控制和数字作品的版权保护等问题。数字水印技术就是在这种背景下发展起来的一个新的研究领域,是利用人类感觉器官的不敏感及多媒体数据中存在的冗余,将秘密信息隐藏到宿主信息中。嵌入到数字载体中的数字水印是不可消除的,且水印的添加不会影响原数据的数字水印可分为图像水印、视频水印、音频水印、文本内容和使用[1],以起到版权保护、鉴别数据真伪等作用。1水印研究动态水印[2,3]等,目前的研究主要集中在图像和视频方向,对文本水印的研究很少。这主要是由于文本的特殊性,最原始的文件(ASCII文本文件和计算机源码文件)是不能被插入水印的,因为这类文档中不存在允许插入标记的可辨认空间[4]。在网络应用迅速发展的今天,文本水印的实现更具现实意义,与多媒体载体相比,文本中的冗余信息空间很少,嵌入方式也有很大不同。对于格式化的文本(如PDF、PS、DOC等)主要是微调字符格式特征[58],非格式化文本是在行末添加空格[9]、或不可见编码[10]来加载额外的信息,这些方法添加的水印信息极易被察觉,使得对文本添加水印较困难,研究相对落后。目前,文本水印的研究主要存在如下问题:(1)格式化文本加载的水印抗攻击性不强、鲁棒性较差、隐蔽性不够;(2)非格式化文本添加的不可见编码较易察觉和去除,加载难度大;(3)信息传输后的安全性验证。通过研究发现导致这些不足的主要原因:水印信息是添加在文本内容之外的。针对现有的文本水印方法无法嵌入文本内容之中,嵌入容量不足、抗攻击性不强、稳健性较差的缺点,提出一种基于内容的英文文本数字水印的新方法,并进行了嵌入、提取和攻击后检测及恢复实验。2英文文本水印算法2.1算法的基本思想文本的内容就是所包含的字符,这些字符编码有国际、国家或地区标准,若改变编码其对应的文字将会随之产生变化。因此,基于英文字母的文字特征,通过对特殊符号的分析,发现利用与英文近似的希腊字母及标点替换英文文本中的相关字母,可使字符编码改变而文本内容不变,从而嵌入水印编码。从外观的近似度上进行筛选,可用作替换的希腊字母有:“”,标点符号有:“'%()[]<>”。2.2基本概念和规则2.2.1嵌入和提取规则1嵌入:令水印码序列W=w1w2…wn,对待嵌文本中的字符逐一扫描,遇到选取字符时进行处理替换wi=1不替换wi=0规则2提取:令提取序列V=v1v2…vr,对含水印文本作顺序扫描,遇到指定字符译码vi=1字符被替换vi=0字符未替换2.2.2差错控制为控制水印的安全性,借用了数字通信中的差错控制理论[11],将水印和差错控制码绑定,在进行校验的同时可纠错,实现了对水印的篡改检测和恢复,安全性能明显提高。规则3添加奇偶校验码:令水印码C=c1c2,…,cn,当imod7=0时(每7个数据位)添加一位校验位dk,生成新序列C=c1c2…c7d1c8…c14d2c15…cndk。dk=1c7*k+1c7*k+2…c7*k+7中含奇数个1dk=0c7*k+1c7*k+2…c7*k+7中含偶数个1规则4重复编码:对序列C作码数(重复次数)为m的编码,生成新序列C。C=c1…c1c2…c2…c7…c7d1…d1c8…c8…c14…c14d2…d2c15…c15…cn…cndk…dk规则5水印完整性检查:通过检查序列E=e1e2…er中的校验码实现。(1)重复码:每m位对序列E作一次判断水印完整ei*m+1…ei*m+m为全1(

参考文献

引证文献

问答

我要提问