[發(fā)明專利]基于修改標識符的OOX文本文檔隱私信息檢測方法有效
| 申請?zhí)枺?/td> | 201510340530.5 | 申請日: | 2015-06-18 |
| 公開(公告)號: | CN105046159B | 公開(公告)日: | 2018-04-03 |
| 發(fā)明(設計)人: | 吳檳;何曉磊;趙險峰;劉磊 | 申請(專利權)人: | 中國科學院信息工程研究所 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F17/30 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙)11200 | 代理人: | 余長江 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 修改 標識符 oox 文本 文檔 隱私 信息 檢測 方法 | ||
技術領域
本發(fā)明屬于信息隱藏技術領域,針對基于修改標識符的OOX文本文檔信息隱藏方法提出了一種針對性的新的檢測方法。
背景技術
在網(wǎng)絡飛速發(fā)展的今天,信息隱藏技術已經廣泛應用于多個領域,用于隱藏個人或企業(yè)的隱私信息。在信息隱藏技術中,有多種有效的基于文本的隱寫方法可以取得較好的隱蔽效果,例如利用字體格式、字體顏色、同義詞替換及不可見字符等方法來進行信息隱藏。其中,有一種隱藏方式主要基于OOX(Office Open XML)文本文檔中的“修改標識符”進行隱私信息的攜帶。OOX文檔格式是由微軟公司為Office 2007產品開發(fā)的技術規(guī)范,現(xiàn)已成為國際文檔格式標準,兼容前國際標準ODF(Open Document Format)和中國文檔標準UOF(Unified Office document Format),于2006年12月成為ECMA標準。在OOX文本文檔格式中包括了一組特殊的元素屬性,這些屬性幾乎分布在整個OOX文本文檔中,這就是“修改標識符”:每一次OOX文本文檔被打開編輯時,都會產生一個獨一無二的標識符ID號,用戶所作的任何一次修改都會用一個標識符ID號進行標識,修改不僅包括內容,而且還包括文檔的格式;這個ID號在文檔保存之后以“修改標識”屬性值的形式儲存在OOX文本文檔中,而且這個ID號是完全隨機產生的,與用戶及修改時間沒有任何關系。
這些“修改標識”保存在document.xml文件中,數(shù)量較多,而且經過實驗發(fā)現(xiàn),替換這些“修改標識”屬性值并不會影響OOX文本文檔的正常顯示和使用,所以可以將待隱蔽的隱私信息(或加密后的隱私信息)轉換為16進制字符串,然后依次替換這些“修改標識”的屬性值即可達到隱藏信息的目的。
發(fā)明內容
為了防止利用基于修改標識符的OOX文本文檔隱寫方法來進行信息隱藏和隱蔽通信,導致一些重要的信息通過這種方式泄露出去,本發(fā)明提出了一種針對基于修改標識符的OOX文本文檔隱私信息檢測方法。
為了達到檢測目的,本發(fā)明采用了如下所述的技術方案:
一種基于修改標識符的OOX文本文檔隱私信息檢測方法,其步驟包括:
1)將待檢測的OOX文本文檔進行解壓,形成層次化文件結構,該層次化文件結構中包含document.xml和settings.xml文件;
2)提取解壓得到的document.xml和settings.xml文件中的修改標識符,并將提取的該兩個文件的修改標識符分別保存到兩個容器中;
3)對比兩個容器中修改標識符的異同,進而統(tǒng)計出其中通過隱寫工具嵌入的隱私信息的數(shù)量。
步驟1)主要利用zlib中的Unzip進行解壓,此外也可以采用其它解壓工具或解壓縮開發(fā)包代替Unzip。經過研究發(fā)現(xiàn),在OOX文本文檔解壓之后的文件結構中,只有document.xml和settings.xml文件中包含有修改標識符,因此本發(fā)明主要利用document.xml和settings.xml文件實現(xiàn)隱私信息的檢測。
步驟2)分別將提取到的修改標識符保存到兩個容器中,如Vector向量,此外也可以采用其它模版、結構體或類的容器形式代替Vector向量。優(yōu)選地,將修改標識符插入到容器中時需要進行去重和排序操作,排序的作用主要是為了后續(xù)統(tǒng)計文檔所攜帶的隱私信息量時節(jié)省時間。
步驟3)中,如果文檔中不含有隱私信息,即document.xml中的修改標識沒有被修改,那么settings.xml文件中的修改標識一定包含了document.xml文件中所有修改標識符;如果文檔中含有隱私信息,則基于修改標識符的隱寫工具一定修改了document.xml文件中的某一部分修改標識,這樣就導致settings.xml中的修改標識無法全部包含document.xml文件中的修改標識。本發(fā)明通過對比document.xml的修改標識和settings.xml的修改標識,進而統(tǒng)計出隱私信息隱藏的數(shù)量。
與現(xiàn)有技術相比,本發(fā)明的有益效果如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所,未經中國科學院信息工程研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510340530.5/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





