[發(fā)明專利]一種抗統(tǒng)計(jì)分析的文本信息隱藏方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310206648.X | 申請(qǐng)日: | 2013-05-29 |
| 公開(公告)號(hào): | CN103294959A | 公開(公告)日: | 2013-09-11 |
| 發(fā)明(設(shè)計(jì))人: | 付章杰;孫星明 | 申請(qǐng)(專利權(quán))人: | 南京信息工程大學(xué) |
| 主分類號(hào): | G06F21/60 | 分類號(hào): | G06F21/60 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 朱小兵 |
| 地址: | 210019 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 統(tǒng)計(jì)分析 文本 信息 隱藏 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于信息安全技術(shù)領(lǐng)域,具體指的是一種抗統(tǒng)計(jì)分析的文本信息隱藏方法。
背景技術(shù)
20世紀(jì)90年代以來,信息隱藏技術(shù)成為信息安全領(lǐng)域的一大重要研究熱點(diǎn),它通過將秘密信息以不可感知的方式嵌入在圖像、音頻、視頻、文本等數(shù)字媒體中,以達(dá)到秘密信息的隱蔽安全可靠存儲(chǔ)和傳輸?shù)哪康?,保障國防、軍事、政府、商業(yè)等的機(jī)密信息的安全。文本是互聯(lián)網(wǎng)上、工作生活中使用最頻繁和廣泛的數(shù)據(jù)載體,因此以文本內(nèi)容為載體的信息隱藏技術(shù)具有其不可取代的實(shí)用價(jià)值。
國內(nèi)外利用文本內(nèi)容作為隱蔽載體進(jìn)行信息隱藏的研究主要集中在自然語言文本信息隱藏技術(shù)上,主要有生成法和修改法兩大類。
生成法是根據(jù)自然語言處理技術(shù)方面的理論知識(shí),自動(dòng)生成符合一定自然語言統(tǒng)計(jì)特性的仿自然語言文本來隱藏信息。如隱寫工具Nicetext,其將二進(jìn)制數(shù)據(jù)轉(zhuǎn)換為根據(jù)某個(gè)載體文本抽取出來的一些句法模板或者基于上下文無關(guān)語法的英文句子;TEXTO,其將uuencode文件或者PGP信息轉(zhuǎn)換為類似詩一樣的英文句子;MIMIC-PPT方法,其利用從POWERPOINT格式文件中抽取的句法模版庫和單詞列表,將秘密信息轉(zhuǎn)換成合乎語法且與正文內(nèi)容相關(guān)的自然語言句子并寫入該文檔的備注中等。盡管這些方法生成的隱寫文本能夠符合自然語言的某些特性如句法結(jié)構(gòu),詞頻分布甚至局部語義,但是句子內(nèi)部或句子之間的意義關(guān)聯(lián)比較弱。因此通過句間相關(guān)度、文本剩余度、詞間互信息等統(tǒng)計(jì)特征的分析可成功識(shí)別出這類隱寫文本。
另外,Grothoff等利用機(jī)器翻譯生成的譯文作為載體進(jìn)行信息隱藏,提高了隱寫文本的質(zhì)量并很好地保持了文本的統(tǒng)計(jì)特性,增強(qiáng)了抗統(tǒng)計(jì)分析的能力。但由于隱寫過程中需要多個(gè)不同翻譯器的參與,會(huì)導(dǎo)致隱寫文本對(duì)每種可能翻譯器的傾向度都很小,而正常翻譯文本則會(huì)只傾向于某一臺(tái)翻譯器;其次會(huì)導(dǎo)致隱寫文本中高頻詞的比例會(huì)比正常文本中少,通過這些線索,現(xiàn)有的文本隱寫分析技術(shù)已能檢測到這類隱寫文本中秘密信息的存在性。
自然語言文本信息隱藏的修改法則對(duì)文本內(nèi)容進(jìn)行盡可能保持語法、句法、語義不變的修改操作來隱藏信息。這些修改操作主要有句法變換和同義詞替換。
基于句法變換的信息隱藏方法如:美國的學(xué)者Atallah等首次提出了在經(jīng)過句法分析得到句法分析樹的基礎(chǔ)上,利用附加語移動(dòng)、主動(dòng)與被動(dòng)語態(tài)變換等英語句法變換對(duì)句法樹進(jìn)行修改以嵌入水印信息。土耳其的H.M.Meral等針對(duì)土耳其語的特點(diǎn),提出了21種適合于土耳其語的句法變換方法,并利用Wordnet和詞典的輔助減少嵌入操作引起的語義失真。盡管這類基于句法變換的隱寫方法魯棒性較強(qiáng),但只適用于少量秘密信息的嵌入,同時(shí)通常不僅需要成熟句法分析工具的支持且對(duì)復(fù)雜句子自動(dòng)進(jìn)行正確的句法變換難度較大,導(dǎo)致實(shí)用性較差。
另一種最簡單且易于實(shí)現(xiàn)的自然語言文本信息隱藏方法是基于同義詞的替換,如:墨西哥的學(xué)者Bolshakov利用WordNet和Internet的資源,以及詞的搭配信息來控制同義詞替換操作進(jìn)行信息嵌入;U.Topkara等通過選擇與搭配詞語義最相容的的同義詞來進(jìn)行替換。盡管該方法具有很強(qiáng)的實(shí)用性和較好的抗統(tǒng)計(jì)分析能力,但隨著文本隱寫分析技術(shù)的發(fā)展,該類信息隱藏方法已被成功攻擊。如:基于同義詞結(jié)對(duì)值特征的檢測方法檢測同義詞中是否包含秘密信息的成功率達(dá)到86.2,而另一種方法利用上下文的相關(guān)信息來度量同義詞的合適程度,并使用IDF(逆文本頻率)指數(shù)來加權(quán)同義詞的合適度,該方法其檢測成功率達(dá)到了90.0%。
盡管自然語言文本信息隱藏方法可以有效地抵抗OCR攻擊和重新排版等攻擊,且已引起了國內(nèi)外很多研究機(jī)構(gòu)的注意并取得了許多重要的研究成果,但研究重點(diǎn)集中在考慮提高算法的容量,盡量避免語言學(xué)上的錯(cuò)誤及失真如語言歧義、上下文不搭配、詞形變換錯(cuò)誤等。隨著文本隱寫分析技術(shù)的發(fā)展,研究出了多類文本中被隱寫操作改變的統(tǒng)計(jì)特征,成功地檢測到自然語言文本信息隱藏方法所隱藏的信息的存在性,從而導(dǎo)致隱蔽信道的不安全。因此,為了抵抗文本隱寫分析的攻擊,進(jìn)行安全的秘密信息隱蔽安全傳輸,需要研究安全性更高的抗統(tǒng)計(jì)分析的文本隱藏方法。
在保證好的隱蔽性和大隱藏容量的前提下,使隱寫文本具有與正常文本近似的統(tǒng)計(jì)特性,抵抗統(tǒng)計(jì)分析攻擊,可以選擇特定的文本內(nèi)容進(jìn)行信息隱藏。多項(xiàng)選擇題是各類教育考試、認(rèn)證考試及能力測試等考試中最流行且頻繁使用的一種題型。隨著網(wǎng)絡(luò)和多媒體的廣泛使用,網(wǎng)絡(luò)上存在大量來自于考試真題、模擬題、練習(xí)題等的選擇題題庫。因此利用選擇題題目來傳輸秘密信息并不會(huì)引起攻擊者的特別注意。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京信息工程大學(xué),未經(jīng)南京信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310206648.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程
- 網(wǎng)管數(shù)據(jù)統(tǒng)計(jì)分析指標(biāo)的處理方法和裝置、數(shù)據(jù)管理系統(tǒng)
- 一種數(shù)據(jù)統(tǒng)計(jì)方法及裝置
- 一種用APP形式提供服務(wù)的方法和系統(tǒng)
- 一種海量日志統(tǒng)計(jì)分析系統(tǒng)和方法
- 數(shù)據(jù)統(tǒng)計(jì)分析方法和裝置
- 一種分布式光伏電源的統(tǒng)計(jì)分析方法
- 流量分析方法及裝置
- 基于自然語言處理的自助式查詢統(tǒng)計(jì)分析方法
- 一種具有統(tǒng)計(jì)分析功能的醫(yī)療數(shù)據(jù)庫
- 一種用于稱重傳感器智能制造的數(shù)據(jù)采集系統(tǒng)及其裝置
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





