[發明專利]一種多類自然語言隱寫分析方法在審
| 申請號: | 202210264113.7 | 申請日: | 2022-03-17 |
| 公開(公告)號: | CN114462382A | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 向凌云;劉宇航;游卉擎;章登勇 | 申請(專利權)人: | 長沙理工大學 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06N3/04;G06N3/08 |
| 代理公司: | 北京迎碩知識產權代理事務所(普通合伙) 11512 | 代理人: | 錢揚保;張群峰 |
| 地址: | 410114 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自然語言 分析 方法 | ||
本發明公開了一種多類自然語言隱寫分析方法,包括以下步驟:步驟1.將隱寫分析任務數據集表示為詞向量矩陣;步驟2.文本的深度多任務隱寫分析特征表示獲取;步驟3.多任務隱寫分析模型的訓練;步驟4.使用最優多任務隱寫分析模型對測試集文本進行隱寫分析;其中,步驟1包括:1.1定義多個隱寫分析任務,分別為:(1)生成式隱寫文本與正常文本隱寫分析任務;(2)生成式隱寫文本與自然文本隱寫分析任務;(3)嵌入式隱寫文本與正常文本隱寫分析任務;(4)嵌入式隱寫文本與自然文本隱寫分析任務;(5)正常文本和自然文本分類任務;1.2將每個隱寫分析任務的數據集中的文本通過詞向量矩陣進行表示。
技術領域
本發明涉及加密技術領域,尤其涉及一種多類自然語言隱寫分析方法。
背景技術
自然語言信息隱藏技術是一種將秘密信息嵌入到自然語言載體(文本)中,使其不被除發送方和接收方外的第三方察覺,以達到隱藏秘密信息目的的信息安全技術。然而事物都有兩面性,自然語言信息隱藏技術在提供信息安全保障的同時,也不可避免的成為了犯罪分子的犯罪工具。正因為如此,自然語言隱寫分析技術這一自然語言信息隱藏技術的對抗技術得到了人們的重視。自然語言隱寫分析技術通過對自然語言文本進行分析,判斷自然語言文本中是否存在隱藏信息。
目前自然語言信息隱藏技術主流的方向有兩類,一類為嵌入式隱寫術,一類為生成式隱寫術。其中嵌入式隱寫術是通過對已有正常文本進行句法、詞匯、語義等方面的修改,在保證文本局部以及全局語義和統計等特性不變、語義正確、句法結構合理的情況下實現隱藏信息的嵌入。而生成式隱寫方法,則是隨著深度學習在自然語言處理領域的飛速發展,借助神經網絡強大的特征學習能力,能夠生成高質量的可讀文本,而生成式隱寫就是在文本生成過程中通過編碼嵌入隱藏信息。但是,針對自然語言隱寫文本的檢測研究,即自然語言隱寫分析的研究,主要都是針對型的方法(即單獨針對正常文本和相對應某一類隱寫文本進行隱寫分析),都是對正常文本和相對應的某一類隱寫文本的分類。
在實際的場景中,應該是大量自然文本、正常文本(由生成式隱寫術生成的未嵌入秘密信息的文本)、生成式隱寫文本和嵌入式隱寫文本共存在一起。針對型的方法,泛化能力差,無法推廣到其他類隱寫文本的分類。
為此,本發明提供了一種多類自然語言隱寫分析方法,能夠同時對多類隱寫文本進行隱寫分析,提高了模型性能,同時還提高了隱寫分析模型的泛化能力。
發明內容
為實現本發明之目的,采用以下技術方案予以實現:
一種多類自然語言隱寫分析方法,包括以下步驟:步驟1.將隱寫分析任務數據集表示為詞向量矩陣;步驟2.文本的深度多任務隱寫分析特征表示獲取;步驟3.多任務隱寫分析模型的訓練;步驟4.使用最優多任務隱寫分析模型對測試集文本進行隱寫分析;其中,步驟1包括:1.1定義多個隱寫分析任務,分別為:(1)生成式隱寫文本與正常文本隱寫分析任務;(2)生成式隱寫文本與自然文本隱寫分析任務;(3)嵌入式隱寫文本與正常文本隱寫分析任務;(4)嵌入式隱寫文本與自然文本隱寫分析任務;(5)正常文本和自然文本分類任務;1.2將每個隱寫分析任務的數據集中的文本通過詞向量矩陣進行表示。
所述的多類自然語言隱寫分析方法,其中步驟1.2包括:獲取每個隱寫分析任務數據集,將數據集分為訓練集和測試集,數據集包括大量已經進行了分類的文本,所述文本為句子;對數據集中的文本進行分詞和預處理,得到數據集的文本的詞向量矩陣,如下:
其中Dk表示任務k中包含Nk個文本的數據集,和分別表示任務k中的一個文本表示向量矩陣和對應的分類標簽,V表示文本中某個單詞的詞向量,l表示文本長度,d表示向量的維度;k取1-5之間的自然數。
所述的多類自然語言隱寫分析方法,其中步驟2包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長沙理工大學,未經長沙理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210264113.7/2.html,轉載請聲明來源鉆瓜專利網。





