[發明專利]基于遞歸神經網絡和概率上下文無關文法的密碼生成系統在審
| 申請號: | 201711170046.8 | 申請日: | 2017-11-22 |
| 公開(公告)號: | CN107947921A | 公開(公告)日: | 2018-04-20 |
| 發明(設計)人: | 易平;夏之陽;劉韞彧 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | H04L9/08 | 分類號: | H04L9/08 |
| 代理公司: | 上海交達專利事務所31201 | 代理人: | 王毓理,王錫麟 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遞歸 神經網絡 概率 上下文 無關 文法 密碼 生成 系統 | ||
技術領域
本發明涉及的是一種信息安全領域的技術,具體是一種基于遞歸神經網絡和概率上下文無關文法的密碼生成系統。
背景技術
密碼已經成為了目前最常用的驗證手段。除了常用的字段,每個用戶在設置密碼時總是會以某一種形式來組合密碼。使用字典暴力破解通常不可實現,這就使得密碼猜測成為新的研究方向。目前成熟的技術,HashCat和John the Riper是國外開源軟件,其密碼生成器只能對原密碼進行字符大小寫修改等方式的擴展;馬爾科夫模型和概率上下文無關文法,是基于統計概率,運算量非常大,耗時長。遞歸神經網絡是在深度學習技術中被廣泛采用的網絡類型,可以在高緯度提取概率方法無法提取的信息,同時訓練速度和存儲空間消耗較概率方法有很大提升。
發明內容
本發明針對現有技術無法發現密碼中潛在的前后關聯性的不足,提出一種基于遞歸神經網絡和概率上下文無關文法的密碼生成系統,使用概率上下文無關文法的規則來預處理密碼,將數字串、字母串、特殊字符串轉變成標簽的格式,對標簽進行概率統計,并使用標簽進行神經網絡的訓練,使得常用字符串的出現概率更高。運用對抗網絡生成密碼,能夠消除各個訓練數據集中自帶的特征,總而保證生成的密碼字典,是一個通用的、依據人類真實的設密碼習慣的、不帶有某個數據集特征的密碼字典,該字典能夠對一個未知的密碼庫具有較高的命中率。
本發明是通過以下技術方案實現的:
本發明包括:帶有密碼數據庫的預處理模塊、訓練模塊以及生成模塊,其中:預處理模塊根據密碼數據庫中的概率上下文無關文法的規則,將待處理字符串轉變成標簽的格式,并對每個標簽進行概率統計,得到每個標簽對應字符串的概率排序作為訓練模塊的樣本,由多個生成器組成的訓練模塊通過多層遞歸神經網絡對樣本進行特征提取以及訓練,得到神經網絡模型,生成模塊基于神經網絡模型生成標簽,并基于權重選擇規則將標簽替換回密碼,并經文本分類處理,區分其是否屬于密碼數據庫的概率并最終得到密碼。
所述的訓練模塊包括:遞歸神經網絡單元、參數調整單元和數據庫單元,其中:遞歸神經網絡單元與預處理模塊相連并接收訓練用的標簽串,參數調整單元與遞歸神經網絡單元相連并傳輸調整后的神經網絡參數。
所述的生成模塊包括:權重選擇單元、用于文本分類的深度卷積神經網絡單元、參數調整單元和辨別器單元,其中:權重選擇單元與訓練模塊中的遞歸神經網絡單元相連,并從下一個標簽的候選項中,根據其權值隨機選擇出一個輸出至深度卷積神經網絡單元;深度卷積神經網絡單元與權重選擇單元相連,對權重選擇單元選中的標簽進行文本分類;參數調整單元與深度卷積神經網絡單元相連并傳輸調整后的神經網絡參數;辨別器單元與深度卷積神經網絡單元相連并接收文本分類結果后進行判斷和輸出。
所述的文本分類,確保輸出密碼不屬于某個特定的數據集,即不具備某個特定數據集的特征,從而保證密碼的通用性。
技術效果
與現有技術相比,本發明能夠綜合綜合多個數據集的特征,從而生成一個更具有普遍特征的密碼字典。生成的字典字典從樣本空間上,遠高于HashCat和John the Riper通過修改字符大小寫、增加或刪除個別字符等方式生成的密碼字典。從樣本生成效率上,相比于馬爾科夫模型和概率上下文無關文法,本發明可以節約大量存儲空間。
附圖說明
圖1遞歸神經網絡單元示意圖
圖2為深度卷積神經網絡單元示意圖
圖3為本發明生成模塊示意圖
圖4為本發明系統示意圖;
圖5為實施例權重選擇示意圖;
圖6為實施例判別過程示意圖;
圖7和圖8為實施例效果示意圖。
具體實施方式
如圖4所示,本實施例包括:依次連接的預處理模塊、訓練模塊以及生成模塊。
所述的預處理模塊中包含兩個密碼數據庫,根據概率上下文無關文法的規則,將包含數字串、字母串、特殊字符串的待處理字符串轉變成標簽的格式,將密碼從字符串格式轉變成標簽串格式,同時對每個標簽進行概率統計,得到每個標簽對應字符串的概率排序。
所述的生成模塊首先運用訓練模塊中神經網絡模型來生成標簽,生成的標簽根據權重選擇規則被替換回密碼,而后生成的密碼通過文本分類,區分其輸出的密碼是否屬于預處理模塊中兩個密碼數據庫的概率,當兩個概率的標準差過大(如本實施例中將此閾值定位0.2),則不輸出密碼,否則輸出密碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711170046.8/2.html,轉載請聲明來源鉆瓜專利網。





