[發明專利]一種參數化混合模型的口令猜測方法有效
| 申請號: | 202110026552.X | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112861113B | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 韓偉力;張俊杰;徐銘 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F21/45 | 分類號: | G06F21/45 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 參數 混合 模型 口令 猜測 方法 | ||
1. 一種參數化混合模型的口令猜測方法,其特征在于,具體步驟如下:
步驟一、利用訓練集生成優化的PCFG和Markov口令猜測模型
利用輸入的訓練集全集對優化的PCFG模型進行訓練,并過濾得到的口令結構;利用輸入的訓練集中一類字符構成的口令對Markov模型進行訓練;
步驟二、根據最優的參數化策略,分配口令猜測數
根據輸入的總猜測數以及訓練集中的一類字符構成的口令所占的比例,計算得到Markov模型的分配猜測數,并將剩下的分配猜測數作為優化的PCFG模型的分配猜測數;
步驟三、根據分配的猜測數生成備選口令集
利用訓練好的優化PCFG和Markov口令猜測模型,以及為兩者分配的猜測數,分別生成兩類及以上字符構成的備選口令集和一類字符構成的備選口令集,最終兩者合并得到輸入的總猜測數規模的備選口令集。
2.根據權利要求1所述的參數化混合模型的口令猜測方法,其特征在于,所述優化的PCFG為綜合PCFGv4.1和語義PCFG的方法,綜合的是兩者針對口令中的連續英文字母片段的分詞處理,具體分為以下步驟:
(1)對連續的英文字母片段使用PCFGv4.1進行分詞,得到分詞后的一段或多段英文字母片段;對同樣的連續的英文字母片段也使用語義PCFG進行分詞,得到分詞后的一段或多段英文字母片段;
(2)針對上述結果進行權衡以選擇更優的分詞結果:
如果PCFGv4.1分詞結果僅有一段,而語義PCFG分詞結果有多段,選擇分出的單詞在訓練集中出現的平均頻度更高的分詞結果;
如果PCFGv4.1分詞結果有多段,而語義PCFG分詞結果僅有一段,檢查原英文字母片段是否在英文常用詞字典中,如果在,使用語義PCFG的分詞結果,反之使用PCFGv4.1的分詞結果;
如果PCFGv4.1分詞結果有多段,而語義PCFG分詞結果也有多段,但兩者的內容不一樣,選擇分出的單詞在訓練集中出現的平均頻度更高的分詞結果。
3. 根據權利要求1所述的參數化混合模型的口令猜測方法,其特征在于,所使用的Markov為4-gram Markov,即使用字符串中前3個出現的字符來預測下一個出現字符概率的Markov模型。
4.根據權利要求1所述的參數化混合模型的口令猜測方法,其特征在于,步驟一中所述訓練優化的PCFG模型時的結構過濾操作,具體為:
由于優化的PCFG模型在表示結構時沿用PCFGv4.1使用的6種字符:“A”、“D”、“O”、“Y”、“K”和“X”;其中“A”表示英文字母,“D”表示數字,“O”表示特殊符號;“Y”表示年份模式,由純數字構成;“K”表示鍵盤模式,由兩類及以上字符構成;“X”表示上下文模式,也由兩類及以上字符構成;
需要過濾的是由一類字符構成的口令訓練得到的結構,此結構所表示的字符種類只有一種;結合表示結構的6種字符的含義,需要過濾的結構是:
由“A”構成的結構、由“D”構成的結構、由“O”構成的結構、由“Y”構成的結構以及由“D”和“Y”構成的結構。
5.根據權利要求1所述的參數化混合模型的口令猜測方法,其特征在于,步驟二中所述分配猜測數的最優參數化策略,具體分為如下步驟:
(1)統計訓練集中一類字符即不區分大小寫的英文字母、數字或者特殊符號構成的口令的數量以及訓練集中兩類及以上字符構成的口令的總數,用一類口令的數量除以兩類及以上字符構成的口令的數量得到比值;
(2)將比值開1.2次方的結果記為,用的值乘以總猜測數,得到4-gram Markov的分配猜測數;用總猜測數減去4-gram Markov的分配猜測數,得到優化的PCFG模型的分配猜測數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110026552.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:陶瓷線路板及其制作方法
- 下一篇:一種低成本測試模擬數字轉換器線性度的方法





