[發明專利]一種基于綜合分段的用戶口令建模與強度評估方法有效
| 申請號: | 202110019967.4 | 申請日: | 2021-01-07 |
| 公開(公告)號: | CN112632526B | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 韓偉力;王傳旺;徐銘;張俊杰 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F21/46 | 分類號: | G06F21/46;G06F16/31;G06F40/216;G06F40/242 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 綜合 分段 用戶 口令 建模 強度 評估 方法 | ||
1.一種基于綜合分段的口令建模與強度評估方法,其特征在于,包括細化口令中的段的具體類別,依據對數據集中段的識別結果,采用窮舉算法選取單條用戶口令所符合的所有口令結構并賦予概率值,所有概率值中的最大值越高,表明用戶口令的強度越低;其中,用戶口令中段的類別包含如下5種:
(1)鍵盤模式,即在鍵盤設備上按鍵相鄰的字符串、組成平行線、垂直線的字符串;
(2)網絡語,即形似字符替換與音似字符替換,使用兩類或以上字符,長度至少為4;
(3)簡寫,即由多類字符組成的縮寫或常用表示,長度至多為4;
(4)基本詞,即由連續同類字符組成的字符串;
(5)混合詞,即從口令的最大概率的拓撲排序序列中提取出的基本詞,亦稱混合詞;
其中鍵盤模式、網絡語、簡寫、基本詞通過識別連續段獲取,混合詞通過識別不連續段獲取;
口令建模與強度評估方法的具體步驟如下:
步驟一、識別用戶口令中的連續段
對用戶口令集中的每一條口令,將該口令拆分成多個子字符串,每個子字符串作為該口令的一段,都是不可再次拆分的;
其中,用戶口令輸入格式如下:
(1)每一行表示一條用戶口令;
(2)對于每一條用戶口令,只包含大小寫字母、數字、特殊符號,可打印ASCII字符和空白字符除外;
步驟二、識別用戶口令中的不連續段
將一條只包含基本詞的用戶口令看作有向無環圖,根據數據集中用戶口令結構,窮舉該圖的拓撲排序序列,并為各序列賦予概率值,數據集口令結構中不存在的拓撲排序序列設置其概率為0;選取所有序列中概率最大的一種,根據最大概率拓撲排序序列識別基本詞,識別出的基本詞即是混合詞;
步驟三、評估用戶口令強度
對于單條用戶口令,根據步驟二得到的口令結構分布與段實例分布,得到多種口令結構;使用字典樹用于數據集口令結構的存儲與查詢,窮舉該用戶口令的口令結構并計算相應的概率值,選擇最大概率值用于口令強度評估;
對于用戶口令的建模與強度評估,作如下設定:
(1)用戶口令的建模與強度評估與口令復用有直接關系,口令復用現象越普遍,用戶口令建模越準確、口令強度越低;
(2)單條用戶口令可能符合多種口令結構,對應多種概率;用戶口令的強度與最大概率有直接關系,最大概率越高,口令強度越低;
(3)可以使用蒙特卡羅方法將口令概率值轉換為口令強度值,即破解該口令需要枚舉的口令個數;
步驟一中,所述用戶口令中連續段的識別,具體過程如下:
(1)對用戶口令數據集中的每一條口令,按最長匹配識別并標記口令中的鍵盤模式,鍵盤模式分為:連續,即相鄰字符在鍵盤上的按鍵相鄰,平行,即字符映射到鍵盤上的按鍵后呈平行線,垂直,即字符映射到鍵盤上的按鍵后垂直且連續;
(2)統計用戶口令數據集中字母字符串的頻次;
(3)用戶口令數據集中每一條長度大于4的口令通過去網絡語化;若復原得到的字母字符串的頻次至少為5,則識別該口令為網絡語;使用字典樹存儲所有網絡語;對標記鍵盤模式后的每一條口令,使用字典樹和最長匹配識別并標記網絡語;
(4)對標記鍵盤模式和網絡語后的每一條口令,使用最長匹配識別并標記簡寫;簡寫是預定義的,包含如下內容:“:p”,“*0*”,“#1”,“No.1”,“No.”,“i3”,“3”,“Mr.”,“Ms.”,“Mz.”,“St.”,“Dr.”;
(5)統計字母字符串、數字字符串、特殊符號字符串的概率分布;對每一條口令中未標記的字符串,將該字符串拆分成一個或多個子字符串,使得所有基本詞的概率乘積與基本詞個數的比值最大;
(6)根據口令結構的頻次分布計算口令結構的概率分布;根據段的長度與類別,統計各長度、類別下段的頻次分布并計算其概率分布;使用字典樹存儲口令結構,字典樹的每一個結點代表一個段;
步驟二中所述識別用戶口令中的不連續段,具體過程如下:
(1)將只含有基本詞、且基本詞個數大于字符種類數的用戶口令看作有向無環圖,大小寫字母看作同類字符:字符ai有指向字符aj的邊,i表示口令中第i個字符,j是大于i且保證ai與aj屬于同類字符的最小整數值,若不存在這樣的j,則ai沒有指向其它字符的邊;
(2)對該無環圖進行拓撲排序,對每一種拓撲排序序列賦予一個概率,選取概率最大的一種序列,作為最大概率拓撲排序序列;賦予序列概率的方式為,序列中所有段的概率的乘積與序列中段的數目的比例;
(3)統計最大概率拓撲排序序列的基本詞,識別為混合詞,調整口令結構和段的概率分布。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110019967.4/1.html,轉載請聲明來源鉆瓜專利網。





