[發(fā)明專利]一種基于綜合分段的用戶口令建模與強度評估方法有效
| 申請?zhí)枺?/td> | 202110019967.4 | 申請日: | 2021-01-07 |
| 公開(公告)號: | CN112632526B | 公開(公告)日: | 2022-04-12 |
| 發(fā)明(設計)人: | 韓偉力;王傳旺;徐銘;張俊杰 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F21/46 | 分類號: | G06F21/46;G06F16/31;G06F40/216;G06F40/242 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 綜合 分段 用戶 口令 建模 強度 評估 方法 | ||
本發(fā)明屬于數(shù)據(jù)安全技術領域,具體為一種基于綜合分段的用戶口令建模與強度評估方法。本發(fā)明包括三個步驟:識別用戶口令中的連續(xù)段、識別用戶口令中的不連續(xù)段、評估用戶口令強度。本發(fā)明對口令數(shù)據(jù)集中存在的網(wǎng)絡語、鍵盤模式、簡寫、基本詞識別為口令中的連續(xù)段,使用拓撲排序方法來將口令中的混合詞識別為不連續(xù)段,對待評估用戶口令窮舉所有口令結構來評估用戶口令的強度。本發(fā)明的優(yōu)點在于:具有良好的普適性,可應用于多個不同地域、不同網(wǎng)站的口令數(shù)據(jù)集對用戶口令進行建模;本方法在段的連續(xù)性受到破壞時,如自然語言單詞中插入數(shù)字以破壞單詞連續(xù)性,仍然可以識別并抽取為連續(xù)的段。
技術領域
本發(fā)明屬于數(shù)據(jù)安全技術領域,具體涉及基于綜合分段的用戶口令建模與強度評估方法。
背景技術
文本口令因易于使用一直以來是保護系統(tǒng)安全的重要手段?,F(xiàn)在有數(shù)以億計的互聯(lián)網(wǎng)用戶,每個用戶都有幾十個口令。每個口令都可以獲取敏感權限來訪問重要的文件或價值數(shù)百萬美元的賬戶。因此,自20世紀60年代提出以來,用戶口令安全的研究一直是安全領域的熱點問題。2006年,NIST(National Institute of Standards and Technology)建議用戶使用更長、包含多種的字符種類的口令。2017年,NIST進一步指出,用戶口令需要足夠長(16及以上字符)。這些建議旨在擴大口令搜索空間,來抵御口令猜測攻擊。從口令猜測的角度來看,唯一口令(singltons),即只出現(xiàn)一次的口令,是安全且難以猜測的。但是,用戶口令通常存在重用現(xiàn)象,而且數(shù)據(jù)驅動的口令猜測方法,如概率上下文無關文法(Probabilistic Context-free Grammars,簡稱PCFG)方法,馬爾可夫(Markov)方法,長短期記憶神經(jīng)網(wǎng)絡(LSTM)方法,在根據(jù)訓練數(shù)據(jù)對用戶口令進行建模后,能夠生成訓練數(shù)據(jù)以外的口令,并基于口令重用減少搜索空間。
但是現(xiàn)有的數(shù)據(jù)驅動的方法對用戶口令的建模存在不足。現(xiàn)有基于分段的口令建模方法會破解口令中網(wǎng)絡語、鍵盤模式的語義,錯誤地識別口令中的基本詞、不連續(xù)段。除此以外,當一條用戶口令有多種口令結構時,現(xiàn)有方法在評估口令強度時存在性能差、不準確的問題,這些問題現(xiàn)有方法將常見口令評估為難以猜測的口令,使得評估結果不準確。
發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種快速、高效的可以適用于不同地域、不同語言的用戶口令建模與強度評估方法。
本發(fā)明提出的用戶口令建模與強度評估方法,細化了口令中的段的具體類別,依據(jù)對數(shù)據(jù)集中段的識別結果,采用簡單高效的窮舉算法選取單條用戶口令所符合的所有口令結構并賦予概率值,所有概率值中的最大值越高,表明用戶口令的強度越低。
本發(fā)明提出的用戶口令建模與強度評估方法,除了可以直接應用外,其相應的評估方法也可以為其他建模方法(建模方法使單條口令存在多種口令結構)下的口令強度評估方法提供參考,針對不同類別的段以及口令結構,可高效建模用戶口令并評估用戶口令強度。
本發(fā)明提供的用戶口令建模與強度評估方法,是基于綜合分段的,具體分為三個步驟。
步驟一、識別用戶口令中的連續(xù)段
對用戶口令集中的每一條口令,將該口令拆分成多個子字符串,每個子字符串作為該口令的一段,都是不可再次拆分的;
其中,用戶口令中的段的類別包含如下5種:
(1)鍵盤模式(在鍵盤設備上按鍵相鄰的字符串、組成平行線、垂直線的字符串,如“1q2w3e4r”,長度至少為4,使用兩類或以上字符);
(2)網(wǎng)絡語(形似字符替換與音似字符替換,如“too”可以替換為“2”,使用兩類或以上字符,長度至少為4);
(3)簡寫(由多類字符組成的縮寫或常用表示,如“Mr.”,長度至多為4);
(4)基本詞(由連續(xù)同類字符組成的字符串);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經(jīng)復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110019967.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





