[發(fā)明專利]一種基于用戶名信息的密碼猜測(cè)集生成方法及密碼破解方法在審
| 申請(qǐng)?zhí)枺?/td> | 201611079933.X | 申請(qǐng)日: | 2016-11-30 |
| 公開(kāi)(公告)號(hào): | CN106803035A | 公開(kāi)(公告)日: | 2017-06-06 |
| 發(fā)明(設(shè)計(jì))人: | 陳小軍;徐睿;時(shí)金橋;譚建龍;文新;胡蘭蘭;王穎冰;于曉杰 | 申請(qǐng)(專利權(quán))人: | 中國(guó)科學(xué)院信息工程研究所 |
| 主分類號(hào): | G06F21/45 | 分類號(hào): | G06F21/45;G06F21/46;G06F21/31;G06F21/60;H04L29/06 |
| 代理公司: | 北京君尚知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)11200 | 代理人: | 司立彬 |
| 地址: | 100093 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶名 信息 密碼 猜測(cè) 生成 方法 破解 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于用戶名信息的密碼猜測(cè)集生成方法及密碼破解方法。
背景技術(shù)
長(zhǎng)時(shí)間以來(lái),破解密碼使用傳統(tǒng)的暴力破解方法,但這種方法沒(méi)有對(duì)密碼進(jìn)行深入的分析,以至于效果和效率都不盡如人意。
在一些新方法中,自然語(yǔ)言處理的思想和工具被應(yīng)用到密碼分析和破解當(dāng)中。這種方法將密碼也視為某種形式的自然語(yǔ)句,由一系列片段按照一定的層次結(jié)構(gòu)組合而成。出現(xiàn)在密碼中的片段通常是字典中的單詞、日期或者其他有意義的字符串,而這些片段的組合結(jié)構(gòu)常常體現(xiàn)出某些固定模式。可以使用NLTK(Natural Language Toolkit)以及WordNet工具對(duì)密碼進(jìn)行分詞、詞性標(biāo)注以及語(yǔ)義類別標(biāo)注。然后,利用自然語(yǔ)言處理中概率上下文無(wú)關(guān)文法(Probability Context-Free Grammars,PCFGs)學(xué)習(xí)生成密碼的語(yǔ)法規(guī)則,并按照概率降序生成密碼猜測(cè)集。但是,當(dāng)被攻擊網(wǎng)站含有較多弱密碼時(shí),這種方法被證明破解效率較低。另外,當(dāng)被用于破解中文網(wǎng)站密碼時(shí),該方法破解效率也較差,原因在于其分詞系統(tǒng)并不能有效為中文拼音分詞。
這種方法的主要問(wèn)題在于未能充分分析密碼中的語(yǔ)義內(nèi)容以及各語(yǔ)義類別之間的語(yǔ)法,也未能給所使用的字典中的單詞分配合適的概率。
發(fā)明內(nèi)容
本發(fā)明的目的是將自然語(yǔ)言處理領(lǐng)域的思想和工具運(yùn)用到密碼分析和破解領(lǐng)域中來(lái),對(duì)用戶名分解分析,提取片段和結(jié)構(gòu)特征,利用用戶名和密碼的片段相似性和結(jié)構(gòu)相似性,理解密碼的構(gòu)成語(yǔ)義,加快密碼破解速度,是一種基于用戶名信息的密碼猜測(cè)集生成方法及密碼破解方法。
為了利用用戶名中包含的信息來(lái)提高密碼破解效率,本發(fā)明提供了一種基于PCFGs并能提取用戶名密碼間語(yǔ)義相似性的密碼猜測(cè)生成器,簡(jiǎn)稱基于語(yǔ)義相似性的密碼猜測(cè)生成器。
本發(fā)明的技術(shù)方案為:
一種基于用戶名信息的密碼猜測(cè)集生成方法,其步驟為:
1)對(duì)泄漏數(shù)據(jù)訓(xùn)練集中的用戶名、密碼分別進(jìn)行分詞和語(yǔ)義結(jié)構(gòu)標(biāo)注,計(jì)算用戶名、密
碼的語(yǔ)義相似性;其中,所述語(yǔ)義相似性包括語(yǔ)義結(jié)構(gòu)相似性和語(yǔ)義片段相似性;
2)將該語(yǔ)義相似性應(yīng)用到PCFGs語(yǔ)法中,即基于語(yǔ)義相似性構(gòu)建PCFGs語(yǔ)法;
3)根據(jù)步驟2)構(gòu)建的PCFGs語(yǔ)法,按照概率降序生成密碼猜測(cè)集。
一種基于用戶名信息的密碼破解方法,其步驟為:
1)對(duì)泄漏數(shù)據(jù)訓(xùn)練集中的用戶名、密碼分別進(jìn)行分詞和語(yǔ)義結(jié)構(gòu)標(biāo)注,計(jì)算用戶名、密碼的語(yǔ)義相似性;其中,所述語(yǔ)義相似性包括語(yǔ)義結(jié)構(gòu)相似性和語(yǔ)義片段相似性;
2)將該語(yǔ)義相似性應(yīng)用到PCFGs語(yǔ)法中,即基于語(yǔ)義相似性構(gòu)建PCFGs語(yǔ)法;
3)根據(jù)步驟2)構(gòu)建的PCFGs語(yǔ)法,按照概率降序生成密碼猜測(cè)集;
4)根據(jù)該密碼猜測(cè)集進(jìn)行密碼破解。
進(jìn)一步的,基于語(yǔ)義相似性構(gòu)建PCFGs語(yǔ)法的方法為:根據(jù)用戶名、密碼的語(yǔ)義結(jié)構(gòu)相似性,得到不同語(yǔ)義結(jié)構(gòu)的用戶名所選用的分布不同的密碼結(jié)構(gòu),將密碼結(jié)構(gòu)作為PCFGs語(yǔ)法的非終端結(jié)構(gòu);根據(jù)用戶名、密碼的語(yǔ)義片段相似性,選取用戶名中的語(yǔ)義片段加入到用來(lái)生成密碼的PCFGs語(yǔ)法的終端詞集合中,得到PCFGs語(yǔ)法的終端詞集合。
進(jìn)一步的,對(duì)于密碼中的片段,如果該片段出現(xiàn)在泄漏數(shù)據(jù)訓(xùn)練集的用戶名中,則將該片段在泄漏數(shù)據(jù)訓(xùn)練集中的頻數(shù)乘以一個(gè)概率系數(shù)α,并將擴(kuò)大α倍的頻數(shù)累加到所述終端詞集合中該片段原有的頻數(shù)上作為該片段的新頻數(shù);若所述終端詞集合中不含該片段,則將該片段及其頻數(shù)信息一起加入到所述終端詞集合中;然后更新所述終端詞集合中終端詞的概率分布。
進(jìn)一步的,所述步驟3)的實(shí)現(xiàn)方法為:為每一非終端結(jié)構(gòu)建立一個(gè)優(yōu)先級(jí)隊(duì)列,該優(yōu)先級(jí)隊(duì)列用于存儲(chǔ)對(duì)應(yīng)的非終端結(jié)構(gòu)按概率降序生成的密碼猜測(cè);然后對(duì)所有優(yōu)先級(jí)隊(duì)列的第一個(gè)元素進(jìn)行遍歷,找出概率最大的密碼,將該密碼出隊(duì)列輸出到密碼猜測(cè)集,再進(jìn)行下一次密碼查找,直到密碼猜測(cè)集中密碼數(shù)量達(dá)到規(guī)定值。
進(jìn)一步的,對(duì)用戶名、密碼按照語(yǔ)義類別分詞和語(yǔ)義結(jié)構(gòu)標(biāo)注;其中,所述語(yǔ)義類別包括拼音姓名、拼音姓名縮寫(xiě)、拼音名、拼音姓、拼音短語(yǔ)、其他拼音、英文短語(yǔ)、英文姓名、英文單詞、其他字母、數(shù)字日期、其他數(shù)字、單個(gè)字符重復(fù)、字符串重復(fù)、鍵盤等間距跳躍、鍵盤上同一行字符相鄰、鍵盤上不同行字符相鄰和其他特殊符號(hào)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)院信息工程研究所,未經(jīng)中國(guó)科學(xué)院信息工程研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611079933.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





