[發明專利]基于口令語義結構的字典生成系統及方法在審
| 申請號: | 202110002545.6 | 申請日: | 2021-01-04 |
| 公開(公告)號: | CN112784227A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 邱衛東;田昊;郭捷;唐鵬;黃征;劉國珍 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F21/31 | 分類號: | G06F21/31;G06F40/242;G06F40/284;G06F40/30 |
| 代理公司: | 上海交達專利事務所 31201 | 代理人: | 王毓理;王錫麟 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 口令 語義 結構 字典 生成 系統 方法 | ||
1.一種基于口令語義結構的字典生成系統,其特征在于,包括:口令語義結構分析模塊和口令字典生成模塊,其中:口令語義結構學習模塊從樣本集中提取出對應口令的語義結構以及口令語義結構對應的口令因子并輸出至口令字典生成模塊,口令字典生成模塊通過分析目標數據集的特征,根據生成閾值生成用于解密驗證的口令字典;
所述的口令語義結構學習模塊包括:初始化模塊、預處理模塊、分詞模塊、數字處理模塊、特殊字符處理模塊以及字母處理模塊,其中:初始化模塊生成哈希表,預處理模塊對輸入的口令進行分類判斷,分詞模塊對經分類判斷后仍然沒有明確語義的輸入口令進行分詞處理,數字處理模塊對于分詞模塊得到的數字部分根據長度進行分類,并判斷其中特定長度的數字是否包含語義結構,特殊字符處理模塊對于分詞模塊得到的特殊字符部分,根據長度進行再次分類;字母處理模塊對于分詞模塊得到的字母部分,依次進行單詞拆分、詞性標注模塊和特殊語義處理;
所述的字母處理模塊包括:單詞拆分單元,詞性標注單元和特殊語義處理單元,其中:單詞拆分單元使用參考語料庫,將命名實體作為名詞的子集,首先運行不包含中文名縮寫的分割算法,并且當分割結果包括任何無法識別的部分,將包含中文名縮寫進行第二次分割;詞性標注單元根據口令語義結構定義,對于詞性標注(POS)標記過程,使用了稱為順序退避標記器的方法,該方法嘗試從三元(Trigram)標記器,然后是二元(bigram)標記器,最后是單元(unigram)標記器進行標記過程;特殊語義處理單元對經過詞性標注單元后仍需要處理的命名實體和無法識別的段進行補充識別分類。
2.根據權利要求1所述的基于口令語義結構的字典生成系統,其特征是,所述的初始化模塊,根據命令行提供的參數,在Rules文件夾下新建存放口令語義結構因子的目錄,新建存放所有口令語義結構因子的哈希表A。
3.根據權利要求1所述的基于口令語義結構的字典生成系統,其特征是,所述的分類判斷是指:預處理模塊判斷輸入的口令是否包含鍵盤組合、郵件地址或網址,
4.根據權利要求1所述的基于口令語義結構的字典生成系統,其特征是,所述的分詞處理,首先按照字母,數字和特殊字符對口令進行切分,切分后的部分再進行分類判斷處理。
5.根據權利要求1所述的基于口令語義結構的字典生成系統,其特征是,所述的特定長度的數字,當長度為6位或8位數字,則判斷是否是年月日;當長度為4位數字,則判斷是否是年份;當長度為11位數字,則判斷是否是合法電話號碼。
6.根據權利要求1所述的基于口令語義結構的字典生成系統,其特征是,所述的口令語義結構定義是指:具有明確語義的因素,包括:代詞([PRON]),名詞([NOUN]),限定詞([DET]),形容詞([ADJ]),動詞([VERB]),介詞([ADP]),副詞([ADV]),小品詞([PRT]),連詞([CONJ]),代表數字的英語單詞([NUM])和詞綴([X])。
7.根據權利要求1所述的基于口令語義結構的字典生成系統,其特征是,所述的標記器進一步將命名實體標記為“NP”,將任何無法識別的段標記為“NN”。
8.根據權利要求1所述的基于口令語義結構的字典生成系統,其特征是,所述的補充識別分類包括:對實體標記部分通過字符串匹配映射到四個或五個命名實體;對于無法識別的段首先嘗試判斷他是不是合法的拼音表達式;然后通過檢查該細分是否是英語短語的首字母縮寫,判斷規則是改部分是否是由至少三個連續的輔音字母組成的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110002545.6/1.html,轉載請聲明來源鉆瓜專利網。





