[發明專利]基于變分自動編碼器的口令生成方法、系統、介質和設備有效
| 申請號: | 202010716110.3 | 申請日: | 2020-07-23 |
| 公開(公告)號: | CN111966998B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 吳昊天;鄭凱翰 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F21/46 | 分類號: | G06F21/46;G06F21/57 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自動 編碼器 口令 生成 方法 系統 介質 設備 | ||
1.一種基于變分自動編碼器的口令生成方法,其特征在于,包括下述步驟:
口令集預處理;
構建初始的變分自動編碼器結構,所述變分自動編碼器結構包括編碼器和解碼器,所述編碼器的結構采用循環神經網絡后接兩個線性層,所述解碼器的結構采用循環神經網絡構建;
訓練模型:所述編碼器學習口令集的分布,編碼后得到低維的隱藏向量,所述隱藏向量分別通過兩個線性層計算得到參數均值和標準差,通過重參數計算得到潛在向量,所述解碼器通過潛在向量重建數據,得到重建數據計算重建數據與輸入的原始口令集的誤差,然后通過訓練減少誤差;
模型優化:模型的優化器計算損失函數,將結果反饋給變分自動編碼器模型的編碼器和解碼器,通過梯度下降算法調整循環神經網絡和線性層的參數;
所述模型的優化器計算損失函數,所述損失函數包括交叉熵損失函數與KL散度,分別用于衡量原始口令數據和重建后的口令數據的相似度,以及隱藏空間的分布與正態分布的相似度;
所述標準差的分布與正態分布之間的KL散度,具體計算公式為:
其中,N(μ,σ)表示標準差的分布,N(0,1)表示正態分布,μ表示參數均值,σ表示標準差;
模型訓練優化后得到最優的分布參數均值和標準差,得到對應口令集的近似分布;
將參數均值和標準差通過正態分布計算得到潛在空間的分布情況,將潛在向量和首字母向量輸入解碼器,輸出口令數據。
2.根據權利要求1所述的基于變分自動編碼器的口令生成方法,其特征在于,所述口令集預處理的具體包括:數據清理、構建字典和文本矢量化表示;
所述數據清理具體步驟包括:清除口令集中長度超過預設值的口令,對無法編碼的內容進行清洗;
所述構建字典具體步驟包括:對數據清理后的數據進行提取所用的字符,組成一個字典;
所述文本矢量化表示步驟包括:基于字典將使用的密碼轉換成one-hot向量表示。
3.根據權利要求1所述的基于變分自動編碼器的口令生成方法,其特征在于,還包括序列數據處理步驟,所述循環神經網絡接收序列輸入,通過輸入初始隱藏向量h,在每一個時刻t,更新隱藏向量h和生成數據o;
所述隱藏向量h更新公式為:
ht=f(Uxt+Wht-1)
其中,f表示一個非線性的激活函數,U表示輸入到隱含層的權重矩陣,W表示狀態到隱含層的權重矩陣;
所述生成數據o的計算公式為:
Ot=g(Vht)
其中,g表示非線性的激活函數。
4.根據權利要求1所述的基于變分自動編碼器的口令生成方法,其特征在于,所述通過重參數計算得到潛在向量,具體計算步驟為:
從標準正態分布N(0,1)中采樣一個向量ε,使得z=mu+exp(log(var))*ε;
其中,z表示潛在向量。
5.根據權利要求1所述的基于變分自動編碼器的口令生成方法,其特征在于,所述梯度下降算法采用Adam算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010716110.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于物聯網的健康防疫管理系統
- 下一篇:一種電纜用負載燃燒檢測裝置





