[發明專利]基于HMM的用戶查詢風險評估和隱私保護方法有效
| 申請號: | 201910072616.2 | 申請日: | 2019-01-25 |
| 公開(公告)號: | CN109918939B | 公開(公告)日: | 2023-08-11 |
| 發明(設計)人: | 徐光偉;馬永東;王文濤;史春紅;賴淼麟 | 申請(專利權)人: | 東華大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩;柏子雵 |
| 地址: | 201600 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 hmm 用戶 查詢 風險 評估 隱私 保護 方法 | ||
1.一種基于HMM的用戶查詢風險評估和隱私保護方法,其特征在于,包括以下步驟:
步驟1、用戶發起查詢請求,根據用戶查詢請求中所包含的查詢內容進行查詢特征分析,獲得用戶查詢特征;
步驟2、基于用戶查詢特征,建立HMM模型,建立HMM模型的方法包括以下步驟:
步驟201、確定用戶查詢時的可見狀態,可見狀態包含系統的所有信息,并且在當前狀態下的觀察是獨立的,而且用戶的查詢內容僅與前一個狀態有關;
步驟202、建立隱馬爾可夫五元組參數模型,包括狀態轉移概率矩陣、觀測向量的概率矩陣、最初狀態概率分布矢量、狀態數和觀測符號數,每個環節的安全狀態概率分布就是下一環節的初始狀態概率分布;
步驟3、初始化模型參數,根據HMM模型的可見狀態序列及系統的真實狀態,對HMM模型進行訓練;
步驟4、利用訓練好的HMM模型對用戶實時發起的查詢請求所包含的查詢內容進行風險評估和風險值計算,確定查詢風險等級,其中:
在建立HMM模型時,結合用戶的遞進和共現查詢特征,從轉移概率和觀測概率角度進行分析:
轉移概率,是指用戶給出先前查詢數據序列后,再經過若干時間后得到用戶的另一查詢數據的條件概率,相連的兩節點q1,q2之間存在著一個轉移概率P(q1→q2);設Xt為HMM中個人可識別敏感信息,則Xt節點之間的轉移概率為p(Xt|Xt-1),對節點之間已發生的轉換次數count(Xt|Xt-1)進行計算得到α為權重;然后根據加權轉移概率的方法計算用戶查詢中的隱私風險,即α*p(Xt|Xt-1);
觀測概率,是指某個節點可能發生的查詢行為,如用戶ui經過q查詢了e的概率為P(e|q),該值基于用戶的歷史查詢數據進行分析和計算獲得,每個節點包含一組具有觀測概率的觀測值,將這些觀測概率建模為不同用戶在先前數據(p(ui|Xt))中找到的給定數據Xt的概率,用戶查詢特定主題的數據越多,則對用戶興趣數據的推斷精確度越高,該查詢風險越高;采用加權計數的方式確定查詢風險β*p(ui|Xt),其中,β為權重,
在用戶連續查詢場景中,設用戶當前的查詢為XT只與前一查詢XT-1相關,如用戶在查詢一個復雜問題時,當前的查詢結果不滿足用戶的查詢需求時,用戶會添加或刪除前一次的查詢內容,所以是滿足一階馬爾科夫性質;
用戶查詢風險評估:
設用戶ui查詢序列為X1,X2,…,Xn,則針對該用戶查詢序列輸出的觀測結果為Y1,Y2,…,Yn,得用戶ui查詢序列和觀測結果的聯合分布為:
計算出用戶ui的查詢序列(X1→X2→…→Xn)所產生的整體隱私風險為:
其中,(HMM|ui)代表用戶ui的所有路徑的隱私概率列表,這些列表包括用戶觀察概率大于0的節點,最后,可得用戶查詢序列為X1,X2,…,Xn時的查詢風險為p(X1,…,Xn|ui);
用戶查詢風險等級劃分:用戶查詢共有五個狀態,A1-A5,其中A1表示正常安全狀態,A5表示重大危險狀況,A2、A3、A4表示危險等級逐級加深;用概率表示,則各個狀態表示的風險等級的概率如下表所示:
步驟5、針對不同的查詢風險等級,采用不同的隱私保護措施:當查詢風險等級為高風險查詢時,采用高強度的差分隱私噪音降低查詢風險;當查詢風險等級為低風險查詢時,采用低強度的差分隱私噪音實現保護;
步驟6、將隱私保護后的結果發送給服務提供商,服務提供商根據用戶的查詢需求進行結果查詢;
步驟7、服務提供商將查詢到的結果進行返回,在用戶端進行結果排名的操作,再次進行隱私保護。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910072616.2/1.html,轉載請聲明來源鉆瓜專利網。





