[發明專利]基于語義特征和知識特征融合的內容推薦方法在審
| 申請號: | 202211298258.5 | 申請日: | 2022-10-22 |
| 公開(公告)號: | CN115659018A | 公開(公告)日: | 2023-01-31 |
| 發明(設計)人: | 席磊;鄭光;劉合兵;朱越;張浩;車銀超;馬新明 | 申請(專利權)人: | 河南農業大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/36;G06F40/30;G06F18/2415;G06F18/25;G06N3/0442;G06N3/045;G06N3/08 |
| 代理公司: | 鄭州盈派知識產權代理事務所(普通合伙) 41196 | 代理人: | 樊羿;張曉輝 |
| 地址: | 450002 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 特征 知識 融合 內容 推薦 方法 | ||
1.一種基于語義特征和知識特征融合的內容推薦方法,其特征在于,包括如下步驟:
(1)語義特征學習:利用CBoW模型捕獲給定知識圖譜中項目實體對應的語義特征向量表示Si;
(2)知識特征學習:在給定知識圖譜中,以用戶歷史交互項目為起點沿著關系鏈路向外擴散以獲得用戶偏好擴散集其中n表示鏈路長度;并根據用戶交互項目為偏好擴散集中的三元組分配對應的關聯概率;
(3)特征融合及結果生成:針對不同特征設計關系權重進行加權融合,并進行用戶對于偏好擴散集響應的計算:
式中,為用戶u對偏好擴散集的實體響應,由該節點的語義特征和知識特征加權融合得到;ti表示實體hi沿著關系ri到達的尾實體;pi為知識特征學習中學習到的關聯度;Si表示語義特征學習中學習到的該實體對應的語義特征向量表示;αi表示與尾實體ti對應的語義特征Si的權重;
按照由內層至外層的順序將獲取到的用戶u在知識圖譜中不同鏈路長度下的實體響應輸入GRU,對所得偏好擴散集進行關鍵特征提取,采用注意力機制為GRU提取到的特征向量進行權重分配,進而生成用戶的最終向量表示u:
式中,n表示偏好擴散集擴散的最大鏈路長度;為用戶u對偏好擴散集的實體響應在GRU單元中的隱藏狀態向量表示;θjn為當前第j個隱藏狀態向量對應的權重;
再將用戶最終向量表示和候選項目向量表示進行組合,按下式計算得到預測的用戶點擊概率:
式中,表示用戶u與候選項目v的交互概率,σ表示Sigmoid函數;
(4)模型訓練:利用如下損失函數進行模型訓練:
式中,V為項目的向量表示;E為知識圖譜中實體的向量表示;R為知識圖譜中關系的向量表示;Ir為項目在關系r下的真實向量表示;ETRE為計算得到的項目在關系r下的嵌入向量表示;λ1為知識圖譜嵌入損失權重;λ2為L2正則項權重;α表示知識圖譜語義特征的權重向量。
2.根據權利要求1所述的內容推薦方法,其特征在于,在所述步驟(1)中,通過最大化CBoW模型的如下目標函數L,不斷優化權重矩陣,從而學習得到語義特征向量:
式中,C表示目標詞所組成的語料庫;目標詞的概率分布式為p(w|Context(w))=softmax(UT·h),其中,U表示投影層至輸出層的權重矩陣,w表示目標詞,Context(w)為w的上下文。
3.根據權利要求1所述的內容推薦方法,其特征在于,在所述步驟(2)中,基于用戶交互項目為偏好擴散集中的三元組分配對應的關聯概率:
式中,v為用戶歷史交互項目;Ri∈Rd×d,hi∈Rd分別是知識圖譜中關系和實體的向量表示;pi為用戶歷史交互項目v與實體hi之間的關聯度。
4.根據權利要求1所述的內容推薦方法,其特征在于,在所述步驟(3)中,GRU使用重置門rt控制信息的遺忘程度;使用更新門zt對前一時刻隱藏狀態信息進行遺忘和選擇性保留;基于更新門的激活結果計算獲得候選隱藏狀態在此基礎上進行計算獲得當前時刻t的隱藏狀態ht,計算過程如下:
rt=σ(Wrxt+Urht-1) ⑦;
zt=σ(Wzxt+Uzht-1) ⑧;
以上式中,σ表示Sigmoid激活函數;Wr和Ur表示重置門的權重參數;Wz和Uz表示更新門的權重參數;*表示Hadamard乘積。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南農業大學,未經河南農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211298258.5/1.html,轉載請聲明來源鉆瓜專利網。





