[發明專利]一種融合實體信息與熱度的知識圖譜推薦系統有效
| 申請號: | 201911272709.6 | 申請日: | 2019-12-12 |
| 公開(公告)號: | CN112966091B | 公開(公告)日: | 2022-10-14 |
| 發明(設計)人: | 杜雨燕;梁斌;梁家卿;肖仰華 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/36 |
| 代理公司: | 上海德昭知識產權代理有限公司 31204 | 代理人: | 盧泓宇 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 實體 信息 熱度 知識 圖譜 推薦 系統 | ||
1.一種融合實體信息與熱度的知識圖譜推薦系統,設置在對用戶進行實體推薦的推薦應用中,用于根據由多個所述實體的相關信息建立的知識圖譜以及所述用戶在瀏覽所述實體相關信息時的點擊反饋信息獲得所述實體的相似度分數從而讓所述推薦應用根據該相似度分數進行推薦,其特征在于,包括:
實體相似度計算模塊,獲取所述知識圖譜的文本信息輸入后利用該知識圖譜中實體的實體名、文本描述信息、三元組語義信息計算獲得所述實體的相似度;
圖譜嵌入式表示學習模塊,包含一個針對推薦應用改進后的TransE模型,以所述知識圖譜中實體間的關系作為輸入進行機器學習從而獲得所述知識圖譜中所述實體的嵌入式表示;以及
實體推薦生成模塊,基于所述用戶的點擊反饋數據,將所述實體相似度計算模塊得到的所述相似度以及所述圖譜嵌入式表示學習模塊得到的所述嵌入式表示融合成最終相似度分數,從而讓前述的推薦應用根據該相似度分數向所述用戶推薦所述實體,
其中,所述實體相似度計算模塊包括字面相似度計算子模塊、文本相似度計算子模塊以及矩陣生成子模塊,
所述字面相似度計算子模塊以所述實體的實體名作為輸入,基于最長公共子序列LCS以及編輯距離Levenshtein計算得到所述實體的名稱之間相似度,
所述文本相似度計算子模塊以各所述實體的描述文本作為輸入文檔,分別使用TF-IDF、LSI模型、LDA模型、HDP模型和Jaccard系數五個指標計算所述實體的文本相似度,
所述矩陣生成子模塊按照兩兩配對關系對實體對之間的各種相似度結果進行匯總,形成所述實體對之間的相似度矩陣,
所述圖譜嵌入式表示學習模塊采用基于TransE算法的改進方法為所述知識圖譜中的每個所述實體和關系進行學習得到低維向量,即所述嵌入式表示,該方法中對于TransE算法的改進在于:
在訓練時,每條邊引入權重w:
上式中,vt為尾實體的訪問次數,用于衡量實體的流行度;vmax、vmin分別表示頭實體h的所有的邊中最大、最小訪問次數,用于歸一化每個實體的權重;α為超參,用于補償低流行度的邊的權重,
考慮到對于一個實體,如果其入度數量過高,那么以這個實體作尾實體的關系本身所含信息量就偏低,引入尾實體的入度的算術平方根作為此類平凡實體的衡量指標,更新后的權重w為:
對于知識圖譜的中的每條邊h,r,t,計算所述權重w,得到模型的一組輸入(h,r,t,w),最終的loss function為:
上式中,(h′,r,t′)代表負樣本;γ為margin超參,取值為預先設定。
2.根據權利要求1所述的融合實體信息與熱度的知識圖譜推薦系統,其特征在于:
其中,所述字面相似度計算子模塊中,
設實體ei與ej所對應的實體名為si與sj,
所述實體ei與ej的基于最長公共子序列LCS的相似度SimLCSij為:
上式中,|LCS(si,sj)|為si與sj最長公共子序列長度,|si|與|sj|分別為si與sj的長度;
所述實體ei與ej的基于編輯距離Levenshtein的相似度SimEDij為:
上式中,ldist(si,sj)為si與sj的類編輯距離,|si|與|sj|分別為si與sj的長度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911272709.6/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





