[發明專利]一種實體推薦方法和裝置在審
| 申請號: | 201810986947.2 | 申請日: | 2018-08-28 |
| 公開(公告)號: | CN109063188A | 公開(公告)日: | 2018-12-21 |
| 發明(設計)人: | 王惠照;鄭凱;段立新;江建軍;夏虎 | 申請(專利權)人: | 國信優易數據有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/06 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 王文紅 |
| 地址: | 100070 北京市豐臺*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 向量 神經網絡模型 相似度 方法和裝置 感興趣內容 輸出表示 預測 嵌入 圖譜 申請 | ||
本申請提供了一種實體推薦方法,該方法包括:對知識圖譜中的實體進行嵌入處理,得到表示實體的實體向量;基于用戶已經選擇過的已選實體的實體向量,生成神經網絡模型的輸入,由所述神經網絡模型輸出表示所述用戶感興趣內容的預測表示向量;計算所述預測表示向量與所述實體向量之間的相似度;基于計算得到的相似度,確定向所述用戶進行推薦的推薦實體。
技術領域
本申請涉及數據分析技術領域,具體而言,涉及一種實體推薦方法和裝置。
背景技術
在海量數據的今天,用戶會面對各種各樣的內容,每個用戶也都對一定數量的內容進行購買、評分、評論等操作,用戶評論過的或者評分過或者購買過的內容,認為是用戶感興趣的內容,否則,認為是用戶不感興趣的內容。對于一個用戶而言,該用戶感興趣的內容最多以千為數量級別,而系統中的內容的數量級至少是千萬級別的,該用戶感興趣的內容與系統中的內容相比,數量是極其稀少的,而現有技術對用戶感興趣的內容進行分析預測時,預測的結果可能不是該用戶當前感興趣的內容,降低了用戶體驗。
發明內容
有鑒于此,本申請的目的在于提供一種實體推薦方法和裝置,用于解決現有技術中推薦實體準確度低的問題。
第一方面,本申請實施例提供了一種實體推薦方法,該方法包括:
對知識圖譜中的實體進行嵌入處理,得到表示實體的實體向量;
基于用戶已經選擇過的已選實體的實體向量,生成神經網絡模型的輸入,由所述神經網絡模型輸出表示所述用戶感興趣內容的預測表示向量;
計算所述預測表示向量與所述實體向量之間的相似度;
基于計算得到的相似度,確定向所述用戶進行推薦的推薦實體。
可選地,所述基于用戶已經選擇過的已選實體的實體向量,生成神經網絡模型的輸入,包括:
基于所述用戶對所述已選實體的評分或喜好程度,確定所述已選實體所對應的權重;
基于所述已選實體的實體向量及對應的權重,生成所述神經網絡模型的輸入。
可選地,所述神經網絡模型為長短期記憶網絡模型LSTM,所述基于用戶已經選擇過的已選實體的實體向量,生成神經網絡模型的輸入,包括:
依照所述用戶選擇所述已選實體的先后順序,使用所述已選實體的實體向量,生成所述長短期記憶網絡模型LSTM在不同時刻的輸入。
可選地,所述依照所述用戶選擇所述已選實體的先后順序,使用所述已選實體的實體向量,生成所述長短期記憶網絡模型LSTM在不同時刻的輸入,包括:
將所述用戶對所述已選實體的評分或喜好程度進行歸一化處理,確定所述已選實體對應的權重;
依照所述用戶選擇所述已選實體的先后順序,分別使用所述已選實體的實體向量及對應的權重,生成所述長短期記憶網絡模型LSTM在不同時刻的輸入。
可選地,還包括:
基于如下至少之一對所述神經網絡模型進行訓練優化:
(1)所述已選實體;
(2)所述用戶選擇所述已選實體的先后順序;
(3)向所述用戶進行推薦之后,用戶實際選擇的實體。
可選地,所述確定向所述用戶進行推薦的推薦實體,包括:
將相似度大于設定閾值所對應的實體確定為所述推薦實體。
可選地,還包括:
基于所述知識圖譜中,所述已選實體與所述推薦實體之間的路徑,為所述推薦實體形成推薦理由,并通知或顯示給所述用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國信優易數據有限公司,未經國信優易數據有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810986947.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種讓區域矛盾可視化和量化的方法
- 下一篇:一種數據存儲方法及裝置





