[發明專利]一種基于知識圖譜的內容推薦方法和系統在審
| 申請號: | 201910635055.2 | 申請日: | 2019-07-15 |
| 公開(公告)號: | CN112231547A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 曹秀亭 | 申請(專利權)人: | 普天信息技術有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 蔣歡;王琦 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 內容 推薦 方法 系統 | ||
本申請公開了一種基于知識圖譜的內容推薦方法,包括:獲取用戶在一段設定時間內點擊過的歷史內容,并確定與所述歷史內容相似的若干候選內容;對于所述歷史內容和所述候選內容,分別使用KCNN將其語義表示與知識表示進行融合,得到各個內容對應的KCNN映射結果;根據所述歷史內容和所述候選內容的KCNN映射結果,通過Attention機制確定各個候選內容的得分,所述候選內容的得分表示所述候選內容被所述用戶點擊的概率;將得分最高的N個候選內容推薦給所述用戶,其中,N≥1。本申請還公開了一種對應的內容推薦系統。應用本申請公開的技術方案,能夠充分挖掘用戶潛在的感興趣的知識內容,實現更為智能的個性化內容推薦。
技術領域
本申請涉及智能推薦技術領域,特別涉及一種基于知識圖譜的內容推薦方法和系統。
背景技術
推薦系統存在的主要意義在于:在信息爆炸的時代,如何從大量的數據中選擇合適的信息向個性化用戶進行推薦。推薦系統在新聞領域有很大的發展前景,一般來說,新聞語言高度濃縮,充滿了知識實體和常識知識。目前的新聞推薦方法主要依靠統計機器進行學習,通過新聞的關鍵詞判斷新聞之間的相似性,然后將相似的新聞推薦給用戶。
一種現有的實現方案是基于內容相似度進行新聞推薦。基于內容相似度進行新聞推薦,顧名思義,就是將與用戶感興趣的新聞內容相似的新聞推薦給該用戶。基于內容相似度的推薦算法的主要優勢在于:無冷啟動問題,只要用戶產生了初始的歷史數據(即看了某新聞),就可以開始進行推薦的計算。而且隨著用戶的瀏覽記錄數據的增加,這種推薦通常也會越來越準確。
這里有兩個重要的關鍵點需要進行說明:
1.如何知道用戶喜歡看哪些新聞,即:如何確定用戶感興趣的新聞。
用戶有歷史的瀏覽記錄,可以從用戶歷史瀏覽的新聞中“提取”能代表新聞主要內容的關鍵詞,判斷哪些關鍵詞出現得最多。比如:可以有“手機”,“電腦游戲”、“發布會”等等關鍵詞。
或者,也可以統計這些新聞所屬的領域是哪些,比如:國際政治、社會、民生、娛樂,找出用戶看的新聞來源最多的幾個領域。不過,按這種方式判斷用戶興趣容易太寬泛,哪怕是同一個領域下的新聞,也可能存在較大差異。比如:某用戶可能喜歡A女星,而不喜歡B女星,而如果只是認為該用戶喜歡娛樂新聞,結果把B女星的新聞不停地推薦給用戶,顯然這種推薦是不合適的。而上述的提取關鍵詞的方法就可以比較好地規避這個問題。
2.如何判斷兩個新聞的內容是否相似
將一篇文本通過詞頻-逆文本頻率指數(TF-IDF:term frequency–inversedocument frequency)算法進行處理,能夠返回一組對應于該文本的“關鍵詞-TFIDF值”的詞數對,這些關鍵詞最好地代表了這篇文本的核心內容,而這些關鍵詞相對于這篇文本的關鍵程度由它的TF-IDF值量化。
采用提取關鍵詞并量化關鍵程度的方法得到兩篇文本各自的TF-IDF值后,通過計算這兩組TF-IDF值的余弦距離可以得到兩篇文本的相似程度,從而利用文本之間的相似度來推薦新聞。
上述基于內容相似度的新聞推薦局限于簡單的詞匹配,不能合理地擴展,存在很大的不準確性。并且,上述方法沒有考慮到用戶興趣的多樣性,當用戶量達到一定的數量級,整個推薦系統不能為用戶進行個性化推薦,從而失去了推薦系統的意義。此外,從技術層面考慮,本申請的發明人發現:現有新聞推薦方法沒有利用外在知識,也沒有充分發現新聞之間潛在的知識層面的聯系,因而無法挖掘用戶潛在的感興趣的知識。
發明內容
本申請提供了一種基于知識圖譜的內容推薦方法和系統,以充分挖掘用戶潛在的感興趣的知識內容,實現更為智能的個性化內容推薦。
本申請公開了一種基于知識圖譜的內容推薦方法,包括:
獲取用戶在一段設定時間內點擊過的歷史內容,并確定與所述歷史內容相似的若干候選內容;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于普天信息技術有限公司,未經普天信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910635055.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據傳輸處理方法及設備
- 下一篇:傳動機構
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





