[發明專利]一種基于領域知識圖譜的內容推薦方法在審
| 申請號: | 202011435336.2 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112559764A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 鄭晨燁;孫劍;喬勝勇 | 申請(專利權)人: | 北京中視廣信科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/9535;G06N3/04;G06K9/62 |
| 代理公司: | 北京市盛峰律師事務所 11337 | 代理人: | 席小東 |
| 地址: | 100038 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 領域 知識 圖譜 內容 推薦 方法 | ||
本發明提供一種基于領域知識圖譜的內容推薦方法,包括:將用戶歷史點擊內容輸入基于實體表示的候選內容生成模型,生成用戶可能感興趣的第一候選內容;基于知識圖譜興趣采樣的內容表示學習模型,生成內容表示向量;再根據內容表示向量,得到用戶對內容的點擊概率分布,生成用戶可能感興趣的第二候選內容;將第一候選內容和第二候選內容中的各個內容進行排序,得到內容推薦列表。優點為:本發明實現的基于知識圖譜的內容推薦方法,能夠通過知識圖譜建立內容之間的關系,使得向用戶推薦的內容與用戶歷史點擊內容具有關聯關系,推薦結果更具有解釋性。本發明能夠解決內容冷啟動問題,同時,在缺乏用戶歷史行為數據的情況下,提高了推薦性能。
技術領域
本發明屬于信息處理技術領域,具體涉及一種基于領域知識圖譜的內容推薦方法。
背景技術
近年來,隨著互聯網和大數據技術的快速發展,人們面臨著在海量信息中快速找到有效信息的挑戰,推薦系統可以通過分析人們的歷史行為,幫助人們有效過濾信息,并為用戶推薦其感興趣的信息。
現有推薦方法一般分為兩種:1、使用協同過濾的方式建立用戶與用戶之間的相似度關系,或內容與內容之間的相似度關系,然后,為用戶推薦與其歷史觀看相似的內容。2、對內容和用戶歷史行為進行編碼,然后,使用深度學習方法對用戶歷史行為和內容進行建模,使用模型計算用戶對內容的點擊概率,進而為用戶推薦點擊概率最高的內容。
上述兩種方法存在以下問題:一方面,需要大量用戶歷史行為數據,在缺乏用戶歷史行為數據的情況下,存在冷啟動的問題。另一方面,上述方法僅使用用戶歷史行為數據,或數據標簽信息,缺乏內容相關的多源特征,對用戶潛在興趣挖掘的能力較差,推薦內容具有較大局限性。此外,上述兩種方法使用的特征均具有稀疏性,導致推薦效果不佳,且計算資源消耗大。
發明內容
針對現有技術存在的缺陷,本發明提供一種基于領域知識圖譜的內容推薦方法,可有效解決上述問題。
本發明采用的技術方案如下:
本發明提供一種基于領域知識圖譜的內容推薦方法,包括以下步驟:
步驟1,構建知識圖譜G(V,E);其中,V為知識圖譜中所有實體的集合;知識圖譜中每個實體用v表示;E為知識圖譜中所有實體與實體之間關系的集合;
步驟2,使用圖表示學習模型GraphSAGE,對知識圖譜G(V,E)中的實體進行學習,每個實體v均學習得到對應的一個低維稠密的實體表示向量hv,其中,hv∈H,H為所有實體表示向量集合;實體表示向量hv包含了實體v的鄰域信息,知識圖譜中存在路徑的兩個實體的實體表示向量相似度更大;
步驟3,建立內容庫C;內容庫C包括NC個內容c;
步驟4,對于內容庫C中的每個內容ci,通過實體鏈接方法,建立內容ci與知識圖譜G(V,E)中實體之間的關系,得到內容-實體映射表;其中,內容ci映射到知識圖譜G(V,E)中多個實體,多個實體形成實體集合;
步驟5,將用戶歷史點擊內容輸入基于實體表示的候選內容生成模型,生成用戶可能感興趣的第一候選內容;
步驟5.1,內容庫C中的每個內容ci,映射到對應的一個實體集合;實體集合包括L個實體;實體集合中的每個實體對應一個實體表示向量,因此,共得到L個內容ci相關的實體表示向量,分別為:形成實體表示向量集合
內容ci和相關的實體表示向量集合表示為:其中,
步驟5.2,預設置實體表示向量集合包括的實體表示向量的最大數量L0,即:實體表示向量集合長度的最大數量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中視廣信科技有限公司,未經北京中視廣信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011435336.2/2.html,轉載請聲明來源鉆瓜專利網。





