[發明專利]用戶興趣標簽擴展方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010332953.3 | 申請日: | 2020-04-24 |
| 公開(公告)號: | CN111522889B | 公開(公告)日: | 2022-09-27 |
| 發明(設計)人: | 鄭孫聰;費昊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06Q30/02 |
| 代理公司: | 深圳市智圈知識產權代理事務所(普通合伙) 44351 | 代理人: | 韓紹君 |
| 地址: | 518064 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 興趣 標簽 擴展 方法 裝置 電子設備 存儲 介質 | ||
本申請公開一種用戶興趣標簽擴展方法,包括:獲取標簽集合A={t1,t2,……tn},n為自然數且n1,標簽集合A內包括興趣標簽t;獲取用戶u的原始興趣標簽集合B={t1,t2,……tk},其中k為自然數且1≤kn,且獲取至少一個知識圖譜,其至少包括與標簽t對應的節點Nt及與原始興趣標簽集合B的子集S對應的節點集合C;根據節點Nt與節點集合C內節點之間的關聯關系計算用戶u與所述標簽t之間的興趣度,進而得到用戶?標簽異構信息網絡;分解用戶?標簽異構信息網絡得到用戶向量與標簽向量;根據用戶向量與所述標簽向量生成用戶的擴展興趣標簽。上述方法可快速得到用戶的擴展興趣標簽。此外,本申請還公開一種用戶興趣標簽擴展裝置、電子設備及存儲介質。
技術領域
本申請涉及計算機技術領域,更具體地,涉及智能推薦系統技術領域。
背景技術
用戶畫像是一個將用戶的特征和屬于抽象化并以標簽來表示的模型。一個標簽概括了用戶的一個特征,例如性別、年齡、學歷、消費習慣、興趣偏好等。用戶畫像技術支撐了個性化推薦,廣告營銷等應用,為公司或企業提供了信息基礎,幫助企業精準定位到用戶需求。
自然語言處理(Nature Language processing,NLP)是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯系。自然語言處理技術通常包括文本處理、語義理解、機器翻譯、機器人問答、知識圖譜等技術。例如,通過對網絡上海量的文本數據進行NLP處理,提取文章的關鍵字,解析語義,并進一步分析,可以得到各種領域的知識圖譜。
另一方面,通過對用戶經常訪問的內容進行自然語言的分析與處理,可以得到用戶的興趣標簽,其基本思想是用戶如果經常點擊某一個主題的信息,那么用戶畫像中會生成一個該主題的標簽。而不同頁面的主題信息是通過自然語言處理得到的。例如:用戶經常點擊關于明星A的信息,那么用戶的興趣畫像標簽中會生成一個標簽“明星A”。
然而這種基于點擊日志生成的畫像標簽取決于給用戶展示了什么樣的信息,當沒有產生足夠量的點擊記錄時,無法得出足夠全面及精準的用戶畫像標簽。要得到相對精準的用戶畫像標簽,需要很長時間的日志記錄操作,這無疑給用戶畫像技術的應用帶來了時間長的障礙。
發明內容
本申請實施例提出了一種基于元路徑學習的用戶興趣標簽擴展方法、裝置、電子設備及存儲介質。
第一方面,本申請實施例提供一種用戶興趣標簽擴展方法,其包括:
獲取標簽集合A={t1,t2,……tn},其中n為自然數且n1,標簽集合A內包括興趣標簽t;獲取用戶u的原始興趣標簽集合B={t1,t2,……tk},其中k為自然數且1≤kn,且獲取至少一個知識圖譜,知識圖譜至少包括與標簽t對應的節點Nt及與原始興趣標簽集合B的子集S對應的節點集合C;根據所述節點Nt與所述節點集合C內節點之間的關聯關系計算所述用戶u與所述標簽t之間的興趣度,進而得到用戶-標簽異構信息網絡;分解用戶-標簽異構信息網絡得到用戶向量與標簽向量;根據用戶向量與所述標簽向量生成用戶的擴展興趣標簽。
第二方面,本申請實施例提供了一種電子設備,包括:標簽獲取模塊、原始興趣標簽獲取模塊、知識圖譜獲取模塊、異構信息網絡生成模塊、矩陣分解模塊、及擴展興趣標簽生成模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010332953.3/2.html,轉載請聲明來源鉆瓜專利網。





