[發明專利]一種特征提取方法、裝置和存儲介質有效
| 申請號: | 202010155617.6 | 申請日: | 2020-03-09 |
| 公開(公告)號: | CN111382793B | 公開(公告)日: | 2023-02-28 |
| 發明(設計)人: | 吳喆;李深遠;黃昕 | 申請(專利權)人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G06F18/213 | 分類號: | G06F18/213;G06F18/22;G06N20/00;G06F16/735;G06F16/9535 |
| 代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 彭緒坤 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 特征 提取 方法 裝置 存儲 介質 | ||
本發明實施例公開了一種特征提取方法、裝置和存儲介質,其中,通過構建包括用戶標識和對象標識的正樣本對,構建包括用戶特征提取子網絡、對象特征提取子網絡以及損失網絡的深度學習網絡;將用戶對應的第一輔助信息以及用戶標識輸入到用戶特征提取子網絡進行特征向量提取;將對象對應的第二輔助信息以及對象標識輸入到對象特征提取子網絡進行特征向量提取;將兩個特征提取子網絡取到的特征向量輸入損失網絡,根據損失網絡輸出的損失值進行聯合訓練,直至收斂;根據收斂后的對象特征提取子網絡提取得到對象的目標特征向量。相較于相關技術,本發明提取得到對象的目標特征向量融合了用戶的相關信息,能夠更有效的表征對象,進而能夠更好的進行推薦。
技術領域
本發明涉及推薦技術領域,具體涉及一種特征提取方法、裝置和存儲介質。
背景技術
在推薦技術領域,推薦的對象可以是視頻、音樂、新聞以及商品等。推薦系統由多模塊組成,比如召回模塊、精排模塊等。其中,許多模塊是以特征向量為核心來進行搭建的,比如,召回模塊基于對象的特征向量來進行相似召回,精排模塊中對用戶點擊序列中的對象進行特征向量聚合,用以表征用戶的行為特征等。然而,相關技術中關注的是如何使用對象的特征向量,而忽略了特征向量的提取。
發明內容
本發明實施例提供一種特征提取方法、裝置和存儲介質,能夠有效的提取對象的特征向量,進而能夠更好的進行推薦。
本發明實施例提供的特征提取方法,包括:
獲取用戶對于對象的操作行為數據,并根據所述操作行為數據構建正樣本對,所述正樣本對包括用戶標識和對象標識;
構建初始的深度學習網絡,所述深度學習網絡包括用戶特征提取子網絡、對象特征提取子網絡以及連接所述用戶特征提取子網絡和所述對象特征提取子網絡的損失網絡;
獲取所述用戶對應的第一輔助信息,并將所述用戶標識以及所述第一輔助信息輸入到所述用戶特征提取子網絡進行特征向量提取;
獲取所述對象對應的第二輔助信息,并將所述對象標識以及所述第二輔助信息輸入到所述對象特征提取子網絡進行特征向量提取;
將所述用戶特征提取子網絡以及所述對象特征提取子網絡提取到的特征向量輸入所述損失網絡,并根據所述損失網絡輸出的損失值對所述用戶特征提取子網絡和所述對象特征提取子網絡的參數進行調整,直至所述用戶特征提取子網絡和所述對象特征提取子網絡收斂;
根據收斂后的所述對象特征提取子網絡提取得到所述對象的目標特征向量。
本發明實施例還提供一種特征提取裝置,包括:
樣本構建模塊,用于獲取用戶對于對象的操作行為數據,并根據所述操作行為數據構建正樣本對,所述正樣本對包括用戶標識和對象標識;
網絡構建模塊,用于構建初始的深度學習網絡,所述深度學習網絡包括用戶特征提取子網絡、對象特征提取子網絡以及連接所述用戶特征提取子網絡和所述對象特征提取子網絡的損失網絡;
第一特征提取模塊,用于獲取所述用戶對應的第一輔助信息,并將所述用戶標識以及所述第一輔助信息輸入到所述用戶特征提取子網絡進行特征向量提取;
第二特征提取模塊,用于獲取所述對象對應的第二輔助信息,并將所述對象標識以及所述第二輔助信息輸入到所述對象特征提取子網絡進行特征向量提取;
模型訓練模塊,用于將所述用戶特征提取子網絡以及所述對象特征提取子網絡提取到的特征向量輸入所述損失網絡,并根據所述損失網絡輸出的損失值對所述用戶特征提取子網絡和所述對象特征提取子網絡的參數進行調整,直至所述用戶特征提取子網絡和所述對象特征提取子網絡收斂;
目標特征提取模塊,用于根據收斂后的所述對象特征提取子網絡提取得到所述對象的目標特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊音樂娛樂科技(深圳)有限公司,未經騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010155617.6/2.html,轉載請聲明來源鉆瓜專利網。





