[發明專利]一種針對長尾分布的學習方法、裝置以及設備在審
| 申請號: | 202210740465.5 | 申請日: | 2022-06-28 |
| 公開(公告)號: | CN115034861A | 公開(公告)日: | 2022-09-09 |
| 發明(設計)人: | 趙前;錢浩;張志強;周俊 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06Q30/02;G06N20/00 |
| 代理公司: | 北京君慧知識產權代理事務所(普通合伙) 11716 | 代理人: | 肖鵬 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 長尾 分布 學習方法 裝置 以及 設備 | ||
本說明書實施例公開了一種針對長尾分布的學習方法、裝置以及設備,方案包括:確定物品集合中的各頭部物品和各尾部物品;確定依次具有從屬關系的多個屬性維度,以及頭部物品和尾部物品在屬性維度上的屬性值;將頭部物品、尾部物品、屬性值作為圖節點,根據圖節點和從屬關系,生成圖網絡,以使頭部物品的圖節點通過對應的屬性值的圖節點,與尾部物品的圖節點連接;確定反映頭部物品的圖節點向量內不同維度之間的相關性的第一相關性參數,以及反映尾部物品的圖節點向量內不同維度之間的相關性的第二相關性參數;確定反映第一相關性參數與第二相關性參數之間差距的相關性損失;根據相關性損失,對圖網絡中的圖節點向量進行學習。
技術領域
本說明書涉及機器學習技術領域,尤其涉及一種針對長尾分布的學習方法、裝置以及設備。
背景技術
物品推薦場景是線上業務中常見的場景,比如,推薦商品或者推薦諸如電子券等商品相關的物品等。
在推薦場景中,長尾分布是指,少量的一些類別由于比較熱門則經常被推薦,這些類別被稱為頭部類(頭部類中的物品稱為頭部物品),頭部類具有較為豐富的樣本數量。而其他大多數類別相對冷門很少被推薦,這些類別被稱為尾部類(尾部類中的物品稱為尾部物品),尾部類的樣本數量也相對稀少。
現有技術中由于頭部類具有豐富的樣本數據,尾部類的樣本數量稀少,主要針對頭部類的樣本數據進行模型學習,久而久之,模型在后續的使用過程中,也主要是針對頭部物品推薦,而很少推薦尾部物品。
基于此,需要用于解決長尾分布問題的模型學習方案。
發明內容
本說明書一個或多個實施例提供了一種針對長尾分布的學習方法、裝置以及設備,用于解決如下技術問題:
由于頭部類具有豐富的樣本數據,尾部類的樣本數量稀少,主要針對頭部類的樣本數據進行模型學習,久而久之,模型在后續的使用過程中,也主要是針對頭部物品推薦,而很少推薦尾部物品。
本說明書一個或多個實施例采用下述技術方案:
本說明書一個或多個實施例提供一種針對長尾分布的學習方法,包括:
確定物品集合中的各頭部物品和各尾部物品;
確定依次具有從屬關系的多個屬性維度,以及頭部物品和尾部物品在屬性維度上的屬性值;
將頭部物品、尾部物品、屬性值作為圖節點,根據圖節點和從屬關系,生成圖網絡,以使頭部物品的圖節點通過對應的屬性值的圖節點,與尾部物品的圖節點連接;
確定反映頭部物品的圖節點向量內不同維度之間的相關性的第一相關性參數,以及反映尾部物品的圖節點向量內不同維度之間的相關性的第二相關性參數;
確定反映第一相關性參數與第二相關性參數之間差距的相關性損失;
根據相關性損失,對圖網絡中的圖節點向量進行學習。
本說明書一個或多個實施例還提供一種針對長尾分布的學習裝置,包括:
物品確定單元,確定物品集合中的各頭部物品和各尾部物品;
屬性確定單元,確定依次具有從屬關系的多個屬性維度,以及頭部物品和尾部物品在屬性維度上的屬性值;
構圖單元,將頭部物品、尾部物品、屬性值作為圖節點,根據圖節點和從屬關系,生成圖網絡,以使頭部物品的圖節點通過對應的屬性值的圖節點,與尾部物品的圖節點連接;
參數確定單元,確定反映頭部物品的圖節點向量內不同維度之間的相關性的第一相關性參數,以及反映尾部物品的圖節點向量內不同維度之間的相關性的第二相關性參數;
損失確定單元,確定反映第一相關性參數與第二相關性參數之間差距的相關性損失;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210740465.5/2.html,轉載請聲明來源鉆瓜專利網。





