[發(fā)明專利]一種信息推薦模型的訓(xùn)練方法和相關(guān)裝置在審

申請(qǐng)?zhí)枺?/td>	202010887619.4	申請(qǐng)日：	2020-08-28
公開(kāi)（公告）號(hào)：	CN111931062A	公開(kāi)（公告）日：	2020-11-13
發(fā)明（設(shè)計(jì)）人：	郝曉波;葛凱凱;劉雨丹;唐琳瑤;謝若冰;張旭;林樂(lè)宇	申請(qǐng)（專利權(quán)）人：	騰訊科技（深圳）有限公司
主分類(lèi)號(hào)：	G06F16/9535	分類(lèi)號(hào)：	G06F16/9535;G06N20/00;G06N3/04;G06N3/08
代理公司：	深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285	代理人：	王兆林
地址：	518057 廣東省深圳***	國(guó)省代碼：	廣東;44
權(quán)利要求書(shū)：	查看更多	說(shuō)明書(shū)：	查看更多
摘要：
搜索關(guān)鍵詞：	一種信息推薦模型訓(xùn)練方法相關(guān) 裝置
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門(mén)專利

【權(quán)利要求書(shū)】：

1.一種信息推薦模型的訓(xùn)練方法，其特征在于，所述方法包括：

獲取多個(gè)產(chǎn)品領(lǐng)域的歷史用戶行為數(shù)據(jù)；

采用生成對(duì)抗網(wǎng)絡(luò)中的生成模型，根據(jù)所述歷史用戶行為數(shù)據(jù)生成所述多個(gè)產(chǎn)品領(lǐng)域中的待擴(kuò)充產(chǎn)品領(lǐng)域中每個(gè)產(chǎn)品領(lǐng)域的候選樣本數(shù)據(jù)；

將所述多個(gè)產(chǎn)品領(lǐng)域中每個(gè)產(chǎn)品領(lǐng)域分別作為目標(biāo)產(chǎn)品領(lǐng)域，通過(guò)所述生成對(duì)抗網(wǎng)絡(luò)中的判別模型，對(duì)所述目標(biāo)產(chǎn)品領(lǐng)域的候選樣本數(shù)據(jù)和采集到的用戶點(diǎn)擊樣本數(shù)據(jù)進(jìn)行判別，得到判別結(jié)果；

根據(jù)所述判別結(jié)果對(duì)所述生成模型的和所述判別模型進(jìn)行對(duì)抗訓(xùn)練，得到訓(xùn)練后的生成對(duì)抗網(wǎng)絡(luò)，所述生成對(duì)抗網(wǎng)絡(luò)用于確定信息推薦模型。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述判別結(jié)果對(duì)所述生成模型的和所述判別模型進(jìn)行對(duì)抗訓(xùn)練，得到訓(xùn)練后的生成對(duì)抗網(wǎng)絡(luò)，包括：

固定所述生成模型的網(wǎng)絡(luò)參數(shù)，采用目標(biāo)損失函數(shù)對(duì)所述判別模型的網(wǎng)絡(luò)參數(shù)進(jìn)行訓(xùn)練，得到訓(xùn)練后的所述判別模型；

固定所述判別模型的網(wǎng)絡(luò)參數(shù)，采用所述目標(biāo)損失函數(shù)對(duì)所述生成模型的網(wǎng)絡(luò)參數(shù)進(jìn)行訓(xùn)練，得到訓(xùn)練后的所述生成模型；

在未滿足訓(xùn)練結(jié)束條件時(shí)，交替執(zhí)行上述兩個(gè)訓(xùn)練步驟。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述目標(biāo)損失函數(shù)的構(gòu)建方式包括：

根據(jù)所述判別結(jié)果構(gòu)建所述生成模型的第一損失函數(shù)和所述判別模型的第二損失函數(shù)；

根據(jù)所述第一損失函數(shù)和所述第二損失函數(shù)構(gòu)建所述目標(biāo)損失函數(shù)。

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述根據(jù)所述第一損失函數(shù)和所述第二損失函數(shù)構(gòu)建所述目標(biāo)損失函數(shù)，包括：

根據(jù)所述用戶點(diǎn)擊樣本數(shù)據(jù)的第一分布和所述候選樣本數(shù)據(jù)的第二分布構(gòu)建樣本分布損失函數(shù)；所述樣本分布損失函數(shù)的值越小表征所述第一分布和所述第二分布的分布差距越大；

根據(jù)所述第一損失函數(shù)、所述第二損失函數(shù)和所述本分布損失函數(shù)，構(gòu)建所述目標(biāo)損失函數(shù)。

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述根據(jù)所述用戶點(diǎn)擊樣本數(shù)據(jù)的第一分布和所述候選樣本數(shù)據(jù)的第二分布構(gòu)建樣本分布損失函數(shù)，包括：

對(duì)所述第一分布和所述第二分布進(jìn)行歐式距離計(jì)算、相對(duì)熵計(jì)算或最大均值差異計(jì)算，構(gòu)建所述樣本分布損失函數(shù)。

6.根據(jù)權(quán)利要求3-5任一項(xiàng)所述的方法，其特征在于，所述判別結(jié)果包括第一判別得分和第二判別得分，所述通過(guò)所述生成對(duì)抗網(wǎng)絡(luò)中的判別模型，對(duì)所述目標(biāo)產(chǎn)品領(lǐng)域的候選樣本數(shù)據(jù)和采集到的用戶點(diǎn)擊樣本數(shù)據(jù)進(jìn)行判別，得到判別結(jié)果，包括：

將所述生成模型的第一全連接層輸出的候選樣本數(shù)據(jù)輸入至所述判別模型的第二全連接層，通過(guò)所述第二全連接層對(duì)所述候選樣本數(shù)據(jù)進(jìn)行判別，得到所述第一判別得分；

將所述用戶點(diǎn)擊樣本數(shù)據(jù)輸入至所述第二全連接層，通過(guò)所述第二全連接層對(duì)所述用戶點(diǎn)擊樣本數(shù)據(jù)進(jìn)行判別，得到所述第二判別得分。

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述根據(jù)所述判別結(jié)果構(gòu)建所述生成模型的第一損失函數(shù)和所述判別模型的第二損失函數(shù)，包括：

獲取所述生成模型對(duì)所述候選樣本數(shù)據(jù)的置信得分；

根據(jù)所述第一判別得分和所述置信得分構(gòu)建所述第一損失函數(shù)；

根據(jù)所述第一判別得分和所述第二判別得分構(gòu)建所述第二損失函數(shù)。

8.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法，其特征在于，所述方法還包括：

將所述訓(xùn)練后的生成對(duì)抗網(wǎng)絡(luò)中的判別模型提供給線上推薦服務(wù)；

在所述線上推薦服務(wù)過(guò)程中，將所述判別模型作為所述目標(biāo)產(chǎn)品領(lǐng)域的信息推薦模型。

9.根據(jù)權(quán)利要求8所述的方法，其特征在于，所述方法還包括：

獲取目標(biāo)用戶的推薦請(qǐng)求；

根據(jù)所述推薦請(qǐng)求確定所述目標(biāo)用戶對(duì)應(yīng)的候選樣本數(shù)據(jù)；

根據(jù)所述目標(biāo)用戶對(duì)應(yīng)的候選樣本數(shù)據(jù)，通過(guò)所述目標(biāo)產(chǎn)品領(lǐng)域的信息推薦模型確定待推薦內(nèi)容；

根據(jù)所述待推薦內(nèi)容返回目標(biāo)推薦信息。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技（深圳）有限公司，未經(jīng)騰訊科技（深圳）有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010887619.4/1.html，轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

同類(lèi)專利

專利分類(lèi)

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

滑坡模型實(shí)驗(yàn)?zāi)Ｐ图?/a>

專利文獻(xiàn)下載

說(shuō)明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū)；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】