[發(fā)明專利]一種基于多任務(wù)學(xué)習(xí)的多目標(biāo)推薦方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110157059.1 | 申請(qǐng)日: | 2021-02-04 |
| 公開(公告)號(hào): | CN112905648B | 公開(公告)日: | 2022-09-20 |
| 發(fā)明(設(shè)計(jì))人: | 王玉龍;陳維瑋;劉同存;王純;張磊;王晶 | 申請(qǐng)(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號(hào): | G06F16/2457 | 分類號(hào): | G06F16/2457;G06F16/2458;G06N3/04;G06N3/08 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100876 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 任務(wù) 學(xué)習(xí) 多目標(biāo) 推薦 方法 系統(tǒng) | ||
1.一種基于多任務(wù)學(xué)習(xí)的多目標(biāo)推薦系統(tǒng),其特征在于:所述系統(tǒng)包括用戶多種行為序列獲取模塊、權(quán)重生成模塊、GRU網(wǎng)絡(luò)共享模塊、SNR子網(wǎng)絡(luò)路由模塊、特征提取模塊和多目標(biāo)預(yù)測(cè)模塊;各模塊的功能如下:
用戶多種行為序列獲取模塊的功能是:
(1)構(gòu)造用戶行為序列集合S,具體是:選取N位用戶,根據(jù)用戶行為類型將行為分為P種行為,分別記作B1,...,BP,其中P=3,表示用戶行為類型分為3種:收藏、下載和分享,即B1=“收藏”,B2=“下載”,B3=“分享”;為每位用戶分別選取其發(fā)生了行為B1,...,BP的交互對(duì)象ID,并按行為發(fā)生時(shí)間的先后順序排列,來(lái)構(gòu)成用戶行為序列,所述交互對(duì)象是指音樂;將每位用戶的歷史行為的發(fā)生時(shí)間劃分為T個(gè)時(shí)間槽;用戶行為元組表示第i位用戶在第t個(gè)時(shí)間槽對(duì)交互對(duì)象o所發(fā)生的多種交互行為,表示是否發(fā)生了行為B1,...,BP;所有用戶的行為元組組成用戶行為序列集合S,集合S包括N*T個(gè)(M+P)維向量,其中M為待推薦對(duì)象的總數(shù),所有待推薦對(duì)象組成的集合等于所有交互對(duì)象組成的集合;用戶i在第t個(gè)時(shí)間槽的行為Sit是(M+P)維向量,前M項(xiàng)Sit[0:M-1]是用戶i在第t個(gè)時(shí)間槽的交互對(duì)象ID的one-hot向量,后P項(xiàng)Sit[M:M+P-1]是用戶i在第t個(gè)時(shí)間槽與交互對(duì)象發(fā)生的行為類型的multi-hot向量;
(2)構(gòu)造用于系統(tǒng)訓(xùn)練的用戶行為序列正樣本集合S+和負(fù)樣本集合S-,具體是:遍歷用戶行為序列集合S,每次讀入一個(gè)用戶行為元組,則向正樣本集合S+和負(fù)樣本集合S-中分別加入一個(gè)三元組,具體為:讀入用戶i第t個(gè)時(shí)間槽的用戶行為元組向正樣本集合S+中加入一個(gè)三元組{xi,j,Yij},其中xi為用戶i前t-1個(gè)時(shí)間槽的交互對(duì)象序列,即xi={Si1[0:M-1],...,Sit-1[0:M-1]},由于xi序列長(zhǎng)度小于T,所以在序列xi首位補(bǔ)充一個(gè)或多個(gè)0使得序列xi長(zhǎng)度為T,j為用戶i第t個(gè)時(shí)間槽的交互對(duì)象ID的one-hot向量,即j=Sit[0:M-1],Yij是正樣本的B1,...,BP行為的真實(shí)標(biāo)簽,Yij包括P個(gè)值分別記作即Yij=Sit[M:M+P-1];向負(fù)樣本集合S-中加入一個(gè)三元組{xi,j,Yij},其中xi與上述正樣本相同,j為用戶i第t個(gè)時(shí)間槽任意一個(gè)未交互的對(duì)象ID的one-hot向量,Yij是負(fù)樣本的B1,...,BP行為的真實(shí)標(biāo)簽,Yij包括P個(gè)值分別記作因?yàn)槭秦?fù)樣本所以Yij全為0值;負(fù)樣本集合S-中的每個(gè)負(fù)樣本與正樣本集合S+中的每個(gè)正樣本一一對(duì)應(yīng),訓(xùn)練時(shí)S+、S-中的數(shù)據(jù)交替按批量讀取;
GRU網(wǎng)絡(luò)共享模塊的功能是:
GRU網(wǎng)絡(luò)共享模塊包含k個(gè)并列的GRU網(wǎng)絡(luò),k值等于用戶行為類型總數(shù)P,將k個(gè)GRU網(wǎng)絡(luò)分別記作GRU1,...,GRUk;每個(gè)GRU網(wǎng)絡(luò)的隱藏層單元數(shù)設(shè)定為K,利用其結(jié)構(gòu)中的復(fù)位門和更新門,自動(dòng)篩選出用戶歷史行為序列中的有用信息和用戶當(dāng)前行為中的重要信息,綜合考慮用戶的歷史興趣和即時(shí)興趣,將用戶i截止到第T個(gè)時(shí)間槽的序列信息提取為一個(gè)K維向量并輸出;將k個(gè)GRU網(wǎng)絡(luò)的輸出分別記作
所述GRU網(wǎng)絡(luò)的每一個(gè)都包含多個(gè)相同的網(wǎng)絡(luò)單元,單元數(shù)量等于行為序列長(zhǎng)度,每個(gè)單元對(duì)應(yīng)一個(gè)時(shí)間槽;所述GRU網(wǎng)絡(luò)以權(quán)重生成模塊所輸出的用戶加權(quán)交互對(duì)象序列作為輸入,輸出最后一個(gè)單元的輸出向量hiT;第t個(gè)網(wǎng)絡(luò)單元中,復(fù)位門和更新門是并行的兩個(gè)單層全連接神經(jīng)網(wǎng)絡(luò),以輸入序列中的第t個(gè)元素向量和上一個(gè)網(wǎng)絡(luò)單元的輸出向量hit-1的(M+K)維拼接向量為輸入,以sigmoid為激活函數(shù),輸出結(jié)果即歷史信息相關(guān)權(quán)重rit和即時(shí)信息相關(guān)權(quán)重uit,得到rit和uit后,通過(guò)一個(gè)單層全連接神經(jīng)網(wǎng)絡(luò)生成候選激活向量該網(wǎng)絡(luò)以輸入序列中的第t個(gè)元素向量和加權(quán)后的上一個(gè)網(wǎng)絡(luò)單元的輸出向量rit*hit-1的(M+K)維拼接向量為輸入,以tanh為激活函數(shù),輸出結(jié)果即K維候選激活向量將uit作為的權(quán)重、(1-uit)作為hit-1的權(quán)重,對(duì)和hit-1進(jìn)行加權(quán)求和得到第t個(gè)網(wǎng)絡(luò)單元的輸出向量hit,即
SNR子網(wǎng)絡(luò)路由模塊的功能是:以所述GRU網(wǎng)絡(luò)共享模塊的輸出結(jié)果作為輸入,對(duì)進(jìn)行加權(quán)求和后輸出用戶興趣表示向量其中是用戶i第T+1個(gè)時(shí)間槽時(shí)在行為B1的預(yù)測(cè)目標(biāo)中的用戶興趣表示向量,是用戶i第T+1個(gè)時(shí)間槽時(shí)在行為BP的預(yù)測(cè)目標(biāo)中的用戶興趣表示向量,維度為K;所有用戶第T+1個(gè)時(shí)間槽時(shí)在每種行為的預(yù)測(cè)目標(biāo)中的用戶興趣表示向量分別構(gòu)成集合所有用戶第T+1個(gè)時(shí)間槽時(shí)在所有行為的預(yù)測(cè)目標(biāo)中的用戶興趣表示向量構(gòu)成集合U;所述預(yù)測(cè)目標(biāo)為根據(jù)用戶i前T個(gè)時(shí)間槽的交互行為預(yù)測(cè)用戶i第T+1個(gè)時(shí)間槽對(duì)待推薦對(duì)象j發(fā)生B1,...,BP行為的概率,每個(gè)行為的預(yù)測(cè)作為一個(gè)預(yù)測(cè)目標(biāo),每個(gè)預(yù)測(cè)目標(biāo)對(duì)應(yīng)一個(gè)用戶興趣表示向量;同一用戶在不同預(yù)測(cè)目標(biāo)中的偏好并不相同,因此SNR子網(wǎng)路由模塊為每個(gè)預(yù)測(cè)目標(biāo)分別輸出一個(gè)用戶興趣表示向量;
SNR子網(wǎng)絡(luò)路由模塊作為所述的GRU網(wǎng)絡(luò)共享模塊和多目標(biāo)預(yù)測(cè)模塊之間的連接模塊,將上下級(jí)網(wǎng)絡(luò)之間的兩兩連接情況抽象為編碼變量z;學(xué)習(xí)所述的編碼變量z相當(dāng)于學(xué)習(xí)所述的GRU網(wǎng)絡(luò)共享模塊的每個(gè)輸出結(jié)果在多目標(biāo)預(yù)測(cè)模塊的輸入信息中所占的權(quán)重,權(quán)重接近0則相當(dāng)于對(duì)應(yīng)連接斷開,實(shí)現(xiàn)自動(dòng)學(xué)習(xí)網(wǎng)絡(luò)共享結(jié)構(gòu)的功能;
根據(jù)所述的編碼變量z,用戶i第T+1個(gè)時(shí)間槽的用戶興趣表示向量的計(jì)算公式為:
其中z=[z11,…,z1k,…,zP1,…,zPk]是P*k維向量;
根據(jù)以下公式來(lái)生成z:z=g(s)=min(1,max(0,s(δ-γ)+γ)),其中u是符合均勻分布的P*k維隨機(jī)向量,log(a)為需要學(xué)習(xí)的參數(shù),將其初始化為按照正態(tài)分布生成的P*k維隨機(jī)向量,隨著訓(xùn)練進(jìn)行端到端學(xué)習(xí),其他參數(shù)為超參數(shù),使得編碼變量z可以基于梯度進(jìn)行優(yōu)化;
所述SNR子網(wǎng)絡(luò)路由模塊中編碼變量z的生成公式中的超參數(shù)β、δ、γ,通過(guò)網(wǎng)格搜索方式尋找最佳值;
權(quán)重生成模塊的功能是:根據(jù)與每個(gè)預(yù)測(cè)目標(biāo)的相關(guān)度對(duì)輸入序列中的元素進(jìn)行加權(quán),緩解頻率低的行為被淹沒的問題;將所述的SNR子網(wǎng)絡(luò)路由模塊輸出的用戶i第T+1個(gè)時(shí)間槽的用戶興趣表示向量和第1,2,...,T個(gè)時(shí)間槽的用戶交互對(duì)象Si1[0:M-1],Si2[0:M-1],...,SiT[0:M-1]作為所述權(quán)重生成模塊的輸入,即分別拼接與Si1[0:M-1],Si2[0:M-1],...,SiT[0:M-1]組成所述權(quán)重生成模塊的輸入矩陣其中concat()表示兩個(gè)向量的拼接操作,所述權(quán)重生成模塊首先計(jì)算出分別作為每個(gè)預(yù)測(cè)目標(biāo)下第1,2,...,T個(gè)時(shí)間槽的交互對(duì)象對(duì)于用戶i的P*T個(gè)權(quán)重值,記作所述權(quán)重生成模塊需要判斷所述系統(tǒng)是否尚未存在用戶i的用戶興趣表示向量若是,則不執(zhí)行上述權(quán)重生成模塊的所有計(jì)算,直接使用系統(tǒng)新用戶默認(rèn)權(quán)重值,即上述P*T個(gè)權(quán)重值全部直接賦值為1;
然后根據(jù)上述權(quán)重值,計(jì)算用戶i第1,2,...,T個(gè)時(shí)間槽的用戶加權(quán)交互對(duì)象計(jì)算公式為:k與P是相等的,一共有k*T個(gè);
所述用戶i第1,2,...,T個(gè)時(shí)間槽的用戶加權(quán)交互對(duì)象將分別作為用戶i第T+1個(gè)時(shí)間槽的所述GRU網(wǎng)絡(luò)共享模塊的第1、2、…、k個(gè)GRU網(wǎng)絡(luò)的輸入序列的第1,2,...,T個(gè)元素,即作為用戶i第T+1個(gè)時(shí)間槽的所述GRU網(wǎng)絡(luò)共享模塊的第1個(gè)GRU網(wǎng)絡(luò)的輸入序列,作為用戶i第T+1個(gè)時(shí)間槽的所述GRU網(wǎng)絡(luò)共享模塊的第k個(gè)GRU網(wǎng)絡(luò)的輸入序列;
所述權(quán)重生成模塊的網(wǎng)絡(luò)結(jié)構(gòu)為一個(gè)MLP網(wǎng)絡(luò),包括一個(gè)輸入層、兩個(gè)隱藏層和一個(gè)輸出層,均采用sigmoid激活函數(shù);輸入層節(jié)點(diǎn)數(shù)等于M+K,輸出層節(jié)點(diǎn)數(shù)等于1,第一層隱藏層節(jié)點(diǎn)數(shù)等于第二層隱藏層節(jié)點(diǎn)數(shù)等于符號(hào)表示上取整運(yùn)算;
特征提取模塊的功能是:構(gòu)造所有待推薦對(duì)象的特征表示向量集合Q,具體為:根據(jù)待推薦對(duì)象j的屬性的不同進(jìn)行不同的預(yù)處理:對(duì)對(duì)象j的離散屬性進(jìn)行one-hot處理,對(duì)對(duì)象j的連續(xù)屬性進(jìn)行歸一化處理,將所有預(yù)處理后的屬性拼接為一個(gè)向量作為所述特征提取模塊的輸入;所述特征提取模塊的輸出為待推薦對(duì)象j的特征表示向量Qj,維度為K;所有待推薦對(duì)象的特征表示向量組成包含M個(gè)K維向量的集合Q;通過(guò)所述特征提取模塊,減少人工特征提取的不準(zhǔn)確性,更好地編碼深層次復(fù)雜特征作為待推薦對(duì)象的特征表示;
所述特征提取模塊的網(wǎng)絡(luò)結(jié)構(gòu)為一個(gè)MLP網(wǎng)絡(luò),包括一個(gè)輸入層、兩個(gè)隱藏層和一個(gè)輸出層,均采用ReLU激活函數(shù);輸入層節(jié)點(diǎn)數(shù)等于所有屬性預(yù)處理后拼接成的向量維度記作F,輸出層節(jié)點(diǎn)數(shù)等于K,第一層隱藏層節(jié)點(diǎn)數(shù)等于第二層隱藏層節(jié)點(diǎn)數(shù)等于符號(hào)[]表示取整運(yùn)算;
多目標(biāo)預(yù)測(cè)模塊的功能是:每個(gè)預(yù)測(cè)目標(biāo)分別對(duì)應(yīng)一個(gè)獨(dú)立的MLP網(wǎng)絡(luò),記作分別以所述的SNR子網(wǎng)絡(luò)路由模塊輸出的用戶i第T+1個(gè)時(shí)間槽的用戶興趣表示向量和待推薦對(duì)象特征表示向量集合Q作為輸入,則最終第i位用戶第T+1個(gè)時(shí)間槽輸出的對(duì)待推薦對(duì)象j的多目標(biāo)預(yù)測(cè)概率為其中是用戶i第T+1個(gè)時(shí)間槽對(duì)待推薦對(duì)象j的發(fā)生行為B1的預(yù)測(cè)概率,是用戶i第T+1個(gè)時(shí)間槽對(duì)待推薦對(duì)象j的發(fā)生行為BP的預(yù)測(cè)概率;
是所述多目標(biāo)預(yù)測(cè)模塊中每個(gè)預(yù)測(cè)目標(biāo)對(duì)應(yīng)的MLP網(wǎng)絡(luò),concat()表示兩個(gè)向量的拼接操作;對(duì)于每個(gè)網(wǎng)絡(luò)的結(jié)構(gòu)均為:一個(gè)輸入層、一個(gè)隱藏層和一個(gè)輸出層,輸入層節(jié)點(diǎn)數(shù)為K*2,隱藏層節(jié)點(diǎn)數(shù)為K/2,隱藏層使用ReLU激活函數(shù),輸出層節(jié)點(diǎn)數(shù)為2,輸出層使用softmax損失函數(shù),兩個(gè)輸出節(jié)點(diǎn)值分別代表發(fā)生對(duì)應(yīng)交互行為的概率和不發(fā)生對(duì)應(yīng)交互行為的概率,只保存第一個(gè)節(jié)點(diǎn)的值即發(fā)生此行為的概率記作從而構(gòu)造用戶-待推薦對(duì)象多目標(biāo)預(yù)測(cè)概率集合Prob。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110157059.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價(jià)值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種自動(dòng)分配和推送的任務(wù)管理平臺(tái)及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲(chǔ)介質(zhì)
- 基于會(huì)話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 用于實(shí)現(xiàn)多目標(biāo)方業(yè)務(wù)或操作的方法和裝置
- 基于智能視頻分析平臺(tái)的多目標(biāo)跟蹤方法及其系統(tǒng)
- 多目標(biāo)設(shè)計(jì)選擇方法和系統(tǒng)
- 一種針對(duì)多目標(biāo)的地面導(dǎo)航系統(tǒng)及其方法
- 一種無(wú)斷點(diǎn)多目標(biāo)信號(hào)合成方法
- 基于多智能體深度增強(qiáng)學(xué)習(xí)的多目標(biāo)跟蹤方法
- 一種多目標(biāo)跟蹤方法
- 一種航空紅外視頻多目標(biāo)檢測(cè)與跟蹤方法及裝置
- 一種多目標(biāo)推薦方法、多目標(biāo)推薦模型生成方法以及裝置
- 一種區(qū)域多目標(biāo)衛(wèi)星探測(cè)仿真方法及系統(tǒng)





