[發(fā)明專利]訓練交互預測模型、預測交互事件的方法及裝置有效
| 申請?zhí)枺?/td> | 202010955099.6 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN112085279B | 公開(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計)人: | 文劍烽;常曉夫;宋樂;劉旭欽 | 申請(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京億騰知識產(chǎn)權(quán)代理事務所(普通合伙) 11309 | 代理人: | 陳霽;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 訓練 交互 預測 模型 事件 方法 裝置 | ||
本說明書實施例提供一種交互預測模型的訓練和使用方法及裝置。在該方法中,首先基于交互事件序列構(gòu)建動態(tài)交互圖,從中確定出包含第一節(jié)點和第二節(jié)點的樣本節(jié)點對,其對應于樣本交互事件。從第一生成網(wǎng)絡(luò)和第一判別網(wǎng)絡(luò)分別獲取,對應于兩個節(jié)點各自的生成向量和判別向量。利用第二生成網(wǎng)絡(luò),基于兩個生成向量預測樣本交互事件的發(fā)生時間。接著,基于兩個生成向量和該預測時間形成第一輸入,基于兩個判別向量和真實時間形成第二輸入,通過第二判別網(wǎng)絡(luò),判別第一輸入和第二輸入各自為真實事件的概率。基于此對抗訓練第二生成網(wǎng)絡(luò)和第二判別網(wǎng)絡(luò)。訓練后的第一生成網(wǎng)絡(luò)和第二生成網(wǎng)絡(luò)作為用于預測交互事件的交互預測模型。
技術(shù)領(lǐng)域
本說明書一個或多個實施例涉及機器學習領(lǐng)域,尤其涉及訓練交互預測模型,以及利用訓練的交互預測模型來預測交互事件的方法和裝置。
背景技術(shù)
在許多場景下,需要對用戶交互事件進行分析和處理。交互事件是互聯(lián)網(wǎng)事件的基本組成元素之一,例如,用戶瀏覽頁面時的點擊行為,可以視為用戶與頁面內(nèi)容區(qū)塊之間的交互事件,電商中的購買行為可以視為用戶與商品之間的交互事件,賬戶間轉(zhuǎn)賬行為則是用戶與用戶之間的交互事件。用戶的一系列交互事件中蘊含了用戶的細粒度習慣偏好等特點,以及交互對象的特點,是機器學習模型的重要特征來源。因此,在許多場景下,希望根據(jù)交互事件對交互參與方進行特征表達和建模,進而對交互對象和事件進行分析,特別是對交互事件的安全性進行分析,從而保障交互平臺的安全性。
然而,交互事件涉及交互雙方,并且各個參與方本身的狀態(tài)可以是動態(tài)變化的,因此,綜合考慮交互參與方的多方面特點對其進行準確的特征表達非常困難。由此,希望能有改進的方案,更為有效地對交互對象和交互事件進行分析處理。
發(fā)明內(nèi)容
本說明書一個或多個實施例描述了一種交互預測模型的訓練方法和裝置,其中基于動態(tài)交互圖,利用兩級級聯(lián)的生成對抗網(wǎng)絡(luò),以對抗訓練方式,訓練得到交互預測模型,從而可以更準確地針對目標對象預測其接下來的交互對象以及交互時間。
根據(jù)第一方面,提供了一種訓練交互預測模型的方法,所述方法包括:
獲取動態(tài)交互圖,其中包括多個節(jié)點對,每個節(jié)點對對應于一個交互事件,其中的兩個節(jié)點分別表示參與該交互事件的兩個對象,任意節(jié)點通過連接邊指向該節(jié)點所代表的對象參與的上一交互事件對應的兩個節(jié)點;
從所述動態(tài)交互圖中選擇樣本節(jié)點對,所述樣本節(jié)點對包括第一節(jié)點和第二節(jié)點,并標注有該樣本節(jié)點對對應的樣本交互事件的真實發(fā)生時間;
從第一生成網(wǎng)絡(luò)獲取,對應于第一節(jié)點的第一生成向量,和對應于第二節(jié)點的第二生成向量;從第一判別網(wǎng)絡(luò)獲取,對應于第一節(jié)點的第一判別向量,和對應于第二節(jié)點的第二判別向量;所述第一生成網(wǎng)絡(luò)和第一判別網(wǎng)絡(luò)通過第一對抗訓練過程而訓練;
將所述第一生成向量,第二生成向量和噪聲向量,輸入第二生成網(wǎng)絡(luò),得到針對所述樣本交互事件的預測發(fā)生時間;
基于所述第一生成向量,第二生成向量和所述預測發(fā)生時間形成第一輸入,通過第二判別網(wǎng)絡(luò),得到所述第一輸入對應于真實事件的第一概率;
基于所述第一判別向量,第二判別向量和所述真實發(fā)生時間形成第二輸入,通過所述第二判別網(wǎng)絡(luò),得到所述第二輸入對應于真實事件的第二概率;
執(zhí)行第二對抗訓練過程,其中包括,以增大第二概率,減小第一概率為目標,訓練所述第二判別網(wǎng)絡(luò);以增大第一概率為目標,訓練所述第二生成網(wǎng)絡(luò);訓練后的第一生成網(wǎng)絡(luò)和第二生成網(wǎng)絡(luò)構(gòu)成所述交互預測模型。
在一個實施例中,所述第一生成網(wǎng)絡(luò)和所述第一判別網(wǎng)絡(luò)為結(jié)構(gòu)相同,參數(shù)獨立的兩個神經(jīng)網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010955099.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





