[發明專利]一種行為數據預測方法及裝置有效
| 申請號: | 202110695116.1 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113537297B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 林智明;潘華引 | 申請(專利權)人: | 同盾科技有限公司;同盾控股有限公司 |
| 主分類號: | G06F18/241 | 分類號: | G06F18/241;G06N3/045;G06N3/08 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 311100 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 行為 數據 預測 方法 裝置 | ||
本發明提供了一種行為數據預測方法及裝置,屬于數據處理領域,本發明提供的方法可以獲取當前用戶行為對應的第一機構編碼,并將第一機構編碼輸入預置預測模型中獲取預置預測模型輸出的預測結果,其中,預置預測模型通過采用注意力機制對第二機構編碼以及序列編碼向量進行池化處理獲得的目標特征向量訓練得到,第二機構編碼用于標識歷史用戶行為發生的機構,序列編碼向量根據歷史用戶行為的發生時序以及所述第二機構編碼構建得到,通過注意力機制的池化方法進行特征提取,預置預測模型的訓練過程中無需進行特征工程,從而能夠有效提高數據預測效率、降低成本,還能對各歷史用戶行為實現注意力加權的效果,提高模型對當前用戶行為預測的準確率。
技術領域
本發明涉及數據處理領域,更具體地,涉及一種行為數據預測方法及裝置。
背景技術
隨著網絡信息技術的發展,用戶的消費、借貸、收支等發生時序性數據逐漸累積豐富,為用戶行為的風險預測提供了可能。
用戶行為的風險預測與廣告點擊率預測、營銷響應預測、文本分類等均可抽象為二分類建模問題,通常先對用戶進行用戶畫像,根據用戶的靜態屬性、動態行為等進行數據預處理和特征工程,綜合運用統計學和業務領域知識提煉用于建模的特征,再利用邏輯回歸、決策樹、梯度提升樹等集成學習算法或者深度學習算法構建模型,并根據使用場景對模型進行離線或者在線部署,進行用戶行為的風險預測。
其中,特征工程通常需要先對用戶行為進行分類,再根據需求對不同種類的行為分時段統計,獲得次數、頻率、變化率、變化趨勢等方面對用戶進行表征從而獲取用戶的特征數據,可以看出,上述過程使得數據預處理較為復雜,且特征質量對數據質量、提取方式要求較高,導致數據預測效率較低、成本較高。
發明內容
本發明提供了一種行為數據預測方法與裝置,以解決在構建數據預測模型時進行數據預處理、特征工程等過程導致數據預測效率較低、成本較高的問題。
本發明第一方面提供了一種行為數據預測方法,該方法可以包括:
獲取當前用戶行為對應的第一機構編碼,所述第一機構編碼用于標識所述當前用戶行為發生的機構;
將所述第一機構編碼輸入預置預測模型中,獲取所述預置預測模型針對所述當前用戶行為輸出的預測結果,所述預置預測模型通過采用注意力機制對第二機構編碼以及序列編碼向量進行池化處理獲得的目標特征向量訓練得到,所述第二機構編碼用于標識歷史用戶行為發生的機構,所述序列編碼向量根據所述歷史用戶行為的發生時序以及所述第二機構編碼構建得到。
可選地,所述獲取當前用戶行為對應的第一機構編碼之前,還包括:
分別獲取至少兩個歷史用戶行為對應的第二機構編碼以及發生時序;
根據所述發生時序與所述第二機構編碼構建至少兩個所述歷史用戶行為對應的序列編碼向量;
采用注意力機制對所述序列編碼向量與所述第二機構編碼進行池化處理獲得目標特征向量;
采用所述目標特征向量進行深度神經網絡模型訓練,獲得所述預置預測模型。
可選地,所述采用注意力機制對所述序列編碼向量與所述第二機構編碼進行池化處理獲得目標特征向量,包括:
對所述序列編碼向量進行Transformer處理,獲得第一向量;
對所述序列編碼向量與所述第二機構編碼進行注意力池化處理,獲得第二向量;
根據所述第一向量與所述第二向量獲得所述目標特征向量。
可選地,所述對所述序列編碼向量與所述第二機構編碼進行注意力池化處理,獲得第二向量,包括:
將所述第二機構編碼作為第一矩陣,所述序列編碼向量作為第二矩陣進行注意力池化處理,獲得所述第二向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同盾科技有限公司;同盾控股有限公司,未經同盾科技有限公司;同盾控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110695116.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





