[發明專利]構建模型的方法、裝置、電子設備和存儲介質在審
| 申請號: | 202110262260.6 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112990480A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 江攀;葉舟 | 申請(專利權)人: | 北京嘀嘀無限科技發展有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京睿派知識產權代理事務所(普通合伙) 11597 | 代理人: | 劉鋒 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 構建 模型 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提出了一種構建模型方法、裝置、電子設備和存儲介質。本發明實施例的構建模型方法包括:獲取目標參數;根據目標參數和自動特征選擇模型選擇與所述目標參數相關的目標特征,所述特征選擇模型以經過用戶授權的用戶數據為訓練數據采用強化學習算法訓練獲得,所述用戶數據包括嵌入向量和特征,所述嵌入向量通過特征提取模型從用戶行為數據中提取,用于表征用戶行為,所述特征經過預先標注,所述嵌入向量和所述特征預先存儲在數據庫中;以所述目標參數相關的目標特征為輸入,目標參數為輸出訓練模型,以確定目標模型。本發明實施例的構建模型的方法通過嵌入向量來確定目標特征,能夠提高模型訓練的效率。
技術領域
本發明實施例涉及計算機技術領域,具體而言,涉及一種構建模型的方法、裝置、電子設備和存儲介質。
背景技術
隨著電子技術迅速發展,用戶行為在網絡上產生龐大的數據。通過數據分析能把隱藏在一大批看來雜亂無章的數據中的信息集中和提煉出來,從而找出所研究對象的內在規律。通常會通過構建數據模型來對數據進行分析。然而,在數學模型訓練的過程中,模型的開發周期很長,效率低,因此需要一種能夠自動化構建模型的方法。
發明內容
本發明實施例正是基于上述問題,提出了一種新的技術方案,通過根據特征選擇模型確定與目標參數相關的目標特征,根據目標特征訓練目標模型。能夠實現特征的自動化選擇,提高模型的訓練效率。
根據本發明實施例的第一方面,提出了一種構建模型方法,所述構建模型方法包括:
獲取目標參數,所述目標參數用于表征與用戶相關的行為偏好;
根據目標參數和自動特征選擇模型選擇與所述目標參數相關的目標特征,所述特征選擇模型以經過用戶授權的用戶數據為訓練數據采用強化學習算法訓練獲得,所述用戶數據包括嵌入向量和特征,所述嵌入向量通過特征提取模型從用戶行為數據中提取,用于表征用戶行為,所述特征為經過預先標注的用戶屬性,所述嵌入向量和所述特征預先存儲在數據庫中;以及
以所述目標參數相關的目標特征為輸入,目標參數為輸出訓練模型,以確定目標模型,所述目標模型用于預測用戶的行為。
優選地,提取所述嵌入向量包括:
根據用戶行為數據確定用戶的時序矩陣;
將所述時序矩陣進行嵌入處理,以生成初始向量;
將所述初始向量進行卷積操作,以生成多個卷積向量;
將多個所述卷積向量進行全局平均池化以及全連接,以提取嵌入向量。
優選地,所述嵌入處理包括:CBOW算法和Skip-Gram算法處理所述時序矩陣。
優選地,所述卷積操作包括:
將所述擴展向量進行卷積降維處理;以及
將降維處理得到的向量進行多維卷積,以生成多個不同的卷積向量。
優選地,所述以所述目標參數相關的目標特征為輸入,目標參數為輸出訓練模型,包括:
采用網格搜索、隨機搜索以及貝葉斯優化中的任一方法自動調參。
優選地,所述方法還包括:
響應于模型衰減小于預定閾值,自動更新所述目標模型;以及
響應于模型衰減大于預定閾值,再次根據目標參數和自動特征選擇模型選擇與所述目標參數相關的目標特征,以再次訓練目標模型。
根據本發明實施例的第三方面,提出了一種構建模型裝置,所述裝置包括:
參數獲取單元,用于獲取目標參數,所述目標參數用于表征與用戶相關的行為偏好;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司,未經北京嘀嘀無限科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110262260.6/2.html,轉載請聲明來源鉆瓜專利網。





