[發明專利]商品排序神經網絡模型訓練方法、裝置、電子設備在審
| 申請號: | 201910656545.0 | 申請日: | 2019-07-19 |
| 公開(公告)號: | CN110503186A | 公開(公告)日: | 2019-11-26 |
| 發明(設計)人: | 蘇義偉 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06Q30/02 |
| 代理公司: | 11319 北京潤澤恒知識產權代理有限公司 | 代理人: | 任亞娟<國際申請>=<國際公布>=<進入 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡模型 排序 隱層 模型參數 訓練樣本 維度 計算機技術領域 隨機初始化 模型訓練 樣本數據 初始化 遷移 申請 網絡 | ||
本申請實施例公開了一種商品排序神經網絡模型訓練方法,屬于計算機技術領域,有助于提升模型訓練效率。所述方法包括:將預先訓練的商家排序神經網絡模型的部分模型參數遷移至商品排序神經網絡模型,以根據所述部分模型參數初始化商品排序神經網絡模型的第一網絡中部分隱層的參數,以及,隨機初始化所述商品排序神經網絡模型中除所述部分隱層之外的各隱層的參數;分別獲取各商品訓練樣本的商家維度特征和商品維度特征,構造相應商品訓練樣本的樣本數據,訓練所述商品排序神經網絡模型。
技術領域
本申請涉及計算機技術領域,特別是涉及一種商品排序神經網絡模型訓練方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
在商品排序場景中,通常的做法是搜集商品樣本,然后,基于預設的商品特征維度提取搜集的商品樣本的商品特征,之后,基于提取的商品特征訓練商品排序神經網絡模型,以輸出商品的下單概率等用于商品排序的指標得分。通過這種方式訓練商品排序神經網絡模型,需要獲取大量的訓練樣本。由于商品樣本存在樣本稀疏的特點,導致在模型訓練過程中,模型不容易收斂,需要反復學習和調整模型參數,訓練效率比較低。并且,通過這種方法訓練的神經網絡模型輸出的商品排序的指標得分的準確度直接受商品樣本的數量的影響,在商品樣本稀疏的情況下,通過訓練的神經網絡模型輸出的商品排序的指標得分準確率會降低。
因此,為了提升商品排序神經網絡模型的訓練效率,需要一種商品排序神經網絡模型的訓練方法,能夠在商品樣本稀疏的情況下訓練輸出準確的排序指標得分的商品排序神經網絡模型。
發明內容
本申請實施例提供一種商品排序神經網絡模型訓練方法,有助于提升訓練得到商品排序神經網絡模型的訓練效率。
為了解決上述問題,第一方面,本申請實施例提供了一種商品排序神經網絡模型訓練方法,包括:
所述商品排序神經網絡模型包括并行設置的第一網絡和第二網絡,所述第一網絡的網絡結構與商家排序神經網絡模型匹配,所述方法包括:
將預先訓練的商家排序神經網絡模型的部分模型參數遷移至商品排序神經網絡模型,以根據所述部分模型參數初始化所述商品排序神經網絡模型的第一網絡中部分隱層的參數,以及,隨機初始化所述商品排序神經網絡模型中除所述部分隱層之外的各隱層的參數;
分別獲取各商品訓練樣本的商家維度特征和商品維度特征,構造相應商品訓練樣本的樣本數據;
對于每個所述商品訓練樣本,將所述商品訓練樣本的商家維度特征作為所述第一網絡的輸入,并將所述商品訓練樣本的所述商品維度特征作為所述第二網絡的輸入,訓練所述商品排序神經網絡模型。
第二方面,本申請實施例提供了一種商品排序神經網絡模型訓練裝置,包括:
所述商品排序神經網絡模型包括并行設置的第一網絡和第二網絡,所述第一網絡的網絡結構與商家排序神經網絡模型匹配,所述裝置包括:
商品排序模型初始化模塊,用于將預先訓練的商家排序神經網絡模型的部分模型參數遷移至商品排序神經網絡模型,以根據所述部分模型參數初始化所述商品排序神經網絡模型的第一網絡中部分隱層的參數,以及,隨機初始化所述商品排序神經網絡模型中除所述部分隱層之外的各隱層的參數;
商品訓練樣本構建模塊,用于分別獲取各商品訓練樣本的商家維度特征和商品維度特征,構造相應商品訓練樣本的樣本數據;
商品排序模型訓練模塊,用于對于每個所述商品訓練樣本,將所述商品訓練樣本的商家維度特征作為所述第一網絡的輸入,并將所述商品訓練樣本的所述商品維度特征作為所述第二網絡的輸入,訓練所述商品排序神經網絡模型。
第三方面,本申請實施例還公開了一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現本申請實施例所述的商品排序神經網絡模型訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910656545.0/2.html,轉載請聲明來源鉆瓜專利網。





