[發明專利]深度學習模型的建立方法、樣本處理方法及裝置在審
| 申請號: | 202010438330.4 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN111814821A | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 王澤榮 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 王婷婷 |
| 地址: | 100086 北京市海淀區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 學習 模型 建立 方法 樣本 處理 裝置 | ||
本發明提供了一種深度學習模型的建立方法、樣本處理方法及裝置,通過深度學習模型,獲取訓練集中訓練樣本的第一樣本特征,以及驗證集中驗證樣本的第二樣本特征;對第一樣本特征進行歸一化處理得到第一分布特征,以及對第二樣本特征進行歸一化處理得到第二分布特征;根據第一分布特征與第二分布特征之間的距離值,確定權重值;獲取訓練集的損失函數,并通過權重值對損失函數進行加權處理,得到目標損失函數;通過目標損失函數對深度學習模型進行訓練,得到目標深度學習模型。本發明可以通過不同訓練集對應的權重值,優化不同訓練集的訓練樣本對模型參數造成的影響,從而降低了通過訓練集訓練得到的深度學習模型在驗證集中出現性能下降的幾率。
技術領域
本發明屬于計算機技術領域,特別是涉及一種深度學習模型的建立方法、樣本處理方法及裝置。
背景技術
深度學習模型源于對人工神經網絡的研究,關于深度學習模型的模型訓練過程,需要利用訓練集和驗證集中的數據,以獲取模型較高精度的參數。
在目前,深度學習模型的訓練過程,通常是從開源數據庫中支架獲取訓練集和驗證集,對訓練集和驗證集的內容不做過多關注,并將訓練集中的數據輸入深度學習模型,根據深度學習模型的輸出值以及相應的損失函數,計算得出模型的參數,之后,可以將驗證集中的數據輸入在該參數作用下深度學習模型,并根據深度學習模型的輸出,確定模型的性能優劣。
但是,目前的模型訓練方法,對訓練集和驗證集的內容本身不作過多關注,往往會由于訓練集和驗證集的數據類別或采集場景不同的原因,產生通過訓練集訓練得到的深度學習模型,在驗證集上產生性能下降的問題,從而降低了模型的訓練精度。
發明內容
本發明提供一種深度學習模型的建立方法、樣本處理方法及裝置,以便解決現有技術中由于訓練集和驗證集的數據類別或采集場景不同的原因,產生的通過訓練集訓練得到的深度學習模型,在驗證集上產生性能下降的問題。
為了解決上述技術問題,本發明是這樣實現的:
第一方面,本發明實施例提供了一種深度學習模型的建立方法,該方法可以包括:
通過深度學習模型,獲取訓練集中訓練樣本的第一樣本特征,以及驗證集中驗證樣本的第二樣本特征;
對所述第一樣本特征進行歸一化處理得到第一分布特征,以及對所述第二樣本特征進行歸一化處理得到第二分布特征;
計算所述第一分布特征與所述第二分布特征之間的距離值,并根據所述距離值,確定權重值;
獲取所述訓練集的損失函數,并通過所述權重值對所述損失函數進行加權處理,得到目標損失函數;
通過所述目標損失函數對所述深度學習模型進行訓練,得到目標深度學習模型。
第二方面,本發明實施例提供了一種樣本處理方法,該方法可以包括:
獲取待處理樣本;
將所述待處理樣本輸入目標深度學習模型進行處理,輸出針對所述待處理樣本的處理結果;
其中,所述目標深度學習模型是根據深度學習模型的建立方法所得到的。
第三方面,本發明實施例提供了一種深度學習模型的建立裝置,該深度學習模型的建立裝置可以包括:
獲取模塊,用于通過深度學習模型,獲取訓練集中訓練樣本的第一樣本特征,以及驗證集中驗證樣本的第二樣本特征;
歸一處理模塊,用于對所述第一樣本特征進行歸一化處理得到第一分布特征,以及對所述第二樣本特征進行歸一化處理得到第二分布特征;
權重模塊,用于計算所述第一分布特征與所述第二分布特征之間的距離值,并根據所述距離值,確定權重值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010438330.4/2.html,轉載請聲明來源鉆瓜專利網。





