[發明專利]一種神經網絡的訓練方法及系統在審
| 申請號: | 202011583732.X | 申請日: | 2020-12-28 |
| 公開(公告)號: | CN112668698A | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 戶磊;劉沖沖;朱海濤;付賢強;何武 | 申請(專利權)人: | 北京的盧深視科技有限公司;合肥的盧深視科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 楊明月 |
| 地址: | 100083 北京市海淀區學院*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 神經網絡 訓練 方法 系統 | ||
本發明提供一種神經網絡的訓練方法及系統,該方法包括:將樣本數據輸入到目標神經網絡中,獲取所述樣本數據對應的預測標簽;根據樣本標簽和所述預測標簽之間的偏差程度,判斷所述樣本標簽是否正確;若判斷得知所述樣本標簽錯誤,則不利用所述樣本數據和所述樣本標簽對所述目標神經網絡進行訓練。本發明通過比較樣本數據的樣本標簽和預測標簽之間的偏差,來判定樣本數據對應的樣本標簽是否正確,并只利用正確的樣本標簽對目標神經網絡進行訓練,避免了錯誤的樣本標簽對神經網絡進行訓練帶來的精度影響,提高了目標神經網絡的訓練精度。
技術領域
本發明涉及計算機及人工智能技術領域,尤其涉及一種神經網絡的訓練方法及系統。
背景技術
基于深度學習原理的分類器已被廣泛應用于人們的生產生活中,比如反動、色情暴力圖片的分類器,可用于凈化互聯網環境,缺陷工件圖片的分類器,能夠快速篩選出缺陷工件等等。
然而,基于深度學習原理的分類器在訓練時,依賴大量的數據支持,這些數據一般并非只需要采集到即可,還需要付諸大量的人力物力予以標注,最終分類器的性能受標注質量影響很大。
而大規模數據的標注質量常常良莠不齊,甚至出現明顯的錯誤標注。使用含有錯誤標注的數據訓練的分類器難以達到最優性能,反而會讓分類器網絡變得復雜,泛化能力差。
因此,利用錯誤標注的數據樣本會使得神經網絡的訓練精度降低。
發明內容
本發明提供一種神經網絡的訓練方法及系統,用以解決現有技術中因標注信息錯誤而導致神經網絡訓練精度低的缺陷,實現錯誤標注信息的篩選,從而提高神經網絡的訓練精度。
本發明提供一種神經網絡的訓練方法,包括:
將樣本數據輸入到目標神經網絡中,獲取所述樣本數據對應的預測標簽;
根據樣本標簽和所述預測標簽之間的偏差程度,判斷所述樣本標簽是否正確;
若判斷得知所述樣本標簽錯誤,則不利用所述樣本數據和所述樣本標簽對所述目標神經網絡進行訓練。
根據本發明提供的一種神經網絡的訓練方法,還包括:
若判斷獲知所述樣本標簽正確,則利用所述樣本數據和所述樣本標簽對所述目標神經網絡進行訓練。
根據本發明提供的一種神經網絡的訓練方法,將樣本數據輸入到目標神經網絡中,獲取所述樣本數據對應的預測標簽,包括:
將所述目標神經網絡切分為特征提取模塊和目標分類器;
對所述目標分類器進行復制,獲取多個目標分類器,所述目標分類器的學習參數兩兩不同;
將所述樣本數據輸入到所述特征提取模塊中,獲取樣本特征;
將所述樣本特征分別輸入到每一目標分類器中,獲取每一目標分類器對所述樣本數據的預測標簽,即為所述樣本數據對應的預測標簽。
根據本發明提供的一種神經網絡的訓練方法,所述根據所述樣本標簽和所述預測標簽之間的偏差程度,判斷所述樣本標簽是否正確,包括:
若判斷得知所述樣本標簽與所有目標分類器對所述樣本數據的預測標簽之間的偏差均大于預設閾值,則判斷所述樣本標簽錯誤。
根據本發明提供的一種神經網絡的訓練方法,所述根據所述樣本標簽和所述預測標簽之間的偏差程度,判斷所述樣本標簽是否正確,還包括:
若判斷得知所述樣本標簽與所有目標分類器對所述樣本數據的預測標簽之間的偏差均大于預設閾值,則根據所述樣本標簽與所有目標分類器對所述樣本數據的預測標簽之間的偏差,獲取平均偏差;
根據所述平均偏差和所述預設閾值,獲取隨機閾值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京的盧深視科技有限公司;合肥的盧深視科技有限公司,未經北京的盧深視科技有限公司;合肥的盧深視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011583732.X/2.html,轉載請聲明來源鉆瓜專利網。





