[發明專利]一種神經網絡模型訓練方法、系統、設備及計算機介質在審
| 申請號: | 201910132624.1 | 申請日: | 2019-02-22 |
| 公開(公告)號: | CN111612139A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 佘金龍 | 申請(專利權)人: | 浙江宇視科技有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 310051 浙江省杭州市濱江區西興街道江陵路*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 神經網絡 模型 訓練 方法 系統 設備 計算機 介質 | ||
本申請公開了一種神經網絡模型訓練方法、系統、設備及計算機介質,該方法包括:獲取目標神經網絡模型在當前迭代訓練過程中的權重值;確定權重值在GSA算法中對應的粒子,并采用GSA算法確定粒子對應的第一速度值和第一位置值;通過第一速度值,采用PSO算法確定粒子對應的第二位置值;通過第一位置值、第二位置值,采用GSA算法確定粒子對應的第二速度值;通過第二速度值,采用GSA算法確定粒子對應的第三位置值;根據第一位置值和第三位置值更新權重值。本申請提供的神經網絡模型訓練方法、系統、設備及計算機可讀存儲介質,信息共享能力快、全局搜索能力強,可以提高神經網絡模型的收斂速度,同時提升神經網絡的識別精度。
技術領域
本申請涉及神經網絡模型技術領域,更具體地說,涉及一種神經網絡模型訓練方法、系統、設備及計算機介質。
背景技術
隨著神經網絡模型的應用,為了使得神經網絡模型準確性更高,要求對神經網絡模型的訓練過程更加準確。
現有的一種神經網絡模型訓練方法是:在神經網絡模型的訓練過程中,選出效果較差的濾波器組和效果較好的濾波器組,通過把較差濾波器組中的部分系數用較好濾波器組中的部分系數進行替換,從而實現卷積層濾波器之間的參數更新,用修改之后的神經網絡模型進行訓練,訓練一定次數后,對比修改后和修改前的網絡產生的誤差大小,判斷先前實現的濾波器參數更新是否有效,從兩個神經網絡模型中進行選擇,保留性能好的神經網絡模型用于后面的訓練,通過不斷地重復這個過程,最終可以訓練出一個性能優異的神經網絡模型。
然而,現有的神經網絡模型訓練方法中,主要通過人為地將較好濾波器組中的部分系數去替換較差濾波器組中的部分系數,使得神經網絡模型的準確率及收斂速度難以提升。
綜上所述,如何提高神經網絡模型的準確率及收斂速度是目前本領域技術人員亟待解決的問題。
發明內容
本申請的目的是提供一種神經網絡模型訓練方法,其能在一定程度上解決如何提高神經網絡模型的準確率及收斂速度的技術問題。本申請還提供了一種神經網絡模型訓練系統、設備及計算機可讀存儲介質。
為了實現上述目的,本申請提供如下技術方案:
一種神經網絡模型訓練方法,包括:
獲取目標神經網絡模型在當前迭代訓練過程中的權重值;
確定所述權重值在GSA算法中對應的粒子,并采用所述GSA算法確定所述粒子對應的第一速度值和第一位置值;
通過所述第一速度值,采用PSO算法確定所述粒子對應的第二位置值;
通過所述第一位置值、所述第二位置值,采用所述GSA算法確定所述粒子對應的第二速度值;
通過所述第二速度值,采用所述GSA算法確定所述粒子對應的第三位置值;
根據所述第一位置值和所述第三位置值更新所述權重值。
優選的,所述根據所述第一位置值和所述第三位置值更新所述權重值,包括:
計算所述第一位置值的第一適應度值;
計算所述第三位置值的第二適應度值;
判斷所述第二適應度值是否大于等于所述第一適應度值,若是,則基于所述第三位置值更新所述權重值,若否,則基于所述第一位置值更新所述權重值。
優選的,所述采用所述GSA算法確定所述粒子對應的第一速度值和第一位置值,包括:
采用第一GSA運算公式,計算所述粒子對應的第一速度值和第一位置值;
所述第一GSA運算公式包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江宇視科技有限公司,未經浙江宇視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910132624.1/2.html,轉載請聲明來源鉆瓜專利網。





