[發明專利]一種權重更新方法、裝置、計算機設備和存儲介質在審
| 申請號: | 201811137906.2 | 申請日: | 2018-09-28 |
| 公開(公告)號: | CN109472345A | 公開(公告)日: | 2019-03-15 |
| 發明(設計)人: | 辛泉預;楊政 | 申請(專利權)人: | 深圳百諾名醫匯網絡技術有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 深圳市恒申知識產權事務所(普通合伙) 44312 | 代理人: | 歐志明 |
| 地址: | 518000 廣東省深圳市南山區西麗街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練樣本 神經網絡 訓練結果 偏導數 輸出 均衡因子 計算機設備 存儲介質 權重更新 修正 權重 神經元 計算神經網絡 訓練樣本數據 比例計算 損失函數 不均衡 貢獻度 更新 鏈式 求導 均衡 平衡 | ||
1.一種權重更新方法,其特征在于,包括:
計算神經網絡的各類訓練樣本的數量比例;
根據所述數量比例計算所述各類訓練樣本對應的均衡因子,所述均衡因子用于平衡所述各類訓練樣本的數量對所述神經網絡的分類結果的影響度;
在一次訓練結束后,獲取所述神經網絡的輸出層的輸出,其中,一個訓練樣本對應的所述輸出表明所述訓練樣本為所述各類訓練樣本的概率,一個訓練樣本的所述概率之和為1;
根據所述神經網絡的損失函數,計算所述神經網絡的各輸出的偏導數;
根據所述各類訓練樣本對應的均衡因子對所述各輸出的偏導數進行修正得到所述各輸出的修正偏導數;
根據鏈式求導法則、所述各輸出的修正偏導數以及所述各神經元的輸出,對所述神經網絡的輸出層和隱藏層的各權重進行更新。
2.如權利要求1所述的權重更新方法,其特征在于,所述根據所述數量比例計算所述各類訓練樣本對應的均衡因子包括:
根據所述各類訓練樣本的數量比例,分別計算所述各類訓練樣本的Pi,其中,i=1····N,所述Pi為N個類型的訓練樣本中第i個類型的訓練樣本的數量與訓練樣本總數量的比例;
根據公式:均衡因子=1-Pi,得到所述各類訓練樣本對應的均衡因子。
3.如權利要求1所述的權重更新方法,其特征在于,所述根據所述各類訓練樣本對應的均衡因子對所述各輸出的偏導數進行修正得到所述各輸出的修正偏導數包括:
將所述各輸出的偏導數與所述各輸出對應的訓練樣本類型對應的均衡因子相乘,得到所述各輸出的修正偏導數。
4.如權利要求1-3所述的權重更新方法,其特征在于,所述根據鏈式求導法則、所述各輸出的修正偏導數以及所述各神經元的輸出,對所述神經網絡的輸出層和隱藏層的各權重進行更新包括:
根據鏈式求導法則,確定所述神經網絡的輸出層和隱藏層的各權重的權重更新公式;
將所述權重更新公式中所述各輸出的偏導數,替換為對應的修正偏導數;
按照所述各權重的權重更新公式對所述神經網絡的輸出層和隱藏層的權重進行更新。
5.如權利要求4所述的權重更新方法,其特征在于,所述按照所述各權重的權重更新公式對所述神經網絡的輸出層和隱藏層的權重進行更新包括:
根據權重更新公式:W=w-Δw*L,更新所述神經網絡的輸出層和隱藏層的各權重;
其中,所述L為神經網絡的學習率,所述w為本次更新前所述神經網絡中某神經元的權重,所述W為本次更新后所述神經網絡中所述神經元的新權重,所述Δw為本次更新時所述神經元的權重的校正幅度。
6.一種權重更新裝置,其特征在于,包括:
比例計算模塊,用于計算神經網絡的各類訓練樣本的數量比例;
均衡因子計算模塊,用于根據所述數量比例計算所述各類訓練樣本對應的均衡因子,所述均衡因子用于平衡所述各類訓練樣本的數量對所述神經網絡的分類結果的影響度;
獲取模塊,用于在一次訓練結束后,獲取所述神經網絡的輸出層的輸出,其中,一個訓練樣本對應的所述輸出表明所述訓練樣本為所述各類訓練樣本的概率,一個訓練樣本的所述概率之和為1;
偏導數計算模塊,用于根據所述神經網絡的損失函數,計算所述神經網絡的各輸出的偏導數;
修正模塊,用于根據所述各類訓練樣本對應的均衡因子對所述各輸出的偏導數進行修正得到所述各輸出的修正偏導數;
權重更新模塊,用于根據鏈式求導法則、所述各輸出的修正偏導數以及所述各神經元的輸出,對所述神經網絡的輸出層和隱藏層的各權重進行更新。
7.一種計算機設備,其特征在于,包括處理器、存儲器及通信總線;
所述通信總線用于實現所述處理器和所述存儲器之間的連接通信;
所述存儲器用于存儲一個或多個程序,所述處理器用于執行所述存儲器中存儲的一個或者多個程序,以實現如權利要求1-5中任一項所述的權重更新方法的步驟。
8.一種存儲介質,其特征在于,所述存儲介質存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執行,以實現如權利要求1-5中任一項所述的權重更新方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳百諾名醫匯網絡技術有限公司,未經深圳百諾名醫匯網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811137906.2/1.html,轉載請聲明來源鉆瓜專利網。





