[發明專利]神經網絡處理方法、裝置、電子設備和存儲介質在審
| 申請號: | 201910897451.2 | 申請日: | 2019-09-23 |
| 公開(公告)號: | CN110610238A | 公開(公告)日: | 2019-12-24 |
| 發明(設計)人: | 李益永;林哲;王文斕;吳曉東;劉建強;許佳 | 申請(專利權)人: | 廣州虎牙科技有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08 |
| 代理公司: | 11463 北京超凡宏宇專利代理事務所(特殊普通合伙) | 代理人: | 張欣欣 |
| 地址: | 511400 廣東省廣州市番禺*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡模型 目標函數 神經網絡參數 神經網絡處理 神經網絡分析 存儲介質 電子設備 分析處理 分析函數 更新處理 解釋性 預設 申請 | ||
本申請提供的神經網絡處理方法、裝置、電子設備和存儲介質,涉及神經網絡分析處理技術領域。在本申請中,首先,可以基于待處理的神經網絡模型中的神經網絡參數建立目標函數;其次,可以基于預設的分析函數對所述目標函數進行分析處理,得到分析結果;然后,可以基于所述分析結果對所述神經網絡模型進行更新處理。通過上述方法,可以改善現有技術中在對神經網絡模型進行處理時存在的可解釋性差的問題。
技術領域
本申請涉及神經網絡分析處理技術領域,具體而言,涉及一種神經網絡處理方法、裝置、電子設備和存儲介質。
背景技術
神經網絡模型作為一種算法模型,在對信息或數據進行處理時,具有自學習和高速尋找最優解等能力,因而,被廣泛應用。其中,基于工程的一些需要,在實際應用過程中可能會對當前的神經網絡模型進行更新處理,而得到滿足需求的神經網絡模型。
經發明人研究發現,現有的對神經網絡模型進行更新處理的技術,一般存在著可解釋性差的問題。
發明內容
有鑒于此,本申請的目的在于提供一種神經網絡處理方法、裝置、電子設備和存儲介質,以改善現有技術中在對神經網絡模型進行處理時存在的可解釋性差的問題。
為實現上述目的,本申請實施例采用如下技術方案:
一種神經網絡處理方法,包括:
基于待處理的神經網絡模型中的神經網絡參數建立目標函數;
基于預設的分析函數對所述目標函數進行分析處理,得到分析結果;
基于所述分析結果對所述神經網絡模型進行更新處理。
在本申請實施例較佳的選擇中,在上述神經網絡處理方法中,所述基于待處理的神經網絡模型中的神經網絡參數建立目標函數的步驟,包括:
獲取待處理的神經網絡模型中的批量歸一化參數、通道參數、卷積核參數和特征參數;
根據所述批量歸一化參數、所述通道參數、所述卷積核參數和所述特征參數建立目標函數。
在本申請實施例較佳的選擇中,在上述神經網絡處理方法中,所述根據所述批量歸一化參數、所述通道參數、所述卷積核參數和所述特征參數建立目標函數的步驟,包括:
根據所述批量歸一化參數、所述通道參數、所述卷積核參數和所述特征參數分別建立第一目標函數和/或第二目標函數;
其中,所述第一目標函數用于表征所述神經網絡模型中每個輸入通道的貢獻程度,所述第二目標函數用于表征所述神經網絡模型中每個輸出通道的貢獻程度。
在本申請實施例較佳的選擇中,在上述神經網絡處理方法中,所述第一目標函數包括:
W=n*c*kh*kw;
其中,Y為各所述輸出通道的張量拉成的向量,該向量的大小為n*h0*w0,Yi為每個輸入通道的輸入特征對輸出通道的貢獻分量,該貢獻分量的大小為n*h0*w0,αi和βi為批量歸一化參數,Ai為一個矩陣,該矩陣的行數為n*h0*w0、列數為h*w,Xi為服從正態分布的向量,該向量的大小為h*w,e為全1向量,該向量的大小為h*w;
n為輸出通道的數量,c為輸入通道的數量,h0*w0為一個輸出通道的大小,h*w為一個輸入特征的大小,kh*kw為一個卷積核的大小。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州虎牙科技有限公司,未經廣州虎牙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910897451.2/2.html,轉載請聲明來源鉆瓜專利網。





