[發明專利]信息處理方法和裝置在審
| 申請號: | 201810084096.2 | 申請日: | 2018-01-29 |
| 公開(公告)號: | CN108256632A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 姜志超 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 目標卷 積層 方法和裝置 輸入信息 權重 卷積神經網絡 獲取目標 卷積運算 輸出信息 輸入目標 卷積 取整 量化 申請 | ||
本申請實施例公開了信息處理方法和裝置。該方法的一具體實施方式包括:獲取目標卷積神經網絡的目標卷積層的初始輸入信息;對初始輸入信息進行量化取整,得到整數輸入值;將整數輸入值輸入目標卷積層,并與目標卷積層的權重進行卷積運算,生成輸出信息;其中,目標卷積層的權重為整數。該實施方式有助于提高信息處理的速度。
技術領域
本申請實施例涉及計算機技術領域,具體涉及神經網絡技術領域,尤其涉及信息處理方法和裝置。
背景技術
深度學習的概念源于人工神經網絡的研究。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示。深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據,例如圖像,聲音和文本。
同機器學習方法一樣,深度機器學習方法也有監督學習與無監督學習之分。不同的學習框架下建立的學習模型很是不同。例如,卷積神經網絡(Convolution NeuralNetwork,簡稱CNN)就是一種深度的監督學習下的機器學習模型;而深度置信網(DeepBelief Net,簡稱DBN)就是一種無監督學習下的機器學習模型。
發明內容
本申請實施例提出了信息處理方法和裝置。
第一方面,本申請實施例提供了一種信息處理方法,包括:獲取目標卷積神經網絡的目標卷積層的初始輸入信息;對初始輸入信息進行量化取整,得到整數輸入值;將整數輸入值輸入目標卷積層,并與目標卷積層的權重進行卷積運算,生成輸出信息;其中,目標卷積層的權重為整數。
在一些實施例中,目標卷積神經網絡通過以下訓練步驟得到:獲取卷積神經網絡的目標卷積層的初始輸入值和初始權重;根據預置的量化比例,確定對輸入值和權重的量化方式是否為多階段量化;響應于確定對輸入值和權重的量化方式是多階段量化,根據初始輸入值和初始權重,分別生成第一輸入值集合和第一權重集合;從預置的量化比例中,獲取當前階段的量化比例;根據當前階段的量化比例,對第一輸入值集合中的各第一輸入值和第一權重集合中的各第一權重分別進行量化取整,生成第二輸入值集合和第二權重集合,其中,第二權重集合中包括量化取整后的第一權重;執行以下確定步驟:將第二權重集合作為目標卷積層的權重,并確定當前階段的總量化比例是否達到預設比例值;響應于確定當前階段的總量化比例達到預設比例值,生成目標卷積神經網絡。
在一些實施例中,目標卷積神經網絡的訓練步驟還包括:響應于確定當前階段的總量化比例未達到預設比例值,根據損失函數對當前階段的卷積神經網絡進行訓練,以調整第二權重集合中未量化取整的第一權重,直至損失函數的值趨于目標值;從預置的量化比例中,獲取下一階段的量化比例作為當前階段的量化比例;根據當前階段的量化比例,對第二輸入值集合中未量化取整的第一輸入值和第二權重集合中未量化取整的第一權重分別進行量化取整,并繼續執行上述確定步驟。
在一些實施例中,根據當前階段的量化比例,對第一輸入值集合中的各第一輸入值和第一權重集合中的各第一權重分別進行量化取整,包括:根據當前階段的量化比例,在第一輸入值集合和第一權重集合中分別選取相應數量的第一輸入值和第一權重進行量化取整,其中,選取包括按照數值由大到小,從數值大的一端選取,或者按照量化誤差由小到大,從誤差小的一端選取。
在一些實施例中,目標卷積神經網絡的訓練步驟還包括:響應于確定對輸入值和權重的量化方式不是多階段量化,根據量化編碼的位數,將初始輸入值的范圍和初始權重的范圍分別劃分為預設數目個子區間,其中,預設數目與量化編碼的位數正相關;根據位于預設數目個子區間中的各初始輸入值和各初始權重,分別生成第三輸入值集合和第三權重集合;對第三輸入值集合中的各第三輸入值和第三權重集合中的各第三權重分別進行量化取整,生成第四輸入值集合和第四權重集合;將第四輸入值集合作為輸入,將第四權重集合作為目標卷積層的權重,進行卷積運算;利用反向傳播算法對初始權重進行修正,直至卷積神經網絡滿足預設條件,生成目標卷積神經網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810084096.2/2.html,轉載請聲明來源鉆瓜專利網。





