[發明專利]構建卷積神經網絡在審
| 申請號: | 201680086870.2 | 申請日: | 2016-06-17 |
| 公開(公告)號: | CN109643396A | 公開(公告)日: | 2019-04-16 |
| 發明(設計)人: | 曹家樂 | 申請(專利權)人: | 諾基亞技術有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06K9/00 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 酆迅;張曦 |
| 地址: | 芬蘭*** | 國省代碼: | 芬蘭;FI |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征圖 卷積 卷積神經網絡 訓練數據集 計算機程序產品 多媒體內容 信息處理 構建 更新 | ||
本公開的實施例提供了一種用于信息處理的方法、裝置和計算機程序產品。該方法包括:基于針對多媒體內容的訓練數據集,確定用于卷積神經網絡中的卷積層的卷積參數和第一特征圖;根據第一特征圖之間的相關性來改變第一特征圖的順序,以獲得第二特征圖;以及基于訓練數據集和第二特征圖來更新卷積參數。
技術領域
本公開的實施例一般地涉及信息處理,并且更特別地涉及用于構建卷積神經網絡(CNN)的方法、裝置和計算機程序產品。
背景技術
CNN已經在圖像識別、對象檢測、語音識別等應用中實現了最先進的性能。CNN的代表性應用包括阿爾法圍棋(AlphaGo)、高級駕駛員輔助系統(ADAS)、自動駕駛汽車、光學字符識別(OCR)、面部識別、大規模圖像分類(例如,ImageNet分類)、以及人機交互(HCI)。
通常,CNN被組織在兩種類型的交織層中:卷積層和池化(子采樣)層。卷積層的作用是特征表示,并且特征的語義層次隨著層的深度而增加。設計有效的卷積層以獲得穩健的特征圖(feature map)是提高CNN性能的關鍵。
發明內容
總體上,本公開的實施例包括一種用于構建CNN的方法、裝置和計算機程序產品。
在本公開的第一方面,提供了一種方法。該方法包括:基于針對多媒體內容的訓練數據集,確定用于卷積神經網絡中的卷積層的卷積參數和第一特征圖;根據第一特征圖之間的相關性來改變第一特征圖的順序,以獲得第二特征圖;以及基于訓練數據集和第二特征圖來更新卷積參數。
在一些實施例中,更新卷積參數包括:確定第一特征圖的順序的改變量;以及響應于該量大于預定閾值,更新卷積參數。
在一些實施例中,該方法進一步包括:將索引指配給第一特征圖;以及生成索引列表。
在一些實施例中,該方法進一步包括:基于第二特征圖來更新索引列表。
在一些實施例中,確定第一特征圖的順序的改變量包括:確定生成的索引列表與更新的索引列表之間的差異。
在一些實施例中,根據第一特征圖之間的相關性來改變第一特征圖的順序包括:獲得第一特征圖的表示信息;確定表示信息之間的差異;以及基于表示信息之間的差異來確定相關性。
在本公開的第二方面,提供了一種裝置。該裝置包括:至少一個處理器;以及包括計算機程序代碼的至少一個存儲器;至少一個存儲器和計算機程序代碼被配置為,與至少一個處理器一起,使得裝置至少執行:基于針對多媒體內容的訓練數據集,確定用于卷積神經網絡中的卷積層的卷積參數和第一特征圖;根據第一特征圖之間的相關性來改變第一特征圖的順序,以獲得第二特征圖;以及基于訓練數據集和第二特征圖來更新卷積參數。
在本公開的第三方面,提供了一種裝置。該裝置包括用于執行根據本公開的第一方面的方法的部件。
在本公開的第四方面,提供了一種計算機程序產品。該計算機程序產品包括至少一個計算機可讀非瞬態存儲器介質,該至少一個計算機可讀非瞬態存儲器介質具有存儲在其上的程序代碼,該程序代碼在由裝置執行時,使得裝置執行根據本公開的第一方面的方法。
將理解,發明內容不旨在標識本公開的實施例的關鍵特征或必要特征,也不旨在用于限制本公開的范圍。本公開的其他特征通過以下描述將變得易于理解。
附圖說明
通過附圖中的本公開的一些實施例的更詳細描述,本公開的上述和其他目的、特征和優點將變得更加明顯,其中:
圖1示意地示出了本公開的實施例可以被實施在其中的CNN的架構;
圖2是根據本公開的實施例的方法的流程圖;
圖3a示出了在重排序之前的特征圖的示例;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于諾基亞技術有限公司,未經諾基亞技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680086870.2/2.html,轉載請聲明來源鉆瓜專利網。





