[發明專利]識別圖像的方法和設備在審
| 申請號: | 202010534666.0 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN112396085A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 孫辰雨;孫昌用;柳在炯;李曙炯;鄭相一;崔彰仁;韓在浚 | 申請(專利權)人: | 三星電子株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 黃曉燕;張川緒 |
| 地址: | 韓國京畿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 圖像 方法 設備 | ||
提供一種識別圖像的方法和設備。所述方法包括:獲得輸入圖像;基于輸入圖像計算神經網絡的輸入特征圖;針對神經網絡內的至少一個層的每個層,獲得所述層的輸入特征圖的多個輸入平面之中的與第一輸入通道對應的第一輸入平面;接收所述層的權重核的多個權重平面之中的與第一輸入通道對應的第一權重平面;通過累積第一輸入平面中的第一輸入元素的至少一部分與第一權重平面中的第一權重元素的至少一部分之間的乘法運算的乘法結果來生成第一累積數據;以及基于第一累積數據生成所述層的輸出特征圖的多個輸出平面之中的與第一輸出通道對應的第一輸出平面;以及基于輸出特征圖,輸出圖像識別結果。
本申請要求于2019年8月13日在韓國知識產權局提交的第10-2019-0098810號韓國專利申請和于2019年10月14日在韓國知識產權局提交的第10-2019-0127258號韓國專利申請的權益,所述韓國專利申請的全部公開出于所有目的通過引用包含于此。
技術領域
以下描述涉及識別圖像的方法和設備。
背景技術
圖像識別可通過神經網絡來實現。諸如識別(例如,語音識別和話音識別)的處理的技術自動化已經通過作為專用計算架構的處理器實現的神經網絡模型實現,該神經網絡模型在大量訓練之后可在輸入模式與輸出模式之間提供計算上直觀的映射。產生這樣的映射的訓練能力可稱為神經網絡的學習能力。此外,由于專門的訓練,這樣的專門訓練的神經網絡因此可具有針對例如可能尚未針對其訓練神經網絡的輸入模式生成相對準確的輸出的泛化能力。
發明內容
提供本發明內容,以便以簡化的形式介紹在下面的具體實施方式中進一步描述的構思的選擇。本發明內容不意圖確定要求權利的主題的關鍵特征或必要特征,也不意圖用于幫助確定要求權利的主題的范圍。
在一個總體方面,一種識別圖像的方法包括:獲得輸入圖像;基于輸入圖像計算神經網絡的輸入特征圖,其中,輸入特征圖包括多個輸入平面;針對神經網絡內的至少一個層的每個層,獲得所述層的輸入特征圖的多個輸入平面之中的與多個輸入通道中的第一輸入通道對應的第一輸入平面;接收所述層的權重核的多個權重平面之中的與第一輸入通道對應的第一權重平面;通過累積第一輸入平面中的第一輸入元素的至少一部分與第一權重平面中的第一權重元素的至少一部分之間的乘法運算的乘法結果來生成第一累積數據;以及基于第一累積數據生成所述層的輸出特征圖的多個輸出平面之中的與多個輸出通道中的第一輸出通道對應的第一輸出平面;以及基于輸出特征圖,輸出圖像識別結果,其中,所述多個輸入平面與所述多個輸入通道一一對應,所述多個權重平面與所述多個輸入通道一一對應,其中,所述多個輸出平面與所述多個輸出通道一一對應。
基于輸入圖像計算神經網絡的輸入特征圖的步驟包括:神經網絡的第i層基于作為第i層的輸入特征圖的第i-1層的輸出特征圖,輸出第i層的輸出特征圖,i為大于1的整數,其中,神經網絡的第一層接收輸入圖像,并基于輸入圖像輸出第一層的輸出特征圖作為第二層的輸入特征圖,其中,神經網絡的最后層基于前一層的輸出特征圖生成并輸出圖像識別結果。
在一個總體方面中,一種用于識別圖像的設備包括:一個或多個處理器,被配置為:獲得輸入圖像;基于輸入圖像計算神經網絡的輸入特征圖,其中,輸入特征圖包括多個輸入平面;針對神經網絡內的至少一個層的每個層,獲得所述層的輸入特征圖的多個輸入平面之中的與多個輸出通道中的第一輸入通道對應的第一輸入平面;接收所述層的權重核的多個權重平面之中的與第一輸入通道對應的第一權重平面;通過累積第一輸入平面中的第一輸入元素的至少一部分與第一權重平面中的第一權重元素的至少一部分之間的乘法運算的乘法結果來生成第一累積數據;以及基于第一累積數據生成所述層的輸出特征圖的多個輸出平面之中的與多個輸出通道中的第一輸出通道對應的第一輸出平面;基于輸出特征圖,輸出圖像識別結果,其中,所述多個輸入平面與所述多個輸入通道一一對應,所述多個權重平面與所述多個輸入通道一一對應,其中,所述多個輸出平面與所述多個輸出通道一一對應。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星電子株式會社,未經三星電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010534666.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





