[發明專利]一種圖像識別方法和裝置在審
| 申請號: | 202011553934.X | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112598062A | 公開(公告)日: | 2021-04-02 |
| 發明(設計)人: | 黃高;王語霖;呂康晨 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08;G06N3/04 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 蔣冬梅;栗若木 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 識別 方法 裝置 | ||
1.一種圖像識別方法,其特征在于,所述方法包括:
獲取待識別圖像;
從所述待識別圖像中隨機裁剪出具有預設圖像大小的圖像塊;
將所述圖像塊輸入預先訓練好的神經網絡分類模型,獲取所述圖像塊的分類結果;所述分類結果是指所述圖像塊被分類到預設的一種或多種圖像類型中;
根據所述分類結果確定分類置信度;所述分類置信度是指所述圖像塊被分類到每種圖像類型中的概率;
根據所述分類置信度確定是否將當前分類結果作為對應的待識別圖像的最終圖像識別結果;其中,當不能將當前分類結果作為最終圖像識別結果時,以迭代計算的形式,根據所述特征圖和預先建立并訓練好的定位策略網絡重新獲得下一個圖像塊,并根據所述下一個圖像塊獲取下一個分類置信度,直至根據獲得的分類置信度確定出將當前分類結果作為對應的待識別圖像的最終圖像識別結果。
2.根據權利要求1所述的圖像識別方法,其特征在于,所述神經網絡分類模型包括:特征提取網絡和全連接層;
所述將所述圖像塊輸入預先訓練好的神經網絡分類模型,獲取所述圖像塊的分類結果包括:
將所述圖像塊輸入預先建立并訓練好的特征提取網絡中,獲取特征圖,并將所述特征圖輸入預先建立并訓練好的全連接層,獲取所述圖像塊的分類結果。
3.根據權利要求1所述的圖像識別方法,其特征在于,所述根據所述分類置信度確定是否將當前分類結果作為對應的待識別圖像的最終圖像識別結果包括:
當所述分類置信度大于或等于預設閾值時,確定將當前分類結果作為所述待識別圖像的最終圖像識別結果;
當所述分類置信度小于所述預設閾值時,確定不能將當前分類結果作為所述待識別圖像的最終圖像識別結果。
4.根據權利要求2所述的圖像識別方法,其特征在于,所述以迭代計算的形式,根據所述特征圖和預先建立并訓練好的定位策略網絡重新獲得下一個圖像塊,并根據所述下一個圖像塊獲取下一個分類置信度,直至根據獲得的分類置信度確定出將當前分類結果作為對應的待識別圖像的最終圖像識別結果包括:
41、將上一次獲取的特征圖輸入預先建立的定位策略網絡,獲取下一步需要裁剪的圖像塊位置歸一化坐標;根據所述圖像塊位置歸一化坐標剪裁下一個圖像塊;
42、將所述圖像塊輸入預先建立并訓練好的特征提取網絡中,獲取特征圖,并將所述特征圖輸入預先建立并訓練好的全連接層,獲取所述圖像塊的分類結果;根據所述分類結果確定分類置信度;
43、根據所述分類置信度確定是否將當前分類結果作為最終圖像識別結果;是,進入步驟44;否,返回步驟41;
44、輸出當前分類結果。
5.根據權利要求2或4所述的圖像識別方法,其特征在于,
所述特征提取網絡包括:多個按照殘差神經網絡ResNet規則或緊密連接的神經網絡DenseNet規則排列的函數層;和/或,
所述定位策略網絡包括:多個卷積層和一個全連接層,所述卷積層和所述全連接層順序排列。
6.根據權利要求5所述的圖像識別方法,其特征在于,所述方法還包括:根據下述第一計算式對所述特征提取網絡的參數Θg和所述全連接層的參數Θm進行訓練:
其中,log[·]表示對數函數,表示求得函數值最小時對應的Θg、Θm的值,g(xi,Θg)表示將任意的第i個圖像xi輸入參數為Θg的特征提取網絡g(x,Θg)所得的特征圖,表示圖像xi對應的分類結果m(g(xi,Θg),Θm)中的第yi個元素,yi為圖像xi中定義的類別標簽;表示最終得到的優化后參數;i為正整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011553934.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種聚乙烯雙壁波紋管及其制備方法
- 下一篇:一種產婦用治療支撐裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





