[發明專利]精細化圖像識別在審
| 申請號: | 201710592777.5 | 申請日: | 2017-07-19 |
| 公開(公告)號: | CN109284749A | 公開(公告)日: | 2019-01-29 |
| 發明(設計)人: | 傅建龍;梅濤 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 王茂華;羅利娜 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關注區域 局部特征 子網絡 全局特征 圖像識別 精細化 圖像 尺度 精細 對象識別 提取圖像 圖像區域 準確定位 網絡 辨識 學習 | ||
1.一種設備(100),包括:
處理單元(110);以及
存儲器(120),耦合至所述處理單元(110)并且包含存儲于其上的指令,所述指令在由所述處理單元(110)執行時使所述設備(100)執行動作,所述動作包括:
利用第一學習網絡(210)的第一子網絡(212)提取圖像(170)的全局特征(213);
利用所述第一學習網絡(210)的第二子網絡(214)、基于所述全局特征(213)確定所述圖像(170)的第一關注區域(201),所述第一關注區域(201)包括所述圖像(170)中對象的可辨識部分;
利用第二學習網絡(220)的第一子網絡(222)提取所述第一關注區域(201)的第一局部特征(223);以及
至少部分基于所述第一局部特征(223)確定所述圖像(170)中的所述對象的類別。
2.根據權利要求1所述的設備(100),其中至少部分基于所述第一局部特征(223)確定所述圖像(170)中的所述對象的類別包括:
利用所述第二學習網絡(220)的第二子網絡(324)、基于所述第一局部特征(223)確定所述圖像(170)的第二關注區域(303),所述第二關注區域(303)被包括在所述第一關注區域(201)中并且包括所述圖像(170)中所述對象的可辨識子部分;
利用第三學習網絡(330)提取所述第二關注區域(303)的第二局部特征(333);以及
至少部分基于所述第二局部特征(333)確定所述圖像(170)中的所述對象的所述類別。
3.根據權利要求2所述的設備(100),其中至少部分基于所述第二局部特征(333)確定所述圖像(170)中的所述對象的所述類別還包括:
進一步基于所述全局特征(213)和所述第一局部特征(223)中的至少一個來確定所述圖像(170)中的所述對象的所述類別。
4.根據權利要求1所述的設備(100),其中利用第二學習網絡(220)的第一子網絡(222)提取所述第一關注區域(201)的第一局部特征(223)包括:
放大所述第一關注區域(201);以及
利用所述第二學習網絡(220)的所述第一子網絡提取經放大的所述第一關注區域(201)的所述第一局部特征(223)。
5.根據權利要求1所述的設備(100),其中基于所述全局特征(213)確定所述圖像(170)的所述第一關注區域(201)包括:
利用所述第一學習網絡(210)的所述第二子網絡(214)、基于所述全局特征(213)確定指示所述第一關注區域(201)在所述圖像(170)中的位置的位置參數(215);以及
基于所述位置參數(215)從所述圖像(170)確定所述第一關注區域(201)。
6.根據權利要求1所述的設備(100),其中至少部分基于所述第一局部特征(223)確定所述圖像(170)中的所述對象的類別包括:
至少部分基于所述第一局部特征(223),從多個預定類別中確定所述圖像(170)中的所述對象的所述類別,所述多個預定類別包括所述對象所屬的一般類別中的多個細化類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710592777.5/1.html,轉載請聲明來源鉆瓜專利網。





