[發明專利]用于對圖像中的對象分類的方法和系統有效
| 申請號: | 201580085497.4 | 申請日: | 2015-11-13 |
| 公開(公告)號: | CN108475339B | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | 王曉剛;曾星宇;歐陽萬里 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06V10/44;G06N3/04;G06N3/08 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;王艷春 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 圖像 中的 對象 分類 方法 系統 | ||
1.一種用于對圖像中的對象分類的方法,包括:
獲得每個所述圖像的至少一個候選限界框,其中每個候選限界框含有待分類的一個對象;
通過特征學習CNN從每個所述候選限界框提取外觀特征;
基于所提取的外觀特征計算每個候選限界框的n-分類得分;以及
將每個候選限界框中的對象分類為n個類別中的一個類別,其中n是大于1的整數,
其中,訓練所述特征學習CNN包括:
用微調圖像集合訓練具有第一數目的節點的第一輸出層和具有所述第一數目的整數倍的節點的第二輸出層的第二CNN,
用經過訓練的第二CNN的神經參數初始化第三CNN;
用所述微調圖像集合訓練所述第三CNN;
為經過訓練的第三CNN添加第二數目的輸出層,其中所述第二數目的輸出層中的每個輸出層用于n-類別分類;用所述第三CNN的神經參數初始化第四CNN ;
用具有n個節點的新輸出層替換所述第四CNN的輸出層;以及
用所述微調圖像集合微調所述第四CNN以獲得所述特征學習CNN,
其中,所述微調圖像集合中的每個微調訓練圖像具有至少一個真值限界框和至少一個候選限界框,以及
其中,通過根據每個所述微調訓練圖像的每個候選限界框和其對應真值限界框在每個所述微調訓練圖像中的相對位置和大小關系對所述微調訓練圖像聚類來確定所述第一數目。
2.根據權利要求1所述的方法,其中,通過以下操作訓練所述第二CNN:
用經過預訓練圖像集合預訓練過的第一CNN的神經參數初始化所述第二CNN;
用兩個新的神經層替換所述第二CNN的輸出層;以及
用所述微調圖像集合訓練所述第二CNN。
3.根據權利要求2所述的方法,其中,所述預訓練圖像集合中的每個預訓練圖像具有至少一個真值限界框。
4.根據權利要求1所述的方法,其中,通過根據所述微調訓練圖像的所述真值限界框在每個所述微調訓練圖像中的相對位置和大小關系對所述微調訓練圖像集合聚類來確定所述第二數目。
5.根據權利要求2所述的方法,進一步包括:
基于在每個所述微調訓練圖像中所述真值限界框與所述對應候選限界框之間的重疊計算損失函數;以及
反向傳播通過所述第一CNN、所述第二CNN和所述第三CNN中的至少一個直到所述損失函數最小化,從而確定出所述第一CNN、所述第二CNN和所述第三CNN的神經參數。
6.根據權利要求1所述的方法,其中,在所述提取之前所述方法進一步包括:
裁剪每個所述候選限界框;以及
旋轉經過裁剪的所述候選限界框。
7.根據權利要求1所述的方法,其中,在所述提取之前所述方法進一步包括:
提取特征之前,按照因子縮放每個所述候選限界框。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580085497.4/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





