[發明專利]一種基于MASK RCNN網絡模型的目標識別方法、裝置在審
| 申請號: | 201911378116.8 | 申請日: | 2019-12-27 |
| 公開(公告)號: | CN111160527A | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | 宋秀峰 | 申請(專利權)人: | 歌爾股份有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京市隆安律師事務所 11323 | 代理人: | 權鮮枝;朱營琢 |
| 地址: | 261031 山東省濰*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 mask rcnn 網絡 模型 目標 識別 方法 裝置 | ||
1.一種基于MASK RCNN網絡模型的目標識別方法,其特征在于,所述方法包括:
確定一多階段網絡作為基礎網絡;
在所述基礎網絡中選取至少一個能提取出特征圖的中間層,將所述中間層輸出的特征圖和所述基礎網絡的末端層輸出的特征圖分別輸入對應的MASK RCNN識別網絡,從而構建出基于MASK RCNN網絡模型,其中所述中間層輸出的特征圖和末端層輸出的特征圖具有不同的尺寸;
利用數據集對各所述MASKRCNN識別網絡進行訓練,直至滿足預設的訓練結束條件停止訓練;
利用訓練好的各所述MASKRCNN識別網絡對所述目標進行識別。
2.如權利要求1所述的方法,其特征在于,所述在所述基礎網絡中選取至少一個能提取出特征圖的中間層包括:
選取兩個中間層,所述兩個中間層能夠提取出不同尺寸的低層特征圖和高層特征圖;
利用所述低層特征圖構建的第一目標識別網絡識別第一目標;
利用所述高層特征圖構建的第二目標識別網絡識別第二目標;
利用所述基礎網絡的末端層輸出的特征圖構建的識別第三識別網絡識別第三目標;
其中第一目標的尺寸小于第二目標的尺寸,第二目標的尺寸小于第三目標的尺寸。
3.如權利要求1或2所述的方法,其特征在于,所述中間層包括第一類型和第二類型,所述第一類型包括卷積層和激活函數,所述第二類型包括卷積層、激活函數和池化層。
4.如權利要求2所述的方法,其特征在于,所述利用所述低層特征圖構建的第一目標識別網絡識別第一目標包括:
在所述第一目標識別網絡的RPN網絡中,設置ratios參數值和scales參數值使得所述低層特征圖中每個像素對應于所述第一識別網絡輸入的圖像中大于預設閾值個數的錨框區域,從而能夠涵蓋樣本圖像中的第一目標。
5.如權利要求4所述的方法,其特征在于,所述利用所述低層特征圖構建的第一目標識別網絡識別第一目標還包括:
判斷所述錨框區域是否為第一目標,若是第一目標則根據該錨框區域的交并比值自適應調整所述第一目標識別網絡中的交并比參數值。
6.如權利要求4或5所述的方法,其特征在于,所述判斷所述第一目標識別網絡的RPN網絡中的錨框區域是否為第一目標,若是第一目標則根據該錨框區域的交并比值自適應調整所述第一目標識別網絡中的交并比參數值包括:
預設標準區域的面積和標準區域交并比值,所述標準區域是第二目標和第一目標的臨界區域;
確定所述錨框區域的面積,根據所述錨框區域與所述標準區域的面積比值和標準區域交并比值的乘積確定所述錨框區域交并比值;
判斷所述錨框區域交并比值與所述標準區域交并比值的大小,若所述錨框區域交并比值小于所述標準區域交并比值,且所述錨框區域對應的目標確定為第一目標,則將所述錨框區域交并比值設置為所述識別第一目標識別網絡的交并比參數值,從而實現所述識別第一目標網絡模型的交并比參數值自適應調整。
7.如權利要求1所述的方法,其特征在于,所述利用經過預處理的數據集對所述目標識別模型進行訓練包括:
選取或拍攝不同角度、不同距離、不同大小的目標圖像,對所述目標圖像進行歸一化處置,生成所述數據集;或者,
選取或拍攝不同角度、不同距離但大小相同的目標圖像生成所述數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于歌爾股份有限公司,未經歌爾股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911378116.8/1.html,轉載請聲明來源鉆瓜專利網。





