[發(fā)明專利]用于實例分割的模型及訓練方法,實例分割網(wǎng)絡有效
| 申請?zhí)枺?/td> | 202010745430.1 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN112001401B | 公開(公告)日: | 2022-12-09 |
| 發(fā)明(設計)人: | 王立;范寶余;郭振華;趙雅倩 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V10/50;G06V10/74;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產(chǎn)權代理有限公司 11227 | 代理人: | 王云曉 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 實例 分割 模型 訓練 方法 網(wǎng)絡 | ||
1.一種用于實例分割的模型,其特征在于,包括:特征提取網(wǎng)絡、檢測分割頭部網(wǎng)絡、直方圖頭部網(wǎng)絡和損失計算模塊,其中;
所述特征提取網(wǎng)絡,用于對圖像進行處理,以獲得多個候選框;
所述檢測分割頭部網(wǎng)絡,用于對所述多個候選框攜帶的時域信息進行處理,以輸出所述圖像中的各個目標;
所述直方圖頭部網(wǎng)絡,用于對所述多個候選框攜帶的頻域信息進行處理,以輸出預測直方圖;
所述損失計算模塊,用于計算所述目標的目標損失值和所述預測直方圖的直方圖損失值,并基于所述目標損失值和所述直方圖損失值優(yōu)化所述特征提取網(wǎng)絡、所述檢測分割頭部網(wǎng)絡和所述直方圖頭部網(wǎng)絡分別對應的訓練參數(shù);
其中,所述直方圖頭部網(wǎng)絡包括:目標子網(wǎng)和輸出層;所述目標子網(wǎng)包括注意力子網(wǎng)、包括至少一個卷積層的卷積子網(wǎng)、包括至少一個全連接層的全連接子網(wǎng)中的任一個或組合;
所述注意力子網(wǎng)和/或所述卷積子網(wǎng),用于確定各個候選框中不同像素點之間的關系,并根據(jù)所述關系生成關系頻域信息;
所述全連接子網(wǎng),用于提取各個候選框中的特征頻域信息;
所述輸出層,用于根據(jù)所述關系頻域信息和/或所述特征頻域信息生成所述預測直方圖;
其中,所述直方圖頭部網(wǎng)絡設置在所述檢測分割頭部網(wǎng)絡中,或設置在所述檢測分割頭部網(wǎng)絡外;
所述直方圖頭部網(wǎng)絡設置于所述檢測分割頭部網(wǎng)絡中時,連接于所述特征提取網(wǎng)絡的輸出端;或所述直方圖頭部網(wǎng)絡設置于所述檢測分割頭部網(wǎng)絡中時,連接于所述檢測分割頭部網(wǎng)絡中的分割頭部網(wǎng)絡的輸出端,所述分割頭部網(wǎng)絡連接于所述特征提取網(wǎng)絡的輸出端;
所述直方圖頭部網(wǎng)絡設置在所述檢測分割頭部網(wǎng)絡外時,所述特征提取網(wǎng)絡、所述檢測分割頭部網(wǎng)絡、所述直方圖頭部網(wǎng)絡和所述損失計算模塊并列設置。
2.根據(jù)權利要求1所述的模型,其特征在于,
若所述目標子網(wǎng)包括所述注意力子網(wǎng)和所述卷積子網(wǎng),則所述注意力子網(wǎng)的輸出端連接于所述卷積子網(wǎng)的輸入端;
若所述目標子網(wǎng)包括所述卷積子網(wǎng)和所述全連接子網(wǎng),則所述卷積子網(wǎng)的輸出端連接于所述全連接子網(wǎng)的輸入端;
若所述目標子網(wǎng)包括所述注意力子網(wǎng)和所述全連接子網(wǎng),則所述注意力子網(wǎng)的輸出端連接于所述全連接子網(wǎng)的輸入端;
若所述目標子網(wǎng)包括所述注意力子網(wǎng)、所述卷積子網(wǎng)和所述全連接子網(wǎng),則所述注意力子網(wǎng)的輸出端連接于所述卷積子網(wǎng)的輸入端,所述卷積子網(wǎng)的輸出端連接于所述全連接子網(wǎng)的輸入端。
3.根據(jù)權利要求1所述的模型,其特征在于,所述注意力子網(wǎng)為Non-Local注意力網(wǎng)絡。
4.根據(jù)權利要求1所述的模型,其特征在于,所述特征提取網(wǎng)絡包括:
骨干網(wǎng)絡,用于提取所述圖像中的高階語義特征;
特征金字塔,用于處理高階語義特征,以輸出不同尺度的特征圖;
目標區(qū)域提取網(wǎng)絡,用于處理所述特征圖,以輸出所述多個候選框。
5.根據(jù)權利要求1所述的模型,其特征在于,所述損失計算模塊具體用于:
基于所述預測直方圖和所述圖像的標簽直方圖的距離確定所述直方圖損失值;
所述預測直方圖和所述標簽直方圖的距離為:歐氏距離、曼哈頓距離、切比雪夫距離、閔可夫斯基距離、標準化歐氏距離、馬氏距離、余弦距離、漢明距離、杰卡德距離、相關距離和信息熵中的任一種或組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010745430.1/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





