[發(fā)明專利]一種基于YOLACT實例分割的改進方法在審
| 申請?zhí)枺?/td> | 202110341105.3 | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN113160263A | 公開(公告)日: | 2021-07-23 |
| 發(fā)明(設(shè)計)人: | 賈宇明;齊晨陽;毛晨;王云;羅俊海;鮮維富;唐昊 | 申請(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號: | G06T7/136 | 分類號: | G06T7/136;G06T3/40;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 yolact 實例 分割 改進 方法 | ||
本發(fā)明屬于圖像實例分割領(lǐng)域,具體涉及一種基于YOLACT實例分割的改進方法。隨著目標檢測和語義分割任務(wù)的發(fā)展,作為兩者任務(wù)的結(jié)合體實例分割任務(wù)也越來越多的受到研究者們的關(guān)注,但目前為止實例分割任務(wù)依然沒有達到令人滿意的效果。實例分割任務(wù)主要受限于兩個評價指標:精度和時間復(fù)雜度。雖然YOLACT實例分割算法達到了實時性,但精度卻達不到一個較好的水平。因此本文對YOLACT算法進行了相應(yīng)改進,提高的網(wǎng)絡(luò)的精度。綜合考慮準確性和實時性本發(fā)明都具備了較好的效果。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像實例分割領(lǐng)域,具體涉及一種基于YOLACT實例分割的改進方法。
背景技術(shù)
目標檢測及定位是圖像處理中從粗糙到精細的過程。它不僅需要給出圖像中每個對象的類別,還要給出對象的具體位置,位置的表示可以分為對象的包圍框或者對象的質(zhì)心。語義分割通過預(yù)測輸入圖像中每個像素的類別來進行類別間的劃分。實例分割為屬于同一個類的對象的不同實例提供了不同的標簽。換言之語義分割只對整幅圖進行像素點的預(yù)測,不區(qū)分不同實例,將不同實例都認為是一個類別。而實例分割在語義分割的基礎(chǔ)上增加了區(qū)分同類不同實例的功能。因此,實例分割可以定義為同時解決了目標檢測識別和語義分割問題的一種技術(shù)。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是:對YOLACT實例分割算法進行改進,改進后算法的精度比原算法更高。
本發(fā)明基于YOLACT實例分割的改進方法,包括以下步驟:
步驟1:輸入一張圖像,對圖像進行特征提取;
步驟2:對提取到的特征進行特征融合;
步驟3:通過掩碼生成網(wǎng)絡(luò)生成圖像的原始掩碼;
步驟4:通過注意力機制篩選融合后的特征;
其中步驟4的具體步驟為:
步驟401:將特征進行多尺度池化,池化到大小為1×1、3×3和5×5的結(jié)果,池化方式采用平均池化方式;
步驟402:對池化后的結(jié)果進行上采樣,上采樣到大小為5×5,上采樣方式采用雙線性插值法;
步驟403:對三個5×5的上采樣結(jié)果求和,求和方式采用逐元素加法;
步驟404:進行四次卷積操作來預(yù)測注意力權(quán)重參數(shù),第一次進行1×1卷積操作,將通道維度進行壓縮,減小后續(xù)的計算量,第二次和第三次進行3×3卷積操作,第四次進行1×1卷積操作,并在前三次卷積后使用ReLU激活函數(shù),增加預(yù)測的非線性度,但在第四次卷積后使用Sigmoid激活函數(shù),將預(yù)測的權(quán)重參數(shù)歸一化到0~1區(qū)間;
步驟405:求預(yù)測的權(quán)重參數(shù)與特征的積;
步驟5:通過預(yù)測網(wǎng)絡(luò)預(yù)測實例的位置、類別和掩碼系數(shù);
步驟6:通過掩碼系數(shù)和原始掩碼獲得實例的掩碼;
步驟7:通過掩碼抑制算法對實例掩碼進行處理;
其中步驟7的具體步驟為:
步驟701:遍歷掩碼圖上所有的像素點,對每個像素點在掩碼圖中求最大值,并將得到的掩碼編號保存在maxMask變量中,如果像素點不屬于任何一個實例則值為0;
步驟702:用maxMask和每個實例掩碼求交集,如果maxMask像素點的值和某個掩碼編號相同,那么當(dāng)前掩碼保留該像素點的值,即該像素點屬于此掩碼;如果maxMask像素點上的值與當(dāng)前掩碼編號不對應(yīng),那么當(dāng)前掩碼上該像素點的值設(shè)置為0;
步驟8:裁剪及二值化處理。
綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110341105.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





