[發明專利]一種基于AA R2Unet和HMM的香煙濾棒計數方法在審
| 申請號: | 202010741400.3 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111882543A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 張堃;韓宇;姜朋朋;朱翊晗;馮文宇;殷佳煒;華亮;李文俊;鮑毅 | 申請(專利權)人: | 南通大學;杭州博拉哲科技有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/11;G06T7/143;G06N3/08;G06N3/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 226019 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 aa r2unet hmm 香煙 計數 方法 | ||
1.一種基于AA R2Unet和HMM的香煙濾棒計數方法,其特征在于:包括以下步驟:
A、建立AA R2Unet網絡對采集的濾棒圖片進行目標分割,獲取僅包含濾棒目標的圖像;
B、基于HMM的優化搜索算法;
C、采用結構元填充的方法對濾棒目標進行計數。
2.根據權利要求1所述的一種基于AA R2Unet和HMM的香煙濾棒計數方法,其特征在于:所述步驟A中,在Unet中加入了R2模塊與Attention Augment模塊;其中,Unet結構總體呈對稱的U型結構,在設計時共包含12個單元(F1-F12),其中左側F1-F6為收縮路徑,主要用于特征的提取;右側F6-F12為擴張路徑,用于細節的恢復實現精準預測;R2模塊主要包括了殘差學習單元(Residual learning unit)和遞歸卷積(Recurrent convolution)。圖3中的遞歸卷積表示在t=0,t=1,t=2時刻以前一層的輸出作為輸入進行卷積并將結果相加。
3.根據權利要求2所述的一種基于AA R2Unet和HMM的香煙濾棒計數方法,其特征在于:所述Attention Augment本質為通過查詢得到一系列鍵-值對的映射;首先,通過對輸入大小為(w,h,cin)的特征圖進行1×1卷積輸出QKV矩陣,其大小為(w,h,2*dk+dv),其中w、h、2*dk+dV分別表示了矩陣的寬、長與深度;再從深度通道上對QKV矩陣進行分割,得到Q(Query)、K(Key)、V(Value)三個矩陣其深度通道大小分別為dk、dk、dv。接著,采用了多頭注意力機制(Multi-Head Attention)的結構,將Q、K、V三個矩陣分別從深度通道上分割為N個相等的矩陣進行后續的計算,這種多頭注意力機制將原本單一的attention計算,擴展為較小且并行獨立的多個計算,使得模型可以在不同的子空間內學習特征信息。
4.根據權利要求3所述的一種基于AA R2Unet和HMM的香煙濾棒計數方法,其特征在于:對于分割好的Q、K、V矩陣在進行扁平化處理生成Flat_Q、Flat_K、Flat_V三個矩陣,即對Q、K、V保持深度通道不變,從長寬方向對其進行壓縮到1維,其中前兩個矩陣的大小為(w*h,dk),后一個矩陣大小為(w*h,dv);接著,Attention Augment保存了原先Self-Attention的做法使用Flat_Q、Flat_K兩矩陣進行矩陣乘法運算,計算出權重矩陣,且在此基礎上添加了相對位置嵌入的計算,通過對Q矩陣進行長寬兩方向的權重計算得到特征圖上每個點的相對位置信息,防止特征位置的變換而降低模型的最終效果;長寬兩方向的相關位置信息分別通過Q矩陣與權重矩陣H和W內積得到,記為Sh和Sw,其中權重矩陣H和W通過模型的訓練得出,大小為(wh,wh,1)。然后,將得到的三個矩陣相加并乘以尺度系數以防止計算結果過大;隨后用softmax函數進行處理,即得到了最終的特征權重矩陣;最后,將該權重矩陣與V矩陣相乘并將結果reshape到原始長寬大小,再進行1×1的卷積操作,即可得到最終的注意力特征矩陣O;將注意力特征矩陣O和正常的卷積過程按深度方向進行拼接(concat)即可得到Attention Augment的結果;注意力特征矩陣O的計算公式如下:
5.根據權利要求1所述的一種基于AA R2Unet和HMM的香煙濾棒計數方法,其特征在于:所述步驟B中,對已找到的圓心作為基準圓心,以d為半徑擬合一個圓;再以半徑2/3d擬合一個同心圓,記為圓B,對圓A與圓B組成的圓環區域所有像素進行分析;根據濾棒之間位置幾何關系,對基準圓心0°±15°、60°±15°、120°±15°、180°±15°、240°±15°、300°±15°方向上的圓環區域像素點進行結構元檢測;將檢測到的6個方向上符合結構元準則的第一個像素點作為下一個濾棒目標的初始結構元位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學;杭州博拉哲科技有限公司,未經南通大學;杭州博拉哲科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010741400.3/1.html,轉載請聲明來源鉆瓜專利網。





