[發明專利]目標檢測模型的優化方法及系統在審
| 申請號: | 202110260170.3 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112907600A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 王堃 | 申請(專利權)人: | 江蘇禹空間科技有限公司 |
| 主分類號: | G06T7/10 | 分類號: | G06T7/10;G06T5/50;G06N3/04 |
| 代理公司: | 北京德崇智捷知識產權代理有限公司 11467 | 代理人: | 曹婷 |
| 地址: | 210000 江蘇省南京市建鄴*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 模型 優化 方法 系統 | ||
本發明公開了一種目標檢測模型的優化方法及系統,涉及計算機視覺技術領域,解決了卷積網絡的輸出通道數較多、卷積過程的計算量大且表征能力不強的技術問題,其技術方案要點是將圖像劃分成若干個特征圖后,再對這些特征圖的特征進行劃分,將不同特征圖的特征共同輸入到混洗通道已對全部特征進行混洗,通過不同特征之間的均勻組合使得輸入通道和輸出通道完全相關,增強表征能力。讓卷積核的個數小于特征圖的個數,減少輸出通道的數量,以降低卷積核卷積過程的計算量。
技術領域
本公開涉及計算機視覺技術領域,尤其涉及一種目標檢測模型的優化方法及系統。
背景技術
用于移動視覺應用的卷積神經網絡是輕量級網絡中的一種,該網絡主要應用于移動和嵌入式設備,該網絡的最大特點在于應用了深度逐點卷積網絡以及增加了兩個超參數,一個是控制卷積層卷積核個數的超參數,另一個是控制輸入圖像尺寸的超參數。
標準卷積網絡的特點為:卷積核的深度等于輸入特征矩陣的深度,輸出特征矩陣的深度等于卷積核的個數。例如,輸入深度為3的特征矩陣,若使用4個卷積核進行卷積,那么每個卷積核的深度都和輸入特征矩陣的深度是相同的,即3。輸出特征矩陣的深度是由卷積核的個數決定的,采用了4個卷積核,所以輸出矩陣的深度為4,如圖1所示。
深度逐點卷積網絡包括兩個部分,第一部分是深度卷積(Depthwise Conv),第二部分是逐點卷積(Pointwise Conv)。深度卷積網絡的特點為:每一個卷積核的深度都為1,輸入特征矩陣的深度與卷積核的個數、輸出特征矩陣的深度都相同,如圖2所示。逐點卷積網絡的特點為:卷積核的尺寸為1,每個卷積核的深度與輸入特征矩陣的深度相同,輸出特征矩陣的深度與卷積核的個數相同,如圖3所示。
逐點卷積采用尺寸為1×1的卷積網絡,雖然實現了逐點卷積,但卷積計算量大,從層類型的角度分析,整個網絡近95%的計算量以及近3/4的參數集中在尺寸為1×1的卷積網絡的逐點卷積過程中。若深度卷積過程的計算量表示為CD,逐點卷積過程的計算量表示為CP,則CD=H×W×DK×DK×M,CP=H×W×M×N,其中,DK表示卷積核的尺寸,H×W表示輸入特征的尺寸,M表示輸入通道數,N表示輸出通道數。可知,逐點卷積的計算量同輸出通道數N成正比,并隨著網絡層數的加深輸出通道數會不斷增大,這直接導致了逐點卷積操作的計算量逐漸升高;另外每個輸出通道也沒有進行組合產生新特征,沒有改變特征的通道數量,就算減少了計算參數數量不同通道間信息也無法流通。
發明內容
本公開提供了一種目標檢測模型的優化方法及系統,其技術目的是減少卷積網絡的輸出通道數,降低卷積過程的計算量,減少參與卷積的參數數量并增強表征能力,從而實現移動視覺應用的卷積神經網絡的輕量化,以便于移動設備或嵌入式設備實行目標檢測。
本公開的上述技術目的是通過以下技術方案得以實現的:
一種目標檢測模型的優化方法,包括:
將圖像劃分成M個維度為H×W×C的特征圖,C表示特征圖的深度;
將每個特征圖均劃分成N份特征,則每份特征含有每個特征圖的1/N份的特征;
向每一組混洗通道中的每個混洗通道分別輸入每個特征圖的一份特征,每一組混洗通道中的M份特征進行混洗后輸出一組特征,則混洗通道總共輸出N組特征;其中,混洗通道的數量為N×M,將混洗通道分為N組,每組有M個混洗通道,NM,M、N都為正整數;
將N組特征分別輸入到N個維度為1×1×C的卷積核中進行卷積操作,得到N個維度為H×W×C的第一圖像特征,根據N個所述第一圖像特征得到圖像。
進一步地,該方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇禹空間科技有限公司,未經江蘇禹空間科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110260170.3/2.html,轉載請聲明來源鉆瓜專利網。





