[發明專利]一種瓶頸縮邊模型、神經元網絡及其構建方法在審
| 申請號: | 202210732679.8 | 申請日: | 2019-09-20 |
| 公開(公告)號: | CN115049831A | 公開(公告)日: | 2022-09-13 |
| 發明(設計)人: | 杜宇 | 申請(專利權)人: | 成都芯云微電子有限公司 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V10/44;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京之于行知識產權代理有限公司 11767 | 代理人: | 侯越玲 |
| 地址: | 611730 四川省成都市郫都區德源鎮*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 瓶頸 模型 神經元 網絡 及其 構建 方法 | ||
1.一種瓶頸縮邊模型,其特征在于,設置于瓶頸縮邊模塊中,
所述瓶頸縮邊模型至少包括兩層1*1卷積層和一層m*m卷積層,其中m*m卷積層設置在兩個1*1卷積層之間,
所述瓶頸縮邊模塊的縮邊方法包括:
G(x)=c_2(σ(conv(σ(c_1(x)))))+r(x)
其中,conv(x)表示對圖像矩陣x進行無padding的m*m卷積變換,m>1;c_1(x)與c_2(x)表示對圖像矩陣x進行1*1卷積變換,σ(x)表示對圖像矩陣x進行非線性變換;r(x)表示對圖像矩陣x進行縮邊。
2.根據權利要求1所述的瓶頸縮邊模型,其特征在于,所述r(x)去掉圖像矩陣的邊緣k層的特征元素的函數為:
即去掉原矩陣x的第1~k行,第1~k列,第(n-k+1)~n行和第(n-k+1)~n列。
3.根據權利要求1或2所述的瓶頸縮邊模型,其特征在于,第二卷積層為3x3卷積核的卷積層。
4.一種神經元網絡,其特征在于,至少包括:
卷積模塊,設置與圖像信息輸入端并用于基于卷積層提取圖像矩陣;
縮邊單元,包括至少一個縮邊模塊,用于將圖像矩陣進行至少一次縮邊處理;
殘差單元,包括至少一個殘差模塊,用于提取圖像非邊緣部分待識別區域的相對比較抽象的特征;
全連接層模塊,用于基于全連接層輸出識別的圖像數據;
卷積模塊、縮邊單元、殘差單元和全連接層模塊依次連接。
5.根據權利要求4所述的神經元網絡,其特征在于,所述縮邊模塊為瓶頸縮邊模塊,
所述瓶頸縮邊模塊至少包括兩層1*1卷積層和一層m*m卷積層,其中m*m卷積層設置在兩個1*1卷積層之間,
所述瓶頸縮邊模塊的縮邊方法包括:
G(x)=c_2(σ(conv(σ(c_1(x)))))+r(x)
其中,conv(x)表示對圖像矩陣x進行無padding的m*m卷積變換,m>1;c_1(x)與c_2(x)表示對圖像矩陣x進行1*1卷積變換,σ(x)表示對圖像矩陣x進行非線性變換;r(x)表示對圖像矩陣x進行縮邊。
6.根據權利要求4或5所述的神經元網絡,其特征在于,所述r(x)去掉圖像矩陣的邊緣k層的特征元素的函數為:
即去掉原矩陣x的第1~k行,第1~k列,第(n-k+1)~n行和第(n-k+1)~n列。
7.一種神經元網絡的構建方法,其特征在于,所述方法包括:
將卷積模塊與縮邊單元連接;
所述縮邊單元為瓶頸縮邊單元(20);在所述瓶頸縮邊單元(20)與瓶頸殘差單元(50)之間設置有第一池化模塊(31)和第一1x1卷積模塊(41);
第一池化模塊(31)設置在第一1x1卷積模塊(41)的數據上游;
將瓶頸殘差單元(50)與全連接層模塊(60)連接;
所述全連接層模塊(60)用于輸出最后的圖像數據。
8.根據權利要求7所述的神經元網絡的構建方法,其特征在于,所述瓶頸縮邊單元(20)包括依次連接的第一瓶頸縮邊模塊(21)、第二瓶頸縮邊模塊(22)、第三瓶頸縮邊模塊(23)和第四瓶頸縮邊模塊(24);
每個瓶頸縮邊模塊去掉1層邊緣特征元素,第一瓶頸縮邊模塊(21)、第二瓶頸縮邊模塊(22)、第三瓶頸縮邊模塊(23)和第四瓶頸縮邊模塊(24)能夠去掉圖像矩陣邊緣4層特征元素,使圖像矩陣的行數和列數各減少8。
9.根據權利要求8所述的神經元網絡的構建方法,其特征在于,所述瓶頸殘差單元(50)中的任意兩個非縮邊的瓶頸殘差模塊之間設置有第二池化模塊(32)和第二1x1卷積模塊(42);
第二池化模塊(32)設置在第二1x1卷積模塊(42)的數據上游;
其中,在殘差模塊之間設置的池化模塊的作用在于改變圖像矩陣的大小。
10.根據權利要求8或9所述的神經元網絡的構建方法,其特征在于,瓶頸殘差模塊至少包括三層卷積層,
瓶頸殘差模塊的表達式可寫為:H(x)=c_2(σ(conv(σ(c_1(x)))))+x,其中,conv(x)表示對圖像矩陣x進行padding=1的3×3卷積變換;
c_1(x)與c_2(x)表示對圖像矩陣x進行1×1卷積變換,
σ(x)表示對圖像矩陣x進行非線性變換。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都芯云微電子有限公司,未經成都芯云微電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210732679.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種移動終端通信故障采集系統
- 下一篇:一種隧道壁后雷達檢測車





