[發(fā)明專利]一種基于卷積循環(huán)神經(jīng)網(wǎng)絡的集裝箱箱號識別方法有效
| 申請?zhí)枺?/td> | 202010188543.6 | 申請日: | 2020-03-17 |
| 公開(公告)號: | CN111414844B | 公開(公告)日: | 2023-08-29 |
| 發(fā)明(設計)人: | 張聰;靳松直;周斌;張輝;王浩;韋海萍;鄭文娟;高仕博;鄭智輝;郝夢茜;叢龍劍;劉嚴羊碩;李少軍;劉燕欣;高琪;張藝明 | 申請(專利權)人: | 北京航天自動控制研究所 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V10/764;G06V10/82;G06N3/0464;G06N3/0442;G06N3/047;G06N3/08 |
| 代理公司: | 中國航天科技專利中心 11009 | 代理人: | 高志瑞 |
| 地址: | 100854 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 循環(huán) 神經(jīng)網(wǎng)絡 集裝箱 識別 方法 | ||
1.一種基于卷積循環(huán)神經(jīng)網(wǎng)絡的集裝箱箱號識別方法,其特征在于,所述方法包括如下步驟:
步驟1:采集集裝箱樣本圖像,根據(jù)集裝箱樣本圖像構建循環(huán)卷積神經(jīng)網(wǎng)絡模型,對循環(huán)卷積神經(jīng)網(wǎng)絡模型訓練后得到分類器;
步驟2:計算圖像透視變換矩陣;
步驟3:利用步驟2得到的圖像透視變換矩陣對待檢測集裝箱圖像進行透視變換得到視變換后的圖像;
步驟4:使用步驟1的分類器對透視變換后的圖像進行字符識別得到字符識別結果;
步驟5:利用集裝箱箱號規(guī)則對字符識別結果進行核對校驗,輸出最終的箱號檢測結果;
在步驟1中,采集集裝箱樣本圖像,根據(jù)集裝箱樣本圖像構建循環(huán)卷積神經(jīng)網(wǎng)絡模型,對循環(huán)卷積神經(jīng)網(wǎng)絡模型訓練后得到分類器包括如下步驟:
(11)采集集裝箱樣本圖像;
(12)將集裝箱樣本圖像縮放至高度32像素和寬度160像素的第二樣本圖像;將第二樣本圖像輸入卷積神經(jīng)網(wǎng)絡,卷積神經(jīng)網(wǎng)絡輸出512個特征圖;
(13)從步驟(12)得到的特征圖中提取特征向量;
(14)循環(huán)神經(jīng)網(wǎng)絡采用兩層各256單元的雙向長短型網(wǎng)絡,在雙向長短型網(wǎng)絡的每個時間步傳入一個特征向量,其中,時間步的數(shù)量為40個,每個時間步輸出40個長度為37的向量,40個向量構成后驗概率矩陣;
(15)由后驗概率矩陣計算損失函數(shù);
(16)通過損失函數(shù)對卷積循環(huán)神經(jīng)網(wǎng)絡進行訓練,達到設定的學習次數(shù)100000和精度0.0001時完成訓練,得到分類器;
在步驟2中,計算圖像透視變換矩陣包括如下步驟:
(21)在待檢測集裝箱圖像中選取4個點(x1,y1),(x2,y2),(x3,y3),(x4,y4),其中,4個點構成的區(qū)域包含箱號區(qū)域,并在真實空間中為矩形;
(22)根據(jù)(x1,y1),(x2,y2),(x3,y3),(x4,y4)得到待變換后圖像上對應點坐標(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4);
(23)將待變換后圖像上對應點坐標(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4)帶入透視變換矩陣計算公式得到透視變換矩陣;
在步驟3中,利用步驟2得到的圖像透視變換矩陣對待檢測集裝箱圖像進行透視變換得到視變換后的圖像包括如下步驟:
(31)根據(jù)步驟(23)中的透視變換矩陣對待檢測集裝箱圖像進行透視變換得到透視變換后的圖像;
(32)將透視變換后的圖像縮放至高度32像素、寬度160像素得到32*160的圖像;
在步驟(15)中,損失函數(shù)為:
其中,O為損失函數(shù),x為樣本,l為可能的字符,S為樣本集,p(l|x)表示后驗概率矩陣中x為字符l的后驗概率;
在步驟(22)中,(X1,Y1)=(min(x1,x3),min(y1,y2))(X2,Y2)=(max(x2,x4),Y1)(X3,Y3)=(X1,max(y3,y4))(X4,Y4)=(X2,Y3);
在步驟(23)中,透視變換矩陣計算公式為:
其中,x為透視變換前圖像某點的橫坐標,y為透視變換前圖像某點的縱坐標,X為透視變換后圖像對應點的橫坐標,Y為透視變換后圖像對應點的縱坐標,a11、a12…a32均為透視變換矩陣系數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航天自動控制研究所,未經(jīng)北京航天自動控制研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010188543.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡轉換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡
- 神經(jīng)網(wǎng)絡的生成方法、生成裝置和電子設備
- 一種舌診方法、裝置、計算設備及計算機存儲介質
- 學習神經(jīng)網(wǎng)絡結構
- 脈沖神經(jīng)網(wǎng)絡轉換方法及相關轉換芯片
- 圖像處理方法、裝置、可讀存儲介質和計算機設備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡模型微調方法、系統(tǒng)、終端和存儲介質
- 用于重構人工神經(jīng)網(wǎng)絡的處理器及其操作方法、電氣設備
- 一種圖像神經(jīng)網(wǎng)絡結構的優(yōu)化方法及裝置





