[發明專利]一種基于視頻圖像的快遞面單三段碼識別方法在審
| 申請號: | 201810732728.1 | 申請日: | 2018-07-05 |
| 公開(公告)號: | CN108960148A | 公開(公告)日: | 2018-12-07 |
| 發明(設計)人: | 郭強;卞玉可;季磊;徐英明;邵潘虹 | 申請(專利權)人: | 濟南東朔微電子有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京華際知識產權代理有限公司 11676 | 代理人: | 褚慶森 |
| 地址: | 250101 山東省濟南市高新*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 快遞 三段 視頻圖像 標簽文件 測試樣本 訓練樣本 單圖像 構建 訓練神經網絡 訓練網絡模型 分揀效率 人工標注 實時檢測 數字位置 網絡模型 訓練數據 分區域 分揀 數據庫 標簽 自動化 圖像 拍攝 檢測 分配 | ||
1.一種基于視頻圖像的快遞面單三段碼識別方法,其特征在于,通過以下步驟來實現:
a).構建數據庫,通過拍攝大量的快遞面單圖像,構建面單數據庫;隨機選取數據庫中的部分面單圖像作為訓練樣本,余下的面單圖像作為測試樣本;
b).生成標簽文件,對訓練樣本和測試樣本中所有面單圖像的三段碼進行人工標注,標注出三段碼中每位數字的位置及類別,數字的位置為數字外圍的矩形框,類別為0、1、2、…、9的阿拉伯數字,數字位置及類別組成圖像的標簽文件;
c).訓練網絡模型,將訓練樣本中的面單圖像及其標簽作為訓練數據,輸入到神經網絡模型中,按照神經網絡模型定義的各項參數進行訓練,獲得所需的用于檢測三段碼的神經網絡模型;
d).檢測網絡模型,以測試樣本中的面單圖像為輸出,測試樣本的標簽文件為輸出校準數據,對步驟c)訓練出的神經網絡的準確度進行檢測,如果神經網絡模型的準確度大于設定的閾值,則表明其滿足要求;如果準確度小于設定閾值,則增大訓練樣本的容量繼續進行訓練;
e).三段碼實時檢測,獲取在傳送帶上運動的快遞物品的面單圖像,采用利用訓練好的神經網絡模型識別出其三段碼,并根據三段碼所標示的目的地對快遞物品進行自動分揀。
2.根據權利要求1所述的基于視頻圖像的快遞面單三段碼識別方法,其特征在于,步驟c)中神經網絡模型定義的各項參數包括類別總數、矩形框尺度、訓練速率和訓練次數,然后利用訓練樣本中的面單圖像及其標簽文件進行訓練,并輸出訓練日志,并計算整體損失度和準確率的變化,以便根據損失度和準確率的變化進行網絡參數的調整,并不斷迭代,最后得到滿足要求的網絡模型。
3.根據權利要求1或2所述的基于視頻圖像的快遞面單三段碼識別方法,其特征在于:步驟c)在訓練網絡模型過程中,將輸入的訓練樣本中的面單圖片經過不同的卷積核卷積操作后得到不同的特征圖,從而提取出不同的特征,每個特征圖生成若干個矩形框,每個矩形框的尺度通過公式(1)進行處理:
式中,Sk為矩形框尺度,Smin為矩形框尺度的最小值,Smax為矩形框尺度的最大值,m為特征圖的個數。
4.根據權利要求1或2所述的基于視頻圖像的快遞面單三段碼識別方法,其特征在于:步驟c)在訓練網絡模型過程中,損失度通過公式(2)進行求取:
式中,L(x,c,l,g)為特征圖的損失值,x為匹配程度,c為預測框的置信度,l為預測框,g為真實框,N為匹配的默認框數目,Lconf為置信度損失函數,Lloc為位置損失函數,α為權重項,0<α<1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南東朔微電子有限公司,未經濟南東朔微電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810732728.1/1.html,轉載請聲明來源鉆瓜專利網。





