[發(fā)明專利]一種快遞面單定位矯正方法及設備在審
| 申請?zhí)枺?/td> | 202010618248.X | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111767921A | 公開(公告)日: | 2020-10-13 |
| 發(fā)明(設計)人: | 孫俊;蔡宏翔;熊意超 | 申請(專利權)人: | 上海媒智科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/20;G06K9/34;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 上海恒慧知識產(chǎn)權代理事務所(特殊普通合伙) 31317 | 代理人: | 徐紅銀 |
| 地址: | 200030 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 快遞 定位 矯正 方法 設備 | ||
1.一種快遞面單定位矯正方法,其特征在于,包括:
對含快遞面單的圖像進行標注,將所述圖像中的快遞面單覆蓋住并標記文字朝向,得到快遞面單標注數(shù)據(jù);
將所述標注數(shù)據(jù)作為訓練集訓練卷積神經(jīng)網(wǎng)絡,使得所述卷積神經(jīng)網(wǎng)絡能預測快遞面單的位置和文字方向;
將待檢測的含快遞面單的圖像輸入訓練后的所述卷積神經(jīng)網(wǎng)絡,得到預測的快遞面單的位置和文字方向,根據(jù)該預測的快遞面單的位置和文字方向進行定位矯正,得到定位矯正后的快遞面單。
2.根據(jù)權利要求1所述的快遞面單定位矯正方法,其特征在于,將所述圖像中的快遞面單覆蓋住并標記文字朝向,得到快遞面單標注數(shù)據(jù),包括:
使用多邊形將含快遞面單的圖像中的快遞面單覆蓋住;
根據(jù)快遞面單的文字朝向,將標記點按設定規(guī)則排列;
上述的多邊形以及具有設定規(guī)則的標記點構成所述快遞面單標注數(shù)據(jù)。
3.根據(jù)權利要求2所述的快遞面單定位矯正方法,其特征在于,所述根據(jù)快遞面單的文字朝向,將標記點按設定規(guī)則排列,包括:
根據(jù)快遞面單的文字朝向朝上,在所述多邊形的每個頂點處標記一個標記點,定義其中一個標記點為起始點,將標記點按順時針或逆時針方向排序。
4.根據(jù)權利要求1所述的快遞面單定位矯正方法,其特征在于,將所述標注數(shù)據(jù)作為訓練集訓練卷積神經(jīng)網(wǎng)絡,包括:
將所述標注數(shù)據(jù)一部分劃分為訓練集,一部分劃分為驗證集,根據(jù)對應的所述標注數(shù)據(jù)得到每張圖像對應的文字方向和分割圖;
將得到的訓練集進行數(shù)據(jù)增強,輸入到卷積神經(jīng)網(wǎng)絡中得到預測的分割圖和預測的量化角度;
利用交叉熵損失函數(shù)對所述卷積神經(jīng)網(wǎng)絡進行反向傳播訓練,從而更新卷積神經(jīng)網(wǎng)絡的網(wǎng)絡參數(shù),得到能預測快遞面單的位置和文字方向的卷積神經(jīng)網(wǎng)絡。
5.根據(jù)權利要求4所述的快遞面單定位矯正方法,其特征在于,根據(jù)對應的所述標注數(shù)據(jù)得到每張圖像對應的文字方向和分割圖,包括:
使用所述標注數(shù)據(jù)獲取分割圖,即標記點形成的多邊形內部為第一數(shù)值,其他區(qū)域為第二數(shù)值,其中分割圖與對應的原圖的尺寸相等;
使用所述標記點計算文字朝向角度,將該角度按照量化區(qū)間進行量化,得到每張圖像對應的文字方向。
6.根據(jù)權利要求5所述的快遞面單定位矯正方法,其特征在于,使用所述標記點計算文字朝向角度,將該角度按照量化區(qū)間進行量化,包括:
首先,定義基準向量為VB(0,1),將360度進行多等分得到量化區(qū)間;
然后,計算相鄰第一標記點和第二標記點的法向量集合V,從V中獲取一個與第二標記點和第三標記點的向量V1反向的法向量V2,計算V2和VB的夾角A,定義該夾角A為面單的文字朝向角度,將該角度按照量化區(qū)間進行量化。
7.根據(jù)權利要求4所述的快遞面單定位矯正方法,其特征在于,所述將得到的訓練集進行數(shù)據(jù)增強,包括:將所述訓練集的訓練數(shù)據(jù)進行隨機旋轉、等比例縮放、填充到固定尺度。
8.根據(jù)權利要求4所述的快遞面單定位矯正方法,其特征在于,所述利用交叉熵損失函數(shù)對所述卷積神經(jīng)網(wǎng)絡進行反向傳播訓練,從而更新卷積神經(jīng)網(wǎng)絡的網(wǎng)絡參數(shù),包括:
分別使用交叉熵損失函數(shù)計算預測的分割圖與實際分割圖、預測的量化角度和實際量化角度的差異,得到更新網(wǎng)絡參數(shù);其中:
所述交叉熵損失函數(shù)為:
p代表預測值,g代表實際值,n表示有多少組預測值和實際值匹配的數(shù)值,xi表示第i組值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海媒智科技有限公司,未經(jīng)上海媒智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010618248.X/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





