[發明專利]一種復雜場景下的文字檢測方法有效
| 申請號: | 202010464622.5 | 申請日: | 2020-05-28 |
| 公開(公告)號: | CN111368848B | 公開(公告)日: | 2020-08-21 |
| 發明(設計)人: | 朱浩;張磊;鄭全新;董小棟;劉陽;趙海波;孟祥松;張逞逞;馮鑫;江龍;鄧家勇;劉婷婷 | 申請(專利權)人: | 北京同方軟件有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 復雜 場景 文字 檢測 方法 | ||
1.一種復雜場景下的文字檢測方法,其特征在于,包括如下步驟:
步驟一:圖像數據的場景預處理,先將原始復雜場景中的大像素圖像,劃分成幾個小圖像塊,分別進行檢測,再將檢測結果融合;
步驟二:網絡模型設計,設計了一種融合了分割模塊和檢測模塊的網絡結構SDetNet,計算檢測模塊檢測框和分割模塊檢測框的交并比IOU,再由合并模塊利用交并比參數值和文本存在概率值,判斷該場景中某些局部位置是否存在文字;采用公式(1)計算交并比IOU:
(1)
其中,Pre_Rect是分割模塊和檢測模塊的交并比參數值,Label_Rect表示文字存在的真實分布區域;
步驟三:損失函數,把檢測框和真實框的IOU參數值設定為動態的權值參數,作為模型最終的目標函數再進行CNN迭代訓練,這種回歸長、寬比的損失函數計算方法為:
設定坐標原點為(0,0)點,x、y分別表示文字框的長和寬,坐標中的點A(x1,y1)和點B(x2,y2)分別表示檢測框的真值和模型預測出的結果值,θ參數作為點A和點B之間的夾角,可以衡量向量和的相似度;優化θ參數值,對檢測框進行調節,公式如下(2)和(3):
(2)
(3)
其中,θ為真值坐標A和預測坐標B的夾角,當θ的參數值變大時,cos函數將變大,-ln函數也會變大;通過梯度下降算法,有效的對模型進行調節,使θ參數值逐漸變小,AL是計算的向量方向差異度參數值;
利用真值框和預測框的交并比值設計一個動態的權重值,當IOU參數值比較大時,說明文字檢測區域能更好的覆蓋文字區域,設定較高的權值;當IOU參數值比較小時,說明文字檢測區域覆蓋文字區域效果較差,設定較低的權值;損失函數ShapeLoss如下公式(4):
(4) 。
2.根據權利要求1所述復雜場景下的文字檢測方法,其特征在于,所述將原始復雜場景中圖像劃分為小圖像塊的數量為4個。
3.根據權利要求1或2所述復雜場景下的文字檢測方法,其特征在于,所述檢測模塊學習文字區域分布和文字傾斜角度特征;所述分割模塊學習文字分布概率和文字檢測框特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京同方軟件有限公司,未經北京同方軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010464622.5/1.html,轉載請聲明來源鉆瓜專利網。





