[發明專利]文字檢測方法、裝置和系統在審
| 申請號: | 201710241094.5 | 申請日: | 2017-04-13 |
| 公開(公告)號: | CN108734052A | 公開(公告)日: | 2018-11-02 |
| 發明(設計)人: | 周昕宇;姚聰;周舒暢;何蔚然 | 申請(專利權)人: | 北京曠視科技有限公司;北京邁格威科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06N3/04 |
| 代理公司: | 北京市磐華律師事務所 11336 | 代理人: | 高偉;卜璐璐 |
| 地址: | 100190 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字檢測 初步檢測結果 檢測結果 神經網絡 輸入圖像 文本區域 直接檢測 篩選 接收輸入圖像 預定規則 中間步驟 準確度 算法 輸出 | ||
1.一種文字檢測方法,其特征在于,所述文字檢測方法包括:
接收輸入圖像;
經由訓練好的神經網絡直接檢測所述輸入圖像中的文本區域,并輸出初步檢測結果;以及
根據預定規則篩選所述初步檢測結果,并對篩選后的結果實施非最大值抑制處理,以獲得最終的檢測結果。
2.根據權利要求1所述的文字檢測方法,其特征在于,所述初步檢測結果包括檢測到的文本區域的分數圖和幾何表示。
3.根據權利要求2所述的文字檢測方法,其特征在于,所述根據預定規則篩選所述初步檢測結果包括:
篩選出分數大于預定閾值的文本區域的幾何表示,以用于對篩選出的幾何表示實施所述非最大值抑制處理。
4.根據權利要求3所述的文字檢測方法,其特征在于,在對篩選出的幾何表示實施所述非最大值抑制處理之前,基于臨近像素的相關性合并所述篩選出的幾何表示。
5.根據權利要求2所述的文字檢測方法,其特征在于,所述幾何表示包括以下中的至少一種:軸對齊的長方形、帶旋轉的長方形、簡單多邊形以及貝塞爾曲線。
6.根據權利要求1-5中的任一項所述的文字檢測方法,其特征在于,所述神經網絡為全卷積網絡,或者為全卷積網絡與循環神經網絡的組合。
7.根據權利要求6所述的文字檢測方法,其特征在于,所述神經網絡包括特征提取層、特征合并層和輸出層。
8.根據權利要求7所述的文字檢測方法,其特征在于,所述特征提取層包括多層卷積神經網絡,用于提取不同層次的圖像特征。
9.根據權利要求8所述的文字檢測方法,其特征在于,所述特征合并層以級聯的方式逐層合并所述不同層次的圖像特征。
11.一種文字檢測裝置,其特征在于,所述文字檢測裝置包括:
檢測模塊,用于接收輸入圖像,經由訓練好的神經網絡直接檢測所述輸入圖像中的文本區域,并輸出初步檢測結果;以及
處理模塊,用于根據預定規則篩選所述初步檢測結果,并對篩選后的結果實施非最大值抑制處理,以獲得最終的檢測結果。
12.根據權利要求11所述的文字檢測裝置,其特征在于,所述初步檢測結果包括檢測到的文本區域的分數圖和幾何表示。
13.根據權利要求12所述的文字檢測裝置,其特征在于,所述處理模塊進一步用于:
篩選出分數大于預定閾值的文本區域的幾何表示,以用于對篩選出的幾何表示實施所述非最大值抑制處理。
14.根據權利要求13所述的文字檢測裝置,其特征在于,所述處理模塊進一步用于:
在對篩選出的幾何表示實施所述非最大值抑制處理之前,基于臨近像素的相關性合并所述篩選出的幾何表示。
15.根據權利要求12所述的文字檢測裝置,其特征在于,所述幾何表示包括以下中的至少一種:軸對齊的長方形、帶旋轉的長方形、簡單多邊形以及貝塞爾曲線。
16.根據權利要求11-15中的任一項所述的文字檢測裝置,其特征在于,所述神經網絡為全卷積網絡,或者為全卷積網絡與循環神經網絡的組合。
17.根據權利要求16所述的文字檢測裝置,其特征在于,所述神經網絡包括特征提取層、特征合并層和輸出層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司;北京邁格威科技有限公司,未經北京曠視科技有限公司;北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710241094.5/1.html,轉載請聲明來源鉆瓜專利網。





