[發明專利]文本檢測方法及裝置、電子設備和存儲介質在審
| 申請號: | 202110112063.6 | 申請日: | 2021-01-27 |
| 公開(公告)號: | CN112800954A | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 朱一秦;陳健勇;梁凌宇;曠章輝;金連文;張偉 | 申請(專利權)人: | 北京市商湯科技開發有限公司;華南理工大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/34;G06K9/48;G06N3/04;G06N3/08 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 100080 北京市海淀區北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 檢測 方法 裝置 電子設備 存儲 介質 | ||
1.一種文本檢測方法,其特征在于,包括:
對待檢測圖像進行特征提取,得到所述待檢測圖像對應的至少一個第一特征;
根據所述至少一個第一特征,預測所述待檢測圖像中的第一目標文本區域,以及預測所述第一目標文本區域對應的第一傅里葉特征;
根據所述第一傅里葉特征,通過執行傅里葉逆變換操作,得到所述第一目標文本區域對應的第一目標邊界框。
2.根據權利要求1所述的方法,其特征在于,所述第一特征包括第一特征圖;
所述根據所述至少一個第一特征,預測所述待檢測圖像中的第一目標文本區域,包括:
根據至少一個第一特征圖,對所述待檢測圖像中的像素點進行第一分類,得到所述待檢測圖像中的第一初始文本區域;
根據所述至少一個第一特征圖,對所述待檢測圖像中的像素點進行第二分類,得到所述待檢測圖像中的第一文本中心區域,所述第一文本中心區域位于所述第一初始文本區域的中心;
根據所述第一初始文本區域和所述第一文本中心區域,確定所述第一目標文本區域。
3.根據權利要求1或2所述的方法,其特征在于,所述第一特征包括第一特征圖,所述第一傅里葉特征包括第一傅里葉特征向量;
所述根據所述至少一個第一特征,預測所述第一目標文本區域對應的第一傅里葉特征,包括:
根據至少一個第一特征圖,預測所述待檢測圖像中各像素點對應的傅里葉特征向量;
根據所述各像素點對應的傅里葉特征向量和所述第一目標文本區域的位置,確定所述第一傅里葉特征向量。
4.根據權利要求3所述的方法,其特征在于,所述根據所述第一傅里葉特征,通過執行傅里葉逆變換操作,得到所述第一目標文本區域對應的第一目標邊界框,包括:
通過對所述第一傅里葉特征向量執行傅里葉逆變換操作,得到所述第一目標文本區域對應的多個邊界框;
通過對所述多個邊界框執行非極大值抑制操作,得到所述第一目標邊界框。
5.根據權利要求1至4中任意一項所述的方法,其特征在于,所述文本檢測方法通過文本檢測神經網絡實現。
6.根據權利要求5所述的方法,其特征在于,所述文本檢測神經網絡的訓練樣本包括:樣本圖像、所述樣本圖像中的標注文本區域、所述標注文本區域對應的標注傅里葉特征;
所述方法還包括:
通過初始神經網絡對所述樣本圖像進行特征提取,得到所述樣本圖像對應的至少一個第二特征;
根據所述至少一個第二特征,預測所述樣本圖像中的第二目標文本區域,以及預測所述第二目標文本區域對應的第二傅里葉特征;
根據所述第二傅里葉特征,通過執行傅里葉逆變換操作,得到所述第二目標文本區域對應的第二目標邊界框;
根據所述第二目標文本區域和所述標注文本區域確定第一檢測損失,以及根據所述第二目標邊界框和所述標注傅里葉特征,確定第二檢測損失;
根據所述第一檢測損失和所述第二檢測損失,調整所述初始神經網絡的網絡參數,得到訓練后的所述文本檢測神經網絡。
7.根據權利要求6所述的方法,其特征在于,所述訓練樣本中還包括所述標注文本區域對應的多個標注邊界點;
所述方法還包括:
根據所述多個標注邊界點,對所述標注文本區域進行邊界點采樣操作,得到多個采樣邊界點,相鄰所述采樣邊界點之間的距離相同;
通過對所述多個采樣邊界點執行傅里葉變換操作,得到所述標注傅里葉特征。
8.根據權利要求7所述的方法,其特征在于,所述標注傅里葉特征包括標注傅里葉特征向量;
所述通過對所述多個采樣邊界點執行傅里葉變換操作,得到所述標注傅里葉特征,包括:
通過確定所述多個采樣邊界點中的初始采樣邊界點和各所述采樣邊界點之間的順序,得到所述多個采樣邊界點對應的采樣邊界點序列;
通過對所述采樣邊界點序列執行傅里葉變換操作,得到所述標注傅里葉特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司;華南理工大學,未經北京市商湯科技開發有限公司;華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110112063.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:環型骨鉆
- 下一篇:一種排行榜系統及生成排行榜的方法





