[發(fā)明專利]文本檢測方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110821804.8 | 申請日: | 2021-07-21 |
| 公開(公告)號: | CN113269280B | 公開(公告)日: | 2021-10-08 |
| 發(fā)明(設(shè)計)人: | 秦勇 | 申請(專利權(quán))人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/34;G06N3/04 |
| 代理公司: | 北京北匯律師事務(wù)所 11711 | 代理人: | 馬亞坤 |
| 地址: | 100086 北京市海淀區(qū)中*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 檢測 方法 裝置 電子設(shè)備 計算機 可讀 存儲 介質(zhì) | ||
1.一種文本檢測方法,包括:
獲取待檢測文本圖像;
獲取所述待檢測文本圖像的第一特征映射;
將所述第一特征映射輸入至特征金字塔增強模塊,生成第二特征映射;
對所述第二特征映射進行第一卷積處理,生成預測目標的中心點得分圖;
將所述中心點得分圖與所述第一特征映射逐通道逐點相乘,得到一組合并特征映射;
對所述一組合并特征映射進行第二卷積處理,生成預測目標的定位得分圖,所述定位得分圖上每個像素點的值表示這個像素點是物體唯一中心點的概率;
根據(jù)所述定位得分圖定位預測目標的中心點;
根據(jù)所述中心點定位文本框;
所述獲取所述待檢測文本圖像的第一特征映射,包括:將所述待檢測文本圖像輸入至Resnet18網(wǎng)絡(luò)模型,得到M組特征映射,將所述M組特征映射作為所述第一特征映射;其中所述Resnet18網(wǎng)絡(luò)模型包括M個塊串聯(lián)構(gòu)建;
所述將所述中心點得分圖與所述第一特征映射逐通道逐點相乘,得到一組合并特征映射,包括:對所述M組特征映射,通過上下采樣的方式全部變?yōu)樗龃龣z測文本圖像的1/8大小并串聯(lián)疊加,將所述中心點得分圖縮放到所述待檢測文本圖像的1/8大小并與疊加后得到的特征映射逐通道逐點相乘,得到一組合并特征映射。
2.如權(quán)利要求1所述的文本檢測方法,其中,所述方法還包括:
對所述第二特征映射進行第三卷積處理,生成預測目標的中心點偏移量;
將所述定位得分圖中大于預設(shè)閾值的像素點作為所述中心點;
根據(jù)所述中心點偏移量確定所述中心點的坐標;
根據(jù)所述中心點的坐標定位文本框。
3.如權(quán)利要求2所述的文本檢測方法,其中,所述方法還包括:
對所述第二特征映射進行第四卷積處理,得到預測目標的旋轉(zhuǎn)角度;
對所述第二特征映射進行第五卷積處理,得到預測目標的高度和寬度;
根據(jù)所述中心點的坐標、所述旋轉(zhuǎn)角度、所述高度和寬度定位所述文本框。
4.如權(quán)利要求1所述的文本檢測方法,其中,對所述一組合并特征映射進行第二卷積處理,生成預測目標的定位得分圖包括:
將所述一組合并特征映射輸入神經(jīng)網(wǎng)絡(luò)模型進行一次反卷積操作和二次卷積操作,得到所述定位得分圖;
其中,所述神經(jīng)網(wǎng)絡(luò)模型通過使用二分類交叉熵損失函數(shù)對一次反卷積層和二次卷積層的參數(shù)進行訓練得到;所述一次反卷積層與所述一次反卷積操作對應(yīng),所述二次卷積層與所述二次卷積操作對應(yīng)。
5.如權(quán)利要求1所述的文本檢測方法,其中,將所述第一特征映射輸入至特征金字塔增強模塊,得到第二特征映射包括:
將所述第一特征映射中的N組大小不同的多通道特征映射按照從大到小的次序分為正向第1、2、3…N組特征映射;
將正向第N組特征映射作為反向第一組特征映射,將正向第N組特征映射進行上采樣之后,與正向第N-1組特征映射按照通道逐點相加并進行第六卷積處理,得到反向第二組特征映射;
將所述反向第二組特征映射進行上采樣之后,與所述正向第N-2組特征映射按照通道逐點相加并進行第七卷積處理,得到反向第二組特征映射;依次對每一組正向特征映射進行同樣的操作,得到反向第N組特征映射;
將反向第N組特征映射作為目標第一組特征映射,對所述反向第N組特征映射進行下采樣之后,與反向第N-1組特征映射按照通道逐點相加并進行第八卷積處理,得到目標第二組特征映射;
將所述目標第二組特征映射進行下采樣之后,與所述反向第N-2組特征映射按照通道逐點相加并進行第九卷積處理,得到目標第二組特征映射;依次對每一組反向特征映射進行同樣的操作,得到目標第N組特征映射;
將所述目標第N組特征映射作為所述第二特征映射;
N為正整數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京世紀好未來教育科技有限公司,未經(jīng)北京世紀好未來教育科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110821804.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





