[發明專利]文本框檢測方法、裝置、電子設備和計算機存儲介質有效
| 申請號: | 202011435586.6 | 申請日: | 2020-12-11 |
| 公開(公告)號: | CN112232315B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 秦勇 | 申請(專利權)人: | 北京易真學思教育科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 楊瑾瑾;林軍 |
| 地址: | 100144 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本框 檢測 方法 裝置 電子設備 計算機 存儲 介質 | ||
1.一種文本框檢測方法,其特征在于,所述方法包括:
將目標圖像輸入目標模型,得到所述目標模型輸出的多個通道;其中,所述多個通道包括N個大檢測框的預測信息以及M個小檢測框的預測信息;所述M個小檢測框的預測信息,包括:所述M個小檢測框分別對應的旋轉角度;其中,N和M均為大于等于1的整數;
基于所述多個通道確定所述目標圖像所對應的N個大檢測框以及所述N個大檢測框中每一個大檢測框內的多個小檢測框;
對所述N個大檢測框中的每一個大檢測框中的多個小檢測框進行位置排列,得到所述每一個大檢測框中的多個小檢測框的相對位置關系;
基于所述N個大檢測框中每一個大檢測框內的多個小檢測框的相對位置關系,以及所述多個小檢測框的頂點,確定所述N個大檢測框中每一個大檢測框內的K個標注坐標點;K為大于1的整數;
基于所述N個大檢測框內的所述K個標注坐標點,確定所述目標圖像中包含的N個目標文本框;
其中,所述基于所述N個大檢測框內的所述K個標注坐標點,確定所述目標圖像中包含的N個目標文本框,包括:基于所述N個大檢測框的第i個大檢測框對應的K個標注坐標點進行連接得到連線圖;從連線圖中選取一個覆蓋面積最大的閉合的多個連線組成的文本框,將所述文本框作為第i個目標文本框;其中,i為大于等于1且小于等于N的整數。
2.根據權利要求1所述的方法,其特征在于,所述多個通道中所述N個大檢測框的預測信息,包括:所述N個大檢測框的中心點得分圖、所述N個大檢測框的中心點的偏移量、所述N個大檢測框的預測寬度值以及預測高度值;
所述多個通道中所述M個小檢測框的預測信息,還包括:所述M個小檢測框的中心點得分圖、所述M個小檢測框的中心點的偏移量、所述M個小檢測框的預測寬度值以及預測高度值。
3.根據權利要求2所述的方法,其特征在于,所述基于所述多個通道確定所述目標圖像所對應的N個大檢測框以及所述N個大檢測框內的多個小檢測框,包括:
基于所述多個通道確定所述目標圖像所對應的N個大檢測框,以及基于所述多個通道確定所述目標圖像所對應的M個小檢測框;
基于所述N個大檢測框以及M個小檢測框的相對位置,確定所述N個大檢測框內的多個小檢測框。
4.根據權利要求3所述的方法,其特征在于,基于所述多個通道確定所述目標圖像所對應的N個大檢測框,包括:
基于所述多個通道中所述N個大檢測框的中心點得分圖,確定N個大檢測框的中心點的預測位置坐標;
基于所述多個通道中所述N個大檢測框的中心點的偏移量,分別對所述N個大檢測框的中心點的預測位置坐標進行調整,得到調整后的所述N個大檢測框的中心點位置坐標;
基于所述多個通道中所述N個大檢測框的預測寬度值以及預測高度值、以及所述N個大檢測框的中心點位置坐標,確定所述N個大檢測框。
5.根據權利要求3所述的方法,其特征在于,基于所述多個通道確定所述目標圖像所對應的M個小檢測框,包括:
基于所述多個通道中所述M個小檢測框的中心點得分圖,確定所述M個小檢測框的中心點的預測位置坐標;
基于所述多個通道中所述M個小檢測框的中心點的偏移量,分別對所述M個小檢測框的中心點的預測位置坐標進行調整,得到調整后的所述M個小檢測框的中心點位置坐標;
基于所述多個通道中所述M個小檢測框的預測寬度值以及預測高度值、以及所述M個小檢測框的中心點位置坐標,確定M個小檢測框的初始框;
基于所述多個通道中所述M個小檢測框分別對應的旋轉角度,對所述M個小檢測框的初始框進行旋轉,得到所述M個小檢測框。
6.根據權利要求1所述的方法,其特征在于,所述對所述N個大檢測框中的每一個大檢測框中的多個小檢測框進行位置排列,得到所述每一個大檢測框中的多個小檢測框的相對位置關系,包括:
基于所述N個大檢測框中的第i個大檢測框的中心點坐標至所述第i個大檢測框的多個小檢測框的中心點坐標之間的向量與第一方向之間的夾角的大小順序,對所述第i個大檢測框中的多個小檢測框進行位置排列,得到所述多個小檢測框的相對位置關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京易真學思教育科技有限公司,未經北京易真學思教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011435586.6/1.html,轉載請聲明來源鉆瓜專利網。





