[發明專利]練字格檢測方法、裝置、可讀介質及電子設備有效
| 申請號: | 202110341076.0 | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN113033539B | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 張宇軒;林麗;黃燦;王長虎 | 申請(專利權)人: | 北京有竹居網絡技術有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/19 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 曹寒梅 |
| 地址: | 101299 北京市平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 練字 檢測 方法 裝置 可讀 介質 電子設備 | ||
1.一種練字格檢測方法,其特征在于,所述方法包括:
獲取目標圖像;
根據預先訓練好的練字格檢測模型確定所述目標圖像中的各個練字格的位置信息及練字格類型,所述練字格類型為完整且含字的練字格、完整且不含字的練字格、不完整且含字的練字格、不完整且不含字的練字格中的任一者;
所述根據預先訓練好的練字格檢測模型確定所述目標圖像中的各個練字格的位置信息及練字格類型包括:
通過所述練字格檢測模型獲取檢測練字格的位置信息和所述檢測練字格所屬的練字格類型,所述檢測練字格為由所述練字格檢測模型所檢測得到的一個或多個練字格;其中:通過所述練字格檢測模型輸出四個通道的第一特征圖,所述四個通道用于區分所述練字格類型,各通道的第一特征圖用于表征所述目標圖像中各像素點屬于該通道對應的練字格類型的練字格中心點的置信度;根據所述置信度在所述四個通道的第一特征圖中的所有像素點中分別查找局部最大值,并對各通道的第一特征圖中的所有局部最大值按照從大到小的順序排序,保留前N個局部最大值對應的像素點作為所述檢測練字格的中心點,所述N為第一預設閾值;通過所述練字格檢測模型輸出八個通道的第二特征圖,所述八個通道分別用于表征所述目標圖像中的每一個像素點作為所述練字格中心點時,四個角點相對于所述像素點的坐標的偏移量;根據所述八個通道的第二特征圖和所述檢測練字格的中心點確定所述檢測練字格的位置信息,并根據所述檢測練字格的中心點在所述四個通道的特征圖中分別對應的置信度大小確定所述檢測練字格所屬的練字格類型。
2.根據權利要求1所述的方法,其特征在于,所述根據預先訓練好的練字格檢測模型確定所述目標圖像中的各個練字格的位置信息及練字格類型還包括:
根據所述位置信息對重疊程度超過預設條件的檢測練字格進行刪除,并將保留下來的檢測練字格確定為所述目標圖像中存在的練字格。
3.根據權利要求2所述的方法,其特征在于,所述預設條件為任意兩個所述檢測練字格之間的交并比大于第二預設閾值,所述根據所述位置信息對重疊程度超過預設條件的檢測練字格進行刪除包括:
計算所述檢測練字格之間的交并比;
在出現兩個所述檢測練字格的交并比大于所述第二預設閾值的情況時,確定將其中所述置信度較低的中心點對應的檢測練字格進行刪除。
4.根據權利要求1所述的方法,其特征在于,所述練字格檢測模型在進行訓練時,控制訓練樣本中的正負樣本選取比例為目標比例,其中,正樣本為所述練字格檢測模型輸出的特征圖中非零值的像素點,負樣本為所述練字格檢測模型輸出的特征圖中值為零的像素點。
5.根據權利要求1所述的方法,其特征在于,所述練字格檢測模型的訓練樣本中的標注為所述訓練樣本中所有練字格的四個角點的按序排列的坐標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京有竹居網絡技術有限公司,未經北京有竹居網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110341076.0/1.html,轉載請聲明來源鉆瓜專利網。





