[發(fā)明專利]文本檢測方法、裝置及電子設備在審
| 申請?zhí)枺?/td> | 202110261374.9 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112989995A | 公開(公告)日: | 2021-06-18 |
| 發(fā)明(設計)人: | 呂鵬原;章成全;劉珊珊;王曉燕;張勝;庾悅晨;喬美娜 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/46;G06K9/62 |
| 代理公司: | 北京銀龍知識產(chǎn)權代理有限公司 11243 | 代理人: | 黃燦;劉念 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 檢測 方法 裝置 電子設備 | ||
本申請公開了文本檢測方法、裝置及電子設備,涉及計算機視覺、深度學習等人工智能技術領域。具體實現(xiàn)方案為:獲取目標圖片;對所述目標圖片進行特征提取,得到所述目標圖片的第一特征;基于所述第一特征對所述目標圖片進行文本檢測,以確定所述目標圖片的第一文本候選框;基于所述第一特征進行掩膜解碼,得到所述目標圖片的M個掩膜圖像以及所述第一文本候選框針對所述M個掩膜圖像的M個權重信息,M為正整數(shù);基于所述第一文本候選框、所述M個掩膜圖像和所述M個權重信息,確定所述目標圖片的文本位置。根據(jù)本申請的技術,解決了文本檢測識別技術存在的場景文本檢測精準性比較低的問題,能夠?qū)崿F(xiàn)任意形狀的場景文本檢測識別。
技術領域
本申請涉及人工智能技術領域,尤其涉及計算機視覺、深度學習技術領域,具體涉及一種文本檢測方法、裝置及電子設備。
背景技術
自然場景下的文本檢測識別技術可以被廣泛應用于社會的各行各業(yè),如教育、醫(yī)療、金融等領域。由文本檢測識別技術派生的常見卡證票據(jù)的識別、文檔的自動化錄入以及拍照搜題等技術極大地提升了傳統(tǒng)行業(yè)的智能化程度和生產(chǎn)效率,方便了人們的日常學習與生活。
目前,對于自然場景圖像中的文本信息進行檢測,通常是基于區(qū)域?qū)D像進行檢測生成文本候選框,其目的是得到文本包圍框的位置。
發(fā)明內(nèi)容
本公開提供了一種文本檢測方法、裝置及電子設備。
根據(jù)本公開的第一方面,提供了一種文本檢測方法,包括:
獲取目標圖片;
對所述目標圖片進行特征提取,得到所述目標圖片的第一特征;
基于所述第一特征對所述目標圖片進行文本檢測,以確定所述目標圖片的第一文本候選框;
基于所述第一特征進行掩膜解碼,得到所述目標圖片的M個掩膜圖像以及所述第一文本候選框針對所述M個掩膜圖像的M個權重信息,M為正整數(shù);
基于所述第一文本候選框、所述M個掩膜圖像和所述M個權重信息,確定所述目標圖片的文本位置。
根據(jù)本公開的第二方面,提供了一種文本檢測裝置,包括:
獲取模塊,用于獲取目標圖片;
特征提取模塊,用于對所述目標圖片進行特征提取,得到所述目標圖片的第一特征;
文本檢測模塊,用于基于所述第一特征對所述目標圖片進行文本檢測,以確定所述目標圖片的第一文本候選框;
掩膜解碼模塊,用于基于所述第一特征進行掩膜解碼,得到所述目標圖片的M個掩膜圖像以及所述第一文本候選框針對所述M個掩膜圖像的M個權重信息,M為正整數(shù);
文本確定模塊,用于基于所述第一文本候選框、所述M個掩膜圖像和所述M個權重信息,確定所述目標圖片的文本位置。
根據(jù)本公開的第三方面,提供了一種電子設備,包括:
至少一個處理器;以及
與至少一個處理器通信連接的存儲器;其中,
存儲器存儲有可被至少一個處理器執(zhí)行的指令,該指令被至少一個處理器執(zhí)行,以使至少一個處理器能夠執(zhí)行第一方面中的任一項方法。
根據(jù)本公開的第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),該計算機指令用于使計算機執(zhí)行第一方面中的任一項方法。
根據(jù)本公開的第五方面,提供了一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)第一方面中的任一項方法。
根據(jù)本申請的技術解決了文本檢測識別技術存在的場景文本檢測精準性比較低的問題,能夠?qū)崿F(xiàn)任意形狀的場景文本檢測識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110261374.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





