[發明專利]文本區域檢測方法及裝置、文本檢測方法、計算機可讀介質在審
| 申請號: | 201810225220.2 | 申請日: | 2018-03-19 |
| 公開(公告)號: | CN110263779A | 公開(公告)日: | 2019-09-20 |
| 發明(設計)人: | 劉銘 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/00 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本區域 文本檢測 計算機可讀介質 檢測 特征圖譜 序列信息 計算機技術領域 特征獲得 原始圖像 準確度 可行度 漏檢率 誤檢率 聚合 | ||
本發明涉及計算機技術領域,提供了一種文本區域檢測方法及裝置、文本檢測方法、計算機可讀介質,該文本區域檢測方法包括:提取一原始圖像的特征獲得一特征圖譜;基于所述特征圖譜進行文本區域檢測,獲取多個文本區域碎片;獲取多個所述文本區域碎片的序列信息,并根據所述序列信息將多個所述文本區域碎片形成文本區域碎片序列;將所述文本區域碎片序列聚合獲得文本區域。本發明降低了文本檢測的誤檢率和漏檢率,提高了文本檢測的準確度和可行度。
技術領域
本發明涉及計算機技術領域,具體而言,涉及一種文本區域檢測方法 及裝置、文本檢測方法、計算機可讀介質。
背景技術
隨著互聯網技術的高速發展以及智能手機的迅速普及,使我們的生活 越來越便捷。通常我們會使用數碼相機、攝像頭或手機拍照并上傳材料(如 身份證、營業執照、頭像等),供運營方驗證用戶的身份、資質,但由于 在自然場景下拍照背景復雜、環境干擾因素多,圖片中的文本很難與背景 區分開,并且照片中還存在文本被部分遮擋的情況,這對文本檢測造成了 很大的挑戰。為了識別自然場景圖像中的文本,專家設計了許多 OCR(Optical Character Recognition,光學字符識別)字符識別系統,這些系 統對文檔中的文本通常有較好的檢測效果,但是對于場景圖像中的文本檢 測效果較差。這是因為場景圖像文本的變化多樣,并且圖像背景也相對復 雜,很難直接通過OCR軟件識別。因此文本定位是理解場景圖像文本的 首要步驟,將文本定位后才能進一步對文本內容進行分類識別。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本發明 的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技 術的信息。
發明內容
本發明的目的在于提供一種文本區域檢測方法及裝置、文本檢測方 法、計算機可讀介質,進而降低文本檢測的誤檢率和漏檢率,提高文本 檢測的準確度和可行度。
本發明的其他特性和優點將通過下面的詳細描述變得顯然,或部分 地通過本發明的實踐而習得。
根據本發明的第一方面,提供一種文本區域檢測方法,其特征在于, 包括:提取一原始圖像的特征獲得一特征圖譜;基于所述特征圖譜進行 文本區域檢測,獲取多個文本區域碎片;獲取多個所述文本區域碎片的 序列信息,并根據所述序列信息將多個所述文本區域碎片形成文本區域 碎片序列;將所述文本區域碎片序列聚合獲得文本區域。
根據本發明的第二方面,提供一種文本檢測方法,其特征在于,包 括:根據上述的文本區域檢測方法獲取所述文本區域;識別所述文本區 域中的文本信息,獲得文本。
根據本發明的第三方面,提供一種文本區域檢測裝置,其特征在于, 包括:特征提取模塊,用于提取一原始圖像的特征獲得一特征圖譜;碎 片獲取模塊,用于基于所述特征圖譜進行文本區域檢測,獲取多個文本 區域碎片;序列信息獲取模塊,用于獲取多個所述文本區域碎片的序列 信息,并根據所述序列信息將多個所述文本區域碎片形成文本區域碎片 序列;聚合模塊,用于將所述文本區域碎片序列聚合獲得文本區域。
在本發明的一些實施例中,基于前述方案,本發明的特征提取模塊 包括:卷積單元,用于通過殘差網絡模型對所述原始圖像進行多級卷積 獲得所述特征圖譜。
在本發明的一些實施例中,基于前述方案,本發明的碎片獲取模塊 包括:錨點設置單元,用于在所述特征圖譜的每個像素上設置一組錨點; 特征提取單元,用于通過滑窗提取所述錨點對應的圖像特征,生成多個 所述文本區域碎片。
在本發明的一些實施例中,基于前述方案,本發明的錨點設置單元 包括:寬度設定單元,用于在所述特征圖譜的每個像素上設置一組寬度 固定的錨點。
在本發明的一些實施例中,基于前述方案,本發明的序列信息獲取 模塊包括:序列信息提取單元,用于將所述文本區域碎片輸入至一長短 期記憶模型,以獲得所述文本區域碎片的序列信息,并根據所述序列信 息將多個文本區域碎片形成文本區域碎片序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810225220.2/2.html,轉載請聲明來源鉆瓜專利網。





