[發明專利]圖像的文本區域定位方法、裝置、服務器及可讀存儲介質在審
| 申請號: | 202011387900.8 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112308046A | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 聶鐳;鄒茂泰;聶穎 | 申請(專利權)人: | 龍馬智芯(珠海橫琴)科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/42;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 519031 廣東省珠海市橫琴新區環島*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 文本 區域 定位 方法 裝置 服務器 可讀 存儲 介質 | ||
本申請適用于圖像識別技術領域,提供了一種圖像的文本區域定位方法、裝置、服務器及可讀存儲介質方法,該方法包括:獲取待檢測圖像;根據預設的Faster R?CNN檢測模型識別待檢測圖像中的目標對象以及在待檢測圖像中目標對象所在的目標區域;生成目標對象所在的目標區域對應的第一文本矩形區域;獲取目標對象對應的樣本圖像,以及樣本圖像的第二文本矩形區域;根據第一文本矩形區域與第二文本矩形區域進行匹配的結果,確定出待檢測圖像中的可檢測文本區域。可見,本申請不需要利用圖像中目標對象邊框來進行定位,從而解決在目標對象圖像中邊框不全或者沒有邊框的情況下,可以準確定位目標對象圖像中文本區域的位置。
技術領域
本申請屬于圖像識別技術領域,尤其涉及一種圖像的文本區域定位方法、裝置、服務器及可讀存儲介質。
背景技術
OCR (Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。
一般地,現有技術利用OCR技術識別圖像中文字(例如,識別身份證圖像中文字)的方法是基于邊框定位目標對象圖像中的文本區域,然后再利用OCR引擎識別該文本區域中的文本,但是存在目標對象圖像中邊框不全或者沒有邊框的情況下,不能準確檢測目標對象圖像中文本區域的位置,導致無法后續利用OCR引擎識別出該文本區域中的文本。
發明內容
本申請實施例提供了一種圖像的文本區域定位方法、裝置、服務器及可讀存儲介質,可以解決現有技術中無法準確檢測目標對象對應區域內文本的問題。
第一方面,本申請實施例提供了一種圖像的文本區域方法,包括:
獲取待檢測圖像;
根據預設的Faster R-CNN檢測模型識別所述待檢測圖像中的目標對象以及在所述待檢測圖像中所述目標對象所在的目標區域;
生成所述目標對象所在的目標區域對應的第一文本矩形區域;
獲取所述目標對象對應的樣本圖像,以及所述樣本圖像的第二文本矩形區域;
根據所述第一文本矩形區域與所述第二文本矩形區域進行匹配的結果,確定出所述待檢測圖像中的可檢測文本區域。
在第一方面的一種可能的實現方式中,生成所述目標對象所在的目標區域對應的第一文本矩形區域,包括:
對所述目標對象所在的區域進行二值化處理,得到所述第一文本矩形區域。
在第一方面的一種可能的實現方式中,對所述目標對象所在的區域進行二值化處理,得到所述第一文本矩形區域之后,還包括:
計算每個所述第一文本矩形區域的長對應的斜率,得到所述斜率平均值;
根據所述斜率平均值旋轉所述目標對象所在的區域至水平位置。
在第一方面的一種可能的實現方式中,根據所述第一文本矩形區域與所述第二文本矩形區域進行匹配的結果,確定出所述待檢測圖像中的可檢測文本區域,包括:
根據下列公式確定第一文本矩形區域與所述第二文本矩形區域之間的第一重合度:
,
其中,IOU表示所述第一文本矩形區域與所述第二文本矩形區域之間的第一重合度,表示第一文本矩形區域的第一面積值,表示第二文本矩形區域的第二面積值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于龍馬智芯(珠海橫琴)科技有限公司,未經龍馬智芯(珠海橫琴)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011387900.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種光致變色鈞瓷釉
- 下一篇:一種基于STM32的家庭用電智能監控系統
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





