[發(fā)明專利]一種文本圖像傾斜角度的檢測(cè)方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202011095925.0 | 申請(qǐng)日: | 2020-10-14 |
| 公開(kāi)(公告)號(hào): | CN112287927B | 公開(kāi)(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計(jì))人: | 郭從洲;李可;朱奕坤;童曉沖;李賀;魏鑫;王習(xí)文;張錦添;雷毅 | 申請(qǐng)(專利權(quán))人: | 中國(guó)人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué) |
| 主分類號(hào): | G06V20/62 | 分類號(hào): | G06V20/62;G06V10/24;G06V10/764 |
| 代理公司: | 北京國(guó)昊天誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 張倩;朱文杰 |
| 地址: | 450001 河*** | 國(guó)省代碼: | 河南;41 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 圖像 傾斜 角度 檢測(cè) 方法 裝置 | ||
本說(shuō)明書(shū)實(shí)施例提供了文本圖像傾斜角度的檢測(cè)方法及裝置,通過(guò)預(yù)先訓(xùn)練好包含一階段二分類網(wǎng)絡(luò)模型和多階段多分類網(wǎng)絡(luò)模型的深度神經(jīng)網(wǎng)絡(luò)模型集合,在獲取到目標(biāo)文本圖像信息后,結(jié)合該目標(biāo)文本圖像信息對(duì)應(yīng)的傾斜角度用途標(biāo)注信息,確定對(duì)應(yīng)的目標(biāo)神經(jīng)網(wǎng)絡(luò)模型,再利用該目標(biāo)神經(jīng)網(wǎng)絡(luò)模型識(shí)別得到目標(biāo)文本圖像信息的圖像傾斜角度數(shù)據(jù),這樣能夠提高圖像傾斜角度的確定準(zhǔn)確率,提高圖像傾斜角度的識(shí)別效率,提升了圖像傾斜角度的參考價(jià)值,以便作為后續(xù)文本圖像處理的關(guān)鍵依據(jù);另外,針對(duì)多階段多分類網(wǎng)絡(luò)模型,通過(guò)對(duì)目標(biāo)文本圖像信息執(zhí)行多次傾斜角度類別識(shí)別,實(shí)現(xiàn)由大角度區(qū)間類別到小角度區(qū)間類別逐層細(xì)化確定最終的圖像傾斜角度數(shù)據(jù)。
技術(shù)領(lǐng)域
本文件涉及文本圖像傾斜角度的檢測(cè)領(lǐng)域,尤其涉及一種文本圖像傾斜角度的檢測(cè)方法及裝置。
背景技術(shù)
目前,光學(xué)字符識(shí)別(Optical?Character?Recognition,OCR)是指對(duì)文本圖像進(jìn)行處理,獲取文字及版面信息的過(guò)程,也是光學(xué)理論實(shí)踐應(yīng)用的一個(gè)重要研究方向。不論是傳統(tǒng)意義上OCR技術(shù)還是基于深度學(xué)習(xí)的OCR技術(shù),均需要獲得更高的文字識(shí)別精度和準(zhǔn)確率。
隨著深度學(xué)習(xí)技術(shù)的發(fā)展,人們?cè)谖淖肿R(shí)別方法上取得了很大的進(jìn)步,已經(jīng)將文本檢測(cè)和文本識(shí)別集成到了一個(gè)模型中。從單一的水平直線文字行到現(xiàn)在的各類曲線文字行都能有很好的識(shí)別結(jié)果。然而,文字識(shí)別過(guò)程中要求單個(gè)文字方向要保持大致上的“正立”,如果出現(xiàn)“倒立”的文字,識(shí)別準(zhǔn)確率就會(huì)變得很低,可見(jiàn)文字識(shí)別準(zhǔn)確率除了與識(shí)別方法有關(guān)以外,還與文本圖像中文字的傾斜方向和角度也密切相關(guān)。
其中,常見(jiàn)的文本傾斜角度方法主要有投影法、Hough變換法、K-最近鄰簇法、Fourier變換法及其變種方法。這些方法的基本原理都是先檢測(cè)文本圖像中的直線特征,利用直線的斜率來(lái)確定文本圖像的傾斜角度,然后再進(jìn)行傾斜校正。這些檢測(cè)方法均需要文本圖像中一定要有直線特征或類似于直線的特征,人們常常對(duì)文本圖像進(jìn)行游長(zhǎng)平滑及細(xì)化處理來(lái)獲取文本行直線。由于直線的傾斜角度范圍是在±90°之間,而文本圖像的傾斜角度范圍是在±180°之間,因此,當(dāng)文本圖像旋轉(zhuǎn)180°成為倒立圖像時(shí),利用常規(guī)的傾斜角度檢測(cè)方法無(wú)法得到準(zhǔn)確度傾斜角度。也就是說(shuō),當(dāng)文本圖像傾斜角度大于90°或小于90°時(shí),利用將直線的傾斜角理解為文本圖像的傾斜角都是錯(cuò)誤的。由于文本圖像傾斜程度不僅與角度有關(guān)也與方向有關(guān),而常規(guī)的直線檢測(cè)法是無(wú)法檢測(cè)出旋轉(zhuǎn)方向的。
由此可知,需要一種不依賴直線特征的、更加普適的、準(zhǔn)確度更高地文本圖像傾斜角度檢測(cè)的方法。
發(fā)明內(nèi)容
本說(shuō)明書(shū)一個(gè)或多個(gè)實(shí)施例的目的是提供一種文本圖像傾斜角度的檢測(cè)方法。該文本圖像傾斜角度的檢測(cè)方法包括:
獲取待檢測(cè)的目標(biāo)文本圖像信息;
基于所述目標(biāo)文本圖像信息的傾斜角度用途標(biāo)注信息,在預(yù)先訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型集合中選擇目標(biāo)神經(jīng)網(wǎng)絡(luò)模型;其中,所述深度神經(jīng)網(wǎng)絡(luò)模型集合包括:一階段二分類網(wǎng)絡(luò)模型和多階段多分類網(wǎng)絡(luò)模型;
利用所述目標(biāo)神經(jīng)網(wǎng)絡(luò)模型,對(duì)所述目標(biāo)文本圖像信息進(jìn)行圖像傾斜角度識(shí)別處理,得到所述目標(biāo)文本圖像信息的圖像傾斜角度數(shù)據(jù);其中,所述圖像傾斜角度數(shù)據(jù)是基于對(duì)所述目標(biāo)文本圖像信息執(zhí)行至少一次傾斜角度類別識(shí)別所確定的。
本說(shuō)明書(shū)一個(gè)或多個(gè)實(shí)施例的目的是提供一種文本圖像傾斜角度的檢測(cè)裝置。該文本圖像傾斜角度的檢測(cè)裝置包括:
文本圖像獲取模塊,用于獲取待檢測(cè)的目標(biāo)文本圖像信息;
目標(biāo)網(wǎng)絡(luò)選取模塊,用于基于所述目標(biāo)文本圖像信息的傾斜角度用途標(biāo)注信息,在預(yù)先訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型集合中選擇目標(biāo)神經(jīng)網(wǎng)絡(luò)模型;其中,所述深度神經(jīng)網(wǎng)絡(luò)模型集合包括:一階段二分類網(wǎng)絡(luò)模型和多階段多分類網(wǎng)絡(luò)模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué),未經(jīng)中國(guó)人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011095925.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





