[發(fā)明專利]圖片文字識別方法在審
| 申請?zhí)枺?/td> | 201611166407.7 | 申請日: | 2016-12-16 |
| 公開(公告)號: | CN106778727A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計)人: | 劉洋 | 申請(專利權(quán))人: | 高格(天津)信息科技發(fā)展有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300384 天津市南開區(qū)天津市濱海高新區(qū)華*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖片 文字 識別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖文軟件領(lǐng)域,特別地,是一種圖片文字識別方法。
背景技術(shù)
對于圖片上的文字,在較多情況下需要進(jìn)行大段地復(fù)制使用,因此,必須要首先通過軟件方法先將圖片形式的文字轉(zhuǎn)換成可編輯文字;在此過程中,目前使用的方法是,采用一套字模庫,將圖片中截取的每一個圖元文字與字模庫中的各個字模文字進(jìn)行對比,并將相似度最高的字模文字以可編輯文字的形式輸出,從而使用戶獲得所需的可編輯文本。
然而,由于各種圖片形式的文本通常采用不同的字體,而目前在將圖元文字與字模文字相對比時,通常只采用一套字模庫,因此,倘若圖元文字的字體與字模庫中的字體不同時,則文字識別的準(zhǔn)確性并不高;若采用多套字模庫,則按一套字模庫的逐字對比的方式,每個圖元文字將需要與多套字模庫中的各字模文字相對比,其工作量十分巨大。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明的目的在于提供一種圖片文字識別方法,該方法可以準(zhǔn)確而高效地識別圖片中的文字信息。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:該圖片文字識別方法如下:將用戶框選的圖片上的文本區(qū)域以當(dāng)前圖片形式讀??;對框選文本區(qū)域中的各個圖元文字分別進(jìn)行選?。粚⒖蜻x文本區(qū)域中的第一個圖元文字與各種常規(guī)字體對應(yīng)的字模庫中的各個字模文字作對比,找到相似度最近的字模文字;并記錄該相似度最高的字模文字所在的字模庫,定義為標(biāo)準(zhǔn)字模庫,此后,將所述框選文本區(qū)域中第一個圖元文字后面的各圖元文字只與所述標(biāo)準(zhǔn)字模庫中的各字模文字作比較,在標(biāo)準(zhǔn)字模庫中分別找到相似度最高的字模文字,并以可編輯文字的形式輸出。
作為優(yōu)選,所述常規(guī)字體對應(yīng)的字模庫包括宋體、仿宋、黑體、楷體、行楷、隸書對應(yīng)的字模庫。
作為優(yōu)選,在分別選取所述框選文本區(qū)域中的各個圖元文字時,采用矩形框的形式,所述矩形框的框線與各圖元文字的最上端、最左端、最下端、最右端相切。
作為優(yōu)選,在將圖元文字與字模文字作對比時,首先將字模文字進(jìn)行縮放,使之與欲作對比的圖元文字大小相同,然后,將縮放好的字模文字轉(zhuǎn)換成字模圖元,與所述圖元文字作布爾差運算,然后以布爾差之后剩下的文字顏色的多少來衡量相似度,即剩下的文字顏色越少,則相似度越高。
本發(fā)明的有益效果在于:在將圖元文字與字模文字作對比時,由于采用了多種字模庫,因此,使得識別的準(zhǔn)確性得到了很大程度的提高,而由于本方法在對于所述框選文本區(qū)域中的第一個圖元文字作對比的過程中,就可以確定框選文本區(qū)域中的第一個圖元文字的字體,從而推出該框選文本區(qū)域中所有圖元文字的字體,這就可以使得后面的圖元文字僅與一種字模庫中的字模文字進(jìn)行對比,不僅對比工作量小,且不失準(zhǔn)確性。
具體實施方式
下面對本發(fā)明進(jìn)一步說明:
本發(fā)明提供的圖片文字識別方法如下:將用戶框選的圖片上的文本區(qū)域以當(dāng)前圖片形式讀取,如,當(dāng)前圖片為允8格式的,那么用戶在當(dāng)前圖片上框選部分文本后,將用戶框選的文本區(qū)域視為一張待處理的允8圖片;然后,對待處理的允8圖片中的各個圖元文字分別進(jìn)行選取,選取時,采用矩形框的形式,以從上至下、從左到右的順序逐個選取圖元文字,所述矩形框的框線與各圖元文字的最上端、最左端、最下端、最右端相切;當(dāng)選取所述框選文本區(qū)域中的第一個圖元文字后,將其與各種常規(guī)字體對應(yīng)的字模庫中的各個字模文字作對比,找到相似度最近的字模文字,將該字模文字以可編輯文字形式輸出,同時,記錄該相似度最高的字模文字所在的字模庫,定義為標(biāo)準(zhǔn)字模庫;此后,將所述框選文本區(qū)域中第一個圖元文字后面的各圖元文字只與所述標(biāo)準(zhǔn)字模庫中的各字模文字作比較,在標(biāo)準(zhǔn)字模庫中分別找到相似度最高的字模文字,并以可編輯文字的形式輸出。
為了滿足絕大部分圖元文字的字體需求,所述常規(guī)字體對應(yīng)的字模庫包括宋體、仿宋、黑體、楷體、行楷、隸書對應(yīng)的字模庫。
另外,在將圖元文字與字模文字作對比時,首先將字模文字進(jìn)行縮放,使之與欲作對比的圖元文字大小相同,然后,將縮放好的字模文字轉(zhuǎn)換成字模圖元,與所述圖元文字作布爾差運算,然后以布爾差之后剩下的文字顏色的多少來衡量相似度,即剩下的文字顏色越少,則相似度越高;如,通常情況下,文字顏色為黑色,則將所述字模圖元與圖元文字作布爾差運算后,它們相重合部分的黑色被消除了,由背景色替代,那么如果字模圖元和圖元文字完全一樣,則布爾差運算之后,則黑色的剩余量為零,而相似度越低,則黑色的剩余量就越大。
本發(fā)明提供的圖片文字識別方法在將圖元文字與字模文字作對比時,由于采用了多種字模庫,因此,使得識別的準(zhǔn)確性得到了很大程度的提高,而由于本方法在對于所述框選文本區(qū)域中的第一個圖元文字作對比的過程中,就可以確定框選文本區(qū)域中的第一個圖元文字的字體,從而推出該框選文本區(qū)域中所有圖元文字的字體,這就可以使得后面的圖元文字僅與一種字模庫中的字模文字進(jìn)行對比,不僅對比工作量小,且不失準(zhǔn)確性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于高格(天津)信息科技發(fā)展有限公司,未經(jīng)高格(天津)信息科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611166407.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:板卡定位方法及裝置
- 下一篇:一種移動終端掃描方法、裝置及移動終端
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





