[發(fā)明專利]圖片文字識別方法在審

申請?zhí)枺?/td>	201611166407.7	申請日：	2016-12-16
公開（公告）號：	CN106778727A	公開（公告）日：	2017-05-31
發(fā)明（設(shè)計）人：	劉洋	申請（專利權(quán)）人：	高格（天津）信息科技發(fā)展有限公司
主分類號：	G06K9/20	分類號：	G06K9/20
代理公司：	暫無信息	代理人：	暫無信息
地址：	300384 天津市南開區(qū)天津市濱海高新區(qū)華***	國省代碼：	天津;12
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	圖片文字識別方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及圖文軟件領(lǐng)域，特別地，是一種圖片文字識別方法。

背景技術(shù)

對于圖片上的文字，在較多情況下需要進(jìn)行大段地復(fù)制使用，因此，必須要首先通過軟件方法先將圖片形式的文字轉(zhuǎn)換成可編輯文字；在此過程中，目前使用的方法是，采用一套字模庫，將圖片中截取的每一個圖元文字與字模庫中的各個字模文字進(jìn)行對比，并將相似度最高的字模文字以可編輯文字的形式輸出，從而使用戶獲得所需的可編輯文本。

然而，由于各種圖片形式的文本通常采用不同的字體，而目前在將圖元文字與字模文字相對比時，通常只采用一套字模庫，因此，倘若圖元文字的字體與字模庫中的字體不同時，則文字識別的準(zhǔn)確性并不高；若采用多套字模庫，則按一套字模庫的逐字對比的方式，每個圖元文字將需要與多套字模庫中的各字模文字相對比，其工作量十分巨大。

發(fā)明內(nèi)容

針對上述問題，本發(fā)明的目的在于提供一種圖片文字識別方法，該方法可以準(zhǔn)確而高效地識別圖片中的文字信息。

本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是：該圖片文字識別方法如下：將用戶框選的圖片上的文本區(qū)域以當(dāng)前圖片形式讀??；對框選文本區(qū)域中的各個圖元文字分別進(jìn)行選?。粚⒖蜻x文本區(qū)域中的第一個圖元文字與各種常規(guī)字體對應(yīng)的字模庫中的各個字模文字作對比，找到相似度最近的字模文字；并記錄該相似度最高的字模文字所在的字模庫，定義為標(biāo)準(zhǔn)字模庫，此后，將所述框選文本區(qū)域中第一個圖元文字后面的各圖元文字只與所述標(biāo)準(zhǔn)字模庫中的各字模文字作比較，在標(biāo)準(zhǔn)字模庫中分別找到相似度最高的字模文字，并以可編輯文字的形式輸出。

作為優(yōu)選，所述常規(guī)字體對應(yīng)的字模庫包括宋體、仿宋、黑體、楷體、行楷、隸書對應(yīng)的字模庫。

作為優(yōu)選，在分別選取所述框選文本區(qū)域中的各個圖元文字時，采用矩形框的形式，所述矩形框的框線與各圖元文字的最上端、最左端、最下端、最右端相切。

作為優(yōu)選，在將圖元文字與字模文字作對比時，首先將字模文字進(jìn)行縮放，使之與欲作對比的圖元文字大小相同，然后，將縮放好的字模文字轉(zhuǎn)換成字模圖元，與所述圖元文字作布爾差運算，然后以布爾差之后剩下的文字顏色的多少來衡量相似度，即剩下的文字顏色越少，則相似度越高。

本發(fā)明的有益效果在于：在將圖元文字與字模文字作對比時，由于采用了多種字模庫，因此，使得識別的準(zhǔn)確性得到了很大程度的提高，而由于本方法在對于所述框選文本區(qū)域中的第一個圖元文字作對比的過程中，就可以確定框選文本區(qū)域中的第一個圖元文字的字體，從而推出該框選文本區(qū)域中所有圖元文字的字體，這就可以使得后面的圖元文字僅與一種字模庫中的字模文字進(jìn)行對比，不僅對比工作量小，且不失準(zhǔn)確性。

具體實施方式

下面對本發(fā)明進(jìn)一步說明：

本發(fā)明提供的圖片文字識別方法如下：將用戶框選的圖片上的文本區(qū)域以當(dāng)前圖片形式讀取，如，當(dāng)前圖片為允8格式的，那么用戶在當(dāng)前圖片上框選部分文本后，將用戶框選的文本區(qū)域視為一張待處理的允8圖片；然后，對待處理的允8圖片中的各個圖元文字分別進(jìn)行選取，選取時，采用矩形框的形式，以從上至下、從左到右的順序逐個選取圖元文字，所述矩形框的框線與各圖元文字的最上端、最左端、最下端、最右端相切；當(dāng)選取所述框選文本區(qū)域中的第一個圖元文字后，將其與各種常規(guī)字體對應(yīng)的字模庫中的各個字模文字作對比，找到相似度最近的字模文字，將該字模文字以可編輯文字形式輸出，同時，記錄該相似度最高的字模文字所在的字模庫，定義為標(biāo)準(zhǔn)字模庫；此后，將所述框選文本區(qū)域中第一個圖元文字后面的各圖元文字只與所述標(biāo)準(zhǔn)字模庫中的各字模文字作比較，在標(biāo)準(zhǔn)字模庫中分別找到相似度最高的字模文字，并以可編輯文字的形式輸出。

為了滿足絕大部分圖元文字的字體需求，所述常規(guī)字體對應(yīng)的字模庫包括宋體、仿宋、黑體、楷體、行楷、隸書對應(yīng)的字模庫。

另外，在將圖元文字與字模文字作對比時，首先將字模文字進(jìn)行縮放，使之與欲作對比的圖元文字大小相同，然后，將縮放好的字模文字轉(zhuǎn)換成字模圖元，與所述圖元文字作布爾差運算，然后以布爾差之后剩下的文字顏色的多少來衡量相似度，即剩下的文字顏色越少，則相似度越高；如，通常情況下，文字顏色為黑色，則將所述字模圖元與圖元文字作布爾差運算后，它們相重合部分的黑色被消除了，由背景色替代，那么如果字模圖元和圖元文字完全一樣，則布爾差運算之后，則黑色的剩余量為零，而相似度越低，則黑色的剩余量就越大。

本發(fā)明提供的圖片文字識別方法在將圖元文字與字模文字作對比時，由于采用了多種字模庫，因此，使得識別的準(zhǔn)確性得到了很大程度的提高，而由于本方法在對于所述框選文本區(qū)域中的第一個圖元文字作對比的過程中，就可以確定框選文本區(qū)域中的第一個圖元文字的字體，從而推出該框選文本區(qū)域中所有圖元文字的字體，這就可以使得后面的圖元文字僅與一種字模庫中的字模文字進(jìn)行對比，不僅對比工作量小，且不失準(zhǔn)確性。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于高格（天津）信息科技發(fā)展有限公司，未經(jīng)高格（天津）信息科技發(fā)展有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201611166407.7/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：板卡定位方法及裝置
下一篇：一種移動終端掃描方法、裝置及移動終端

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

[發(fā)明專利]圖片文字識別方法在審

專利文獻(xiàn)下載