[發(fā)明專利]一種圖片中文字的識別方法、裝置、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810373537.0 | 申請日: | 2018-04-24 |
| 公開(公告)號: | CN108805115A | 公開(公告)日: | 2018-11-13 |
| 發(fā)明(設(shè)計)人: | 王昌龍;馬鑫 | 申請(專利權(quán))人: | 五八同城信息技術(shù)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34;G06K9/46;G06K9/62 |
| 代理公司: | 工業(yè)和信息化部電子專利中心 11010 | 代理人: | 于金平 |
| 地址: | 300450 天津市濱海新區(qū)經(jīng)濟技術(shù)開*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 黑白圖片 文字圖片 圖片 切割 中文字 匹配 字典 存儲介質(zhì) 圖片調(diào)整 干擾因素 圖片分析 圖片文字 成功率 分析 | ||
本發(fā)明提供了一種圖片中文字的識別方法、裝置、設(shè)備及存儲介質(zhì),其中圖片中文字的識別方法包括:將圖片調(diào)整為黑白圖片;對黑白圖片中的文字進行切割,得到切割后的文字圖片;將各文字圖片分別與圖片字典中的圖片進行匹配;根據(jù)匹配到的圖片字典中的圖片,識別出文字圖片中的文字。本發(fā)明的技術(shù)方案通過將圖片調(diào)整為黑白圖片,將黑白圖片中的文字進行切割,并將切割后的文字圖片與圖片字典中的圖片進行匹配,減少了圖片分析中的干擾因素,提高了圖片中文字的識別成功率;而且通過對黑白圖片中的文字進行切割,減少了對圖片的整圖進行分析,提高了圖片文字的識別效率。
技術(shù)領(lǐng)域
本發(fā)明涉及信息安全領(lǐng)域,特別涉及一種圖片中文字的識別方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
互聯(lián)網(wǎng)的發(fā)展使得信息的傳播速度和規(guī)模達到了空前的水平,但是隨之而來的是信息安全問題。一些違法分子會通過網(wǎng)絡(luò)傳播違法信息,如何有效阻止這類信息在網(wǎng)絡(luò)的傳播是每個公司的責(zé)任與義務(wù)。
網(wǎng)絡(luò)傳輸交換的信息除文字內(nèi)容外,還包括圖片內(nèi)容,所以網(wǎng)絡(luò)內(nèi)容的過濾除了對文字內(nèi)容的合法性過濾,還包括對圖片內(nèi)容的合法性檢驗。但是如何對圖片內(nèi)容分析是一個技術(shù)難點,文字有全球統(tǒng)一標(biāo)準(zhǔn)的“文字庫”,而圖片則是復(fù)雜和多樣的,所以圖片內(nèi)容分析不像文字內(nèi)容分析那樣簡單。
百度云圖像智能應(yīng)用提供了自然場景下整圖文字檢測、定位、識別等功能,具體的,在百度云圖像智能應(yīng)用中,將文字標(biāo)準(zhǔn)庫轉(zhuǎn)化成圖片庫,對原圖進行整圖橫向垂直對比,通過圖片庫在需要分析的整圖中進行正向?qū)Ρ龋丿B視為相同的文字。然而,上述識別方式存在如下問題:對于圖片中不規(guī)則排序文字、扭曲字體等的識別成功率偏低。
所以,如何提高圖片中文字的識別效率和/或識別成功率,成為目前亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明實施例以便提供一種解決上述問題的圖片中文字的識別方法、裝置、設(shè)備及存儲介質(zhì)。
依據(jù)本發(fā)明實施例的一個方面,提供了一種圖片中文字的識別方法,包括:
將圖片調(diào)整為黑白圖片;
對所述黑白圖片中的文字進行切割,得到切割后的文字圖片;
將各所述文字圖片分別與圖片字典中的圖片進行匹配;
根據(jù)匹配到的所述圖片字典中的圖片,識別出所述文字圖片中的文字。
可選的,在本發(fā)明實施例所述的圖片文字識別方法中,所述將各所述文字圖片分別與圖片字典中的圖片進行匹配,包括:
將所述文字圖片按照所述圖片字典中待匹配圖片進行比例轉(zhuǎn)換;
將轉(zhuǎn)換后的文字圖片與所述圖片字典中待匹配的圖片,在同一坐標(biāo)位置的紅綠藍RGB值進行對比;
當(dāng)所述轉(zhuǎn)換后的文字圖片與所述待匹配的圖片在所有坐標(biāo)位置的RGB值均相同時,確定所述文字圖片與所述待匹配的圖片相匹配。
可選的,在本發(fā)明實施例所述的圖片文字識別方法中,還包括:
當(dāng)所述文字圖片與所述待匹配的圖片不匹配時,將轉(zhuǎn)換后的文字圖片中每個坐標(biāo)位置的RGB值,與所述圖片字典中待匹配圖片在對應(yīng)坐標(biāo)位置的預(yù)設(shè)偏移范圍內(nèi)的各坐標(biāo)的RGB值進行對比;
當(dāng)所述文字圖片中每個坐標(biāo)位置的RGB值在對應(yīng)坐標(biāo)位置的預(yù)設(shè)偏移范圍內(nèi)均具有相同的RGB值時,確定所述文字圖片與所述待匹配的圖片相匹配。
可選的,在本發(fā)明實施例所述的圖片文字識別方法中,在將圖片調(diào)整為黑白圖片之前,還包括:清除所述圖片的邊框。
可選的,在本發(fā)明實施例所述的圖片文字識別方法中,所述清除所述圖片的邊框包括:
計算所述圖片的邊框所占的橫縱行數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于五八同城信息技術(shù)有限公司,未經(jīng)五八同城信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810373537.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





