[發(fā)明專利]一種對(duì)圖片進(jìn)行文本識(shí)別的方法及移動(dòng)終端有效
| 申請(qǐng)?zhí)枺?/td> | 201711422254.2 | 申請(qǐng)日: | 2017-12-25 |
| 公開(kāi)(公告)號(hào): | CN107992872B | 公開(kāi)(公告)日: | 2020-04-28 |
| 發(fā)明(設(shè)計(jì))人: | 龍安忠 | 申請(qǐng)(專利權(quán))人: | 廣東小天才科技有限公司 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/38 |
| 代理公司: | 廣州德科知識(shí)產(chǎn)權(quán)代理有限公司 44381 | 代理人: | 萬(wàn)振雄;楊中強(qiáng) |
| 地址: | 523859 廣東省東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖片 進(jìn)行 文本 識(shí)別 方法 移動(dòng) 終端 | ||
一種對(duì)圖片進(jìn)行文本識(shí)別的方法及移動(dòng)終端,包括:移動(dòng)終端可以將移動(dòng)終端中的圖片進(jìn)行二值化處理;移動(dòng)終端還可以根據(jù)相鄰像素之間的距離與指定閾值之間的大小關(guān)系可以將二值化圖片中的黑色部分分別框選出來(lái),得到至少一個(gè)目標(biāo)框,該目標(biāo)框中任意兩個(gè)相鄰像素點(diǎn)之間的距離小于或等于指定閾值;移動(dòng)終端還能計(jì)算每個(gè)目標(biāo)框的面積和中心點(diǎn)坐標(biāo),并根據(jù)相鄰中心點(diǎn)坐標(biāo)的距離與預(yù)設(shè)距離的大小關(guān)系將目標(biāo)框分為噪點(diǎn)框集和文本框集兩類集合;當(dāng)文本框集的總面積大于噪點(diǎn)框集的總面積時(shí),移動(dòng)終端則可以對(duì)文本框集進(jìn)行文本識(shí)別,以獲取二值化圖片中的題目信息。實(shí)施本發(fā)明實(shí)施例,能夠提升對(duì)存在噪點(diǎn)較多的圖片進(jìn)行文本識(shí)別時(shí)的識(shí)別準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及一種對(duì)圖片進(jìn)行文本識(shí)別的方法及移動(dòng)終端。
背景技術(shù)
隨著智能手機(jī)以及學(xué)習(xí)平板的普及,學(xué)生們獲取知識(shí)的方式不再局限于書(shū)本和老師,當(dāng)面臨一些作業(yè)難題的時(shí)候,學(xué)生們更多的會(huì)使用智能手機(jī)中的拍題APP拍照搜索相似題目,一并獲得相似題目所對(duì)應(yīng)的答案。但是,當(dāng)學(xué)生在夜間或者光線不好的條件下拍攝時(shí),拍出的照片中存在較多的噪點(diǎn),此時(shí),多數(shù)拍題APP就難以準(zhǔn)確識(shí)別照片中的題目信息了。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例公開(kāi)了一種對(duì)圖片進(jìn)行文本識(shí)別的方法及移動(dòng)終端,能夠提升對(duì)存在噪點(diǎn)較多的圖片進(jìn)行文本識(shí)別時(shí)的識(shí)別準(zhǔn)確率。
本發(fā)明實(shí)施例第一方面公開(kāi)了一種對(duì)圖片進(jìn)行文本識(shí)別的方法,所述方法包括:
移動(dòng)終端對(duì)所述移動(dòng)終端中的目標(biāo)圖片進(jìn)行二值化處理,得到二值化圖片;
所述移動(dòng)終端對(duì)所述二值化圖片中的黑色部分進(jìn)行框選,得到至少一個(gè)目標(biāo)框;所述目標(biāo)框中任意兩個(gè)相鄰像素點(diǎn)之間的距離小于或等于指定閾值;
所述移動(dòng)終端分別獲取每一個(gè)所述目標(biāo)框的中心點(diǎn)坐標(biāo),以及分別獲取每一個(gè)所述目標(biāo)框的面積;
所述移動(dòng)終端根據(jù)所述至少一個(gè)目標(biāo)框確定出噪點(diǎn)框集和文本框集;其中,所述噪點(diǎn)框集中相鄰目標(biāo)框之間的中心點(diǎn)坐標(biāo)距離小于預(yù)設(shè)距離,所述文本框集中相鄰目標(biāo)框之間的中心點(diǎn)坐標(biāo)距離大于或等于所述預(yù)設(shè)距離;
所述移動(dòng)終端獲取所述噪點(diǎn)框集的總面積以及所述文本框集的總面積;其中,所述噪點(diǎn)框集的總面積為所述噪點(diǎn)框集中包含的所有目標(biāo)框的面積之和,所述文本框集的總面積為所述文本框集中包含的所有目標(biāo)框的面積之和;
所述移動(dòng)終端判斷所述文本框集的總面積是否大于所述噪點(diǎn)框集的總面積;
如果是,所述移動(dòng)終端對(duì)所述文本框集進(jìn)行文本識(shí)別,得到所述二值化圖片中包含的文本信息。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第一方面中,所述方法還包括:
如果所述移動(dòng)終端判斷出所述文本框集的總面積小于或等于所述噪點(diǎn)框集的總面積,所述移動(dòng)終端輸出用于提示用戶所述目標(biāo)圖片清晰度過(guò)低的提示信息;
所述移動(dòng)終端檢測(cè)所述移動(dòng)終端是否收到用戶輸入的重新拍攝指令,如果是,開(kāi)啟所述移動(dòng)終端中的攝像頭。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第一方面中,所述文本信息為題目信息,所述方法還包括:
所述移動(dòng)終端搜索與所述題目信息相似度大于或等于預(yù)設(shè)相似度的至少一個(gè)相似題目信息;
所述移動(dòng)終端按照與所述題目信息相似度由高到低的順序輸出所述至少一個(gè)相似題目信息以及所述至少一個(gè)相似題目信息分別對(duì)應(yīng)的答案信息;
所述移動(dòng)終端檢測(cè)用戶從所述至少一個(gè)相似題目信息中選擇的目標(biāo)題目信息以及所述目標(biāo)題目信息對(duì)應(yīng)的答案信息;
所述移動(dòng)終端將所述目標(biāo)題目信息以及所述目標(biāo)題目信息對(duì)應(yīng)的答案信息存儲(chǔ)至云端數(shù)據(jù)庫(kù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東小天才科技有限公司,未經(jīng)廣東小天才科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711422254.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 請(qǐng)求沒(méi)有進(jìn)行IMS注冊(cè)的用戶進(jìn)行注冊(cè)的方法
- 對(duì)要進(jìn)行紋理操作的像素進(jìn)行分組
- 對(duì)餐盤(pán)進(jìn)行溫度調(diào)節(jié)和進(jìn)行分配的獨(dú)立小車
- 對(duì)圖像進(jìn)行編碼
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 蛋糕(甜蜜進(jìn)行時(shí))
- 對(duì)定位輔助數(shù)據(jù)進(jìn)行分級(jí)和分組以進(jìn)行廣播
- 對(duì)物體進(jìn)行分離和定向以進(jìn)行供料
- 對(duì)工件進(jìn)行評(píng)價(jià)以進(jìn)行加工的方法
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





