[發(fā)明專利]一種文本識別方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910509640.8 | 申請日: | 2019-06-13 |
| 公開(公告)號: | CN110245606B | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計)人: | 董勇軍;秦偉 | 申請(專利權(quán))人: | 廣東小天才科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06K9/62 |
| 代理公司: | 深圳青年人專利商標(biāo)代理有限公司 44350 | 代理人: | 劉杰 |
| 地址: | 523000 廣東省東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 識別 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本發(fā)明適用智能設(shè)備技術(shù)領(lǐng)域,提供了一種文本識別方法、裝置、設(shè)備及存儲介質(zhì),該方法包括:檢測預(yù)設(shè)的文本識別觸發(fā)事件,當(dāng)檢測到文本識別觸發(fā)事件時,獲取待進行文本識別的目標(biāo)圖像,通過光學(xué)字符識別算法獲取目標(biāo)圖像中的文本數(shù)據(jù),通過預(yù)設(shè)的帶權(quán)重字符串匹配算法,將獲取到的文本數(shù)據(jù)與預(yù)先獲取的目標(biāo)書本數(shù)據(jù)進行匹配,獲得文本匹配結(jié)果,根據(jù)文本匹配結(jié)果,輸出與目標(biāo)圖像中文本對應(yīng)的最佳匹配文本,從而提高了文本識別的速度和精確度,進而提高了用戶體驗。
技術(shù)領(lǐng)域
本發(fā)明屬于智能設(shè)備技術(shù)領(lǐng)域,尤其涉及一種文本識別方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
目前市場上的點讀發(fā)音產(chǎn)品,需要書本進行特殊鋪碼或使用類似于點讀機的點讀面板,再提前下載好數(shù)據(jù)才能使用,產(chǎn)品制作麻煩,體積重量較大,且更新課本資料麻煩,要正確識別文本內(nèi)容需要勾勒每句文本對應(yīng)的區(qū)域,制作數(shù)據(jù)工作量大。
OCR(Optical Character Recognition,光學(xué)字符識別)技術(shù)是指對文本資料、卡片等的圖像文件進行分析識別處理,獲取文字及版面信息的過程,在圖像處理領(lǐng)域有廣泛應(yīng)用。目前的OCR算法精確度高,對單詞的分類比較準(zhǔn)確,然而,對于句型不完整的文本并不能做到準(zhǔn)確識別。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種文本識別方法、裝置、設(shè)備及存儲介質(zhì),旨在解決由于現(xiàn)有技術(shù)無法提供一種有效的文本識別方法,導(dǎo)致文本識別速度慢、效率低、且識別不準(zhǔn)確的問題。
一方面,本發(fā)明提供了一種文本識別方法,所述方法包括下述步驟:
檢測預(yù)設(shè)的文本識別觸發(fā)事件;
當(dāng)檢測到所述文本識別觸發(fā)事件時,獲取待進行文本識別的目標(biāo)圖像;
通過光學(xué)字符識別算法獲取所述目標(biāo)圖像中的文本數(shù)據(jù);
通過預(yù)設(shè)的帶權(quán)重字符串匹配算法,將獲取到的所述文本數(shù)據(jù)與預(yù)先獲取的目標(biāo)書本數(shù)據(jù)進行匹配,獲得文本匹配結(jié)果;
根據(jù)所述文本匹配結(jié)果,輸出與所述目標(biāo)圖像中文本對應(yīng)的最佳匹配文本。
優(yōu)選地,獲取待進行文本識別的目標(biāo)圖像的步驟之后,通過光學(xué)字符識別算法獲取所述目標(biāo)圖像中的文本數(shù)據(jù)的步驟之前,所述方法還包括:
根據(jù)所述目標(biāo)圖像,獲取待進行文本識別的焦點文本。
進一步優(yōu)選地,獲取待進行文本識別的目標(biāo)圖像的步驟,包括:
通過智能筆中攝像頭對所述攝像頭當(dāng)前焦距所對應(yīng)的、待進行文本識別的文本區(qū)域進行拍照,獲得所述文本區(qū)域?qū)?yīng)的目標(biāo)圖像;
根據(jù)所述目標(biāo)圖像,獲取待進行文本識別的焦點文本的步驟,包括:
獲取所述攝像頭當(dāng)前焦點在所述目標(biāo)圖像中的相對焦點坐標(biāo);
根據(jù)所述相對焦點坐標(biāo)獲取所述當(dāng)前焦點在所述目標(biāo)圖像中對應(yīng)的焦點文本。
又一優(yōu)選地,通過光學(xué)字符識別算法獲取所述目標(biāo)圖像中的文本數(shù)據(jù)的步驟之后,將獲取到的所述文本數(shù)據(jù)與預(yù)先獲取的目標(biāo)書本數(shù)據(jù)進行匹配的步驟之前,所述方法還包括:
根據(jù)所述焦點文本和所述文本數(shù)據(jù)中的所有行文本,對用戶意愿的待識別句子進行預(yù)測。
優(yōu)選地,對用戶意愿的待識別句子進行預(yù)測的步驟,包括:
將所述文本數(shù)據(jù)中的所有行文本與所述目標(biāo)書本數(shù)據(jù)包含的句子內(nèi)容文本列表中所有句子進行比較,根據(jù)比較結(jié)果和所述目標(biāo)書本數(shù)據(jù)包含的單詞在句子中的排版行號對所述焦點文本進行拼接,得到所述用戶意愿的待識別句子。
優(yōu)選地,將獲取到的所述文本數(shù)據(jù)與預(yù)先獲取的目標(biāo)書本數(shù)據(jù)進行匹配的步驟,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東小天才科技有限公司,未經(jīng)廣東小天才科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910509640.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





