[發(fā)明專利]一種文字信息的識別方法、裝置及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810516918.X | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN110533020B | 公開(公告)日: | 2022-08-12 |
| 發(fā)明(設(shè)計)人: | 王盛濤;溫廣滔;明細龍;蔣健 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V30/146 | 分類號: | G06V30/146;G06V30/164;G06V30/41;G06V30/262;G06F40/289;G06F40/253 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 郭潤湘;李娟 |
| 地址: | 518044 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文字 信息 識別 方法 裝置 存儲 介質(zhì) | ||
本發(fā)明及圖像識別技術(shù)領(lǐng)域,公開了一種文字信息的識別方法、裝置及存儲介質(zhì),于提高圖像中的文字內(nèi)容的識別準確度。所述文字信息的識別方法,包括:識別圖像中的文字區(qū)域;在所述文字區(qū)域中選取一個字符作為基準字符,并確定所述基準字符分別以不同語序和鄰近的字符組成的詞;確定不同語序下組成的各個詞中,在語料庫中出現(xiàn)頻率符合預(yù)設(shè)條件的詞;將所述出現(xiàn)頻率符合預(yù)設(shè)條件的詞的語序作為所述文字區(qū)域中的文字排列語序;按照所述文字排列語序輸出從所述文字區(qū)域中識別出的每行字符。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,尤其涉及一種文字信息的識別方法、裝置及存儲介質(zhì)。
背景技術(shù)
近幾年隨著圖像識別技術(shù)的快速發(fā)展,對圖像中的文字內(nèi)容的識別需求也在不斷增加,而如何提高圖像中的文字內(nèi)容的識別準確度從而準確的表達圖像中文字內(nèi)容的語義,是一個需要考慮的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種文字信息的識別方法、裝置及存儲介質(zhì),用于提高圖像中的文字內(nèi)容的識別準確度,從而準確的表達圖像中文字內(nèi)容的語義。
第一方面,本發(fā)明實施例提供了一種文字信息的識別方法,包括:
識別圖像中的文字區(qū)域;
在所述文字區(qū)域中選取一個字符作為基準字符,并確定所述基準字符分別以不同語序和鄰近的字符組成的詞;
確定不同語序下組成的各個詞中,在語料庫中出現(xiàn)頻率符合預(yù)設(shè)條件的詞;
將所述出現(xiàn)頻率符合預(yù)設(shè)條件的詞的語序作為所述文字區(qū)域中的文字排列語序;
按照所述文字排列語序輸出從所述文字區(qū)域中識別出的每行字符。
本發(fā)明實施例中提供的文字信息的識別方法,首先在識別出的文字區(qū)域中選取一個字符作為基準字符,然后利用基準字符分別以不同語序和鄰近的字符組成的詞,并從不同語序下組成的各個詞中,確定出在語料庫中出現(xiàn)頻率符合預(yù)設(shè)條件的詞,預(yù)設(shè)條件可以為出現(xiàn)頻率最大,也可為出現(xiàn)頻率大于預(yù)設(shè)閾值等等。然后將出現(xiàn)頻率符合預(yù)設(shè)條件的詞的語序作為文字區(qū)域中的文字排列語序,進而按照該文字排列語序輸出從文字區(qū)域中識別出的每行字符。由于不同圖像中的文字內(nèi)容的語序可能不同,同一圖像中也有可能包括多種語序,因此,采用在文字區(qū)域中選取不同語序下相鄰的至少兩個字符組成的詞,再利用這些詞的出現(xiàn)概率來確定哪一種語序為文字內(nèi)容的正確語序,并根據(jù)確定出的正確語序輸出從文字區(qū)域中識別的每行字符的方案,可以提高文字識別的準確度。
可選的,所述將所述出現(xiàn)頻率符合預(yù)設(shè)條件的詞的語序作為所述文字區(qū)域中的文字排列語序之前,還包括:確定所述出現(xiàn)頻率符合預(yù)設(shè)條件的詞的出現(xiàn)頻率,高于設(shè)定的第一閾值。
在本發(fā)明實施例中,還可以先確定出現(xiàn)頻率符合預(yù)設(shè)條件的詞的出現(xiàn)頻率,高于設(shè)定的第一閾值,再將出現(xiàn)頻率符合預(yù)設(shè)條件的詞的語序作為文字區(qū)域中的文字排列語序,進而排除組成的詞中存在的可能會導(dǎo)致語序誤判的一些詞,這些詞在語文含義中并不能算一個可以獨立運用的單位,但在語料庫中也賦予了一定的出現(xiàn)頻率,所以,能夠進一步提升文字識別準確度。
可選的,所述方法還包括:
針對包含多行字符的文字區(qū)域,還確定所述文字區(qū)域中每行的第一個字符以及最后一個字符;
針對選取的相鄰兩行,按照不同的排列順序,分別確定前一行中的最后一個字符與后一行中的第一個字符組成的詞在語料庫中的出現(xiàn)頻率;
將出現(xiàn)頻率大于第二閾值的詞的排列順序,確定所述文字區(qū)域中各行字符的行序;
按照確定出的行序,在從所述文字區(qū)域輸出一行字符后確定要輸出的下一行字符。
在本發(fā)明實施例中,在文字區(qū)域包括多行字符時,還可以判斷出文字內(nèi)容的行序,并根據(jù)正確的行序?qū)ψR別出的內(nèi)容進行排列,從而進一步提高了文字識別的準確度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810516918.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





