[發明專利]一種基于圖像的文本識別方法、系統和介質在審
| 申請號: | 202011348515.2 | 申請日: | 2020-11-26 |
| 公開(公告)號: | CN112381038A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 郭永金;韋正現;郝燕 | 申請(專利權)人: | 中國船舶工業系統工程研究院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06F40/289 |
| 代理公司: | 中國和平利用軍工技術協會專利中心 11215 | 代理人: | 劉光德 |
| 地址: | 100094*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖像 文本 識別 方法 系統 介質 | ||
本發明提供一種基于圖像的文本識別方法、系統和介質。其中方法包括:步驟S1、識別圖像中的文本,以獲得第一文本集;步驟S2、對第一文本集中的文本進行預處理,以獲得第二文本集,其中預處理包括屏蔽詞處理和分詞處理;步驟S3、對第二文本集中的文本建立索引,索引為key?value形式的鍵值對,其中key表示索引關鍵詞,value表示索引關鍵詞在第二文本集中的文本位置;步驟S4、從預先訓練好的模型中獲取語料關鍵詞庫,計算索引關鍵詞與語料關鍵詞庫中的預料關鍵詞的相似度,其中語料關鍵詞庫由模型預先訓練語料庫獲得;以及步驟S5、基于相似度確定圖像中的關鍵元素,作為圖像的檢索要素。
技術領域
本發明涉及圖像識別領域,尤其是涉及一種基于圖像的文本識別方法、系統和介質。
背景技術
從自然場景圖像中識別出的文本內容往往是雜亂無序的,為了能夠將識別出的文本內容作為圖像關鍵元素進行檢索,需要對圖像中的文本內容進行分析,找出與檢索詞相似的文本元素。對于文本元素的檢索,目前已有的方法是根據關鍵詞庫對檢索對象進行匹配:首先將待檢索文本進行圖像分割提取關鍵詞;然后對關鍵詞進行遍歷檢索,如果關鍵詞庫中的關鍵詞與待檢文本的關鍵詞相同,即認為該圖像中包含此文本元素(圖像關鍵元素)。這種方法只能對給定關鍵詞進行識別,對于和給定關鍵詞詞義相近或者語義相近的關鍵詞,計算機無法進行精確識別。在實際應用中,基于語義的文本檢索能夠更加準確地捕捉用戶的檢索意圖,返回更符合檢索要求的檢索結果。在當前的文本檢索技術中,基于同義詞庫進行相關詞匯檢索的技術已經發展成熟,但對于一個同義詞庫中尚未包含且又可以作為當前文本關鍵元素的關鍵詞,該方法無法做到準確檢索,即在包含復雜語義的文本中,該方法的識別精準度較低。
發明內容
考慮到上述問題,本發明設計了一種基于圖像的文本識別方案,以解決上述技術問題。該方案能夠計算不同語義環境中待檢文本與輸入關鍵詞之間的關聯度,結合上下文語境給出檢索關鍵詞與待檢圖像關鍵元素的匹配結果,以配合基于內容的圖像檢索方法,提高圖像搜索效率。
在第一方面,提供了一種基于圖像的文本識別方法,所述所述方法包括:步驟S1、識別所述圖像中的文本,以獲得第一文本集;步驟S2、對所述第一文本集中的文本進行預處理,以獲得第二文本集,其中所述預處理包括屏蔽詞處理和分詞處理;步驟S3、對所述第二文本集中的文本建立索引,所述索引為key-value形式的鍵值對,其中key表示索引關鍵詞,value表示所述索引關鍵詞在所述第二文本集中的文本位置;步驟S4、從預先訓練好的模型中獲取語料關鍵詞庫,計算所述索引關鍵詞與所述語料關鍵詞庫中的預料關鍵詞的相似度,其中所述語料關鍵詞庫由所述模型預先訓練語料庫獲得;以及步驟S5、基于所述相似度確定所述圖像中的關鍵元素,作為所述圖像的檢索要素。
具體地,所述屏蔽詞處理為利用屏蔽詞庫過濾所述第一文本集。
具體地,所述分詞處理包括:基于Trie樹加在文本字典,對經過所述屏蔽詞處理的第一文本集進行切分,以生成第一切分詞和對應的第一切分位置;對于所述第一文本集中未包含在所述文本字典中的文本,利用馬爾科夫模型和Viterbi算法計算最優狀態序列,以獲得第二切分詞和對應的第二切分位置;以及整合所述第一切分詞、第二切分詞、第一切分位置、第二切分位置作為所述第二文本集。
具體地,所述模型為Word2Vec算法中的Skip-Gram模型,所述語料關鍵詞庫中的預料關鍵詞以詞向量矩陣的形式存儲在二進制文件中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國船舶工業系統工程研究院,未經中國船舶工業系統工程研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011348515.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種GNSS高精度抗鋸齒解算結果平滑的方法
- 下一篇:一種防腐蝕生鐵鑄件
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





