[發明專利]基于人工智能的圖像識別方法和相關裝置有效
| 申請號: | 202010212302.0 | 申請日: | 2020-03-24 |
| 公開(公告)號: | CN111444905B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | 康健;黃珊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V10/82;G06F40/30;G06N3/0464;G06N3/08 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 常忠良 |
| 地址: | 518064 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 圖像 識別 方法 相關 裝置 | ||
本申請實施例公開了基于人工智能的圖像識別方法和相關裝置,在該方法中,待識別圖像中包括的文本可以在目標區域中,在進行字形識別時,可以針對該目標區域識別出多個候選字,并確定多個候選字之間的語義連貫性參數。根據語義連貫性參數,從多個候選字中篩選目標字,將目標字組合成目標區域的文本所對應的文本識別結果。由于語義連貫性參數可以體現出多個候選字之間在語義上是否通順,故雖然該多個候選字均具有作為該目標區域文本識別結果的可能,但是通過進一步結合候選字的語義通順程度,由于出現形近字詞識別錯誤的候選字對應的語義通順程度一般較低,使得語義通順程度更好的對應的候選字被確定為目標字的可能性提高,提高了文本識別精度。
技術領域
本申請涉及圖像處理領域,特別是涉及基于人工智能的圖像識別方法和相關裝置。
背景技術
隨著人工智能技術的發展,可以通過字形識別模型識別出圖像內容中包含的文字。
然而,由于存在的形狀、結構相近文字,在識別時容易出現識別錯誤。為此,相關技術中多采用的方式是針對相近文字構建并標注大量的訓練樣本,根據這些訓練樣本來訓練、優化字形識別模型。
然而這種方式中,樣本的構建、標注成本很高,且一旦有些文字形近情況沒有被訓練樣本覆蓋到的話,文字識別精度將會陡然下降。
發明內容
為了解決上述技術問題,本申請提供了基于人工智能的圖像識別方法和相關裝置,提高了文本識別精度。
本申請實施例公開了如下技術方案:
一方面,本申請實施例提供了一種圖像識別方法,所述方法包括:
獲取待識別圖像;
對所述待識別圖像中目標區域的文本進行字形識別,得到多個候選字;
確定所述多個候選字之間的語義連貫性參數;
基于所述語義連貫性參數,從所述多個候選字中篩選目標字,將所述目標字組合成所述目標區域的文本所對應的文本識別結果。
另一方面,本申請實施例提供了一種圖像識別裝置,所述裝置包括獲取單元、識別單元、確定單元和篩選單元:
所述獲取單元,用于獲取待識別圖像;
所述識別單元,用于對所述待識別圖像中目標區域的文本進行字形識別,得到多個候選字;
所述確定單元,用于確定所述多個候選字之間的語義連貫性參數;
所述篩選單元,用于基于所述語義連貫性參數,從所述多個候選字中篩選目標字,將所述目標字組合成所述目標區域的文本所對應的文本識別結果。
另一方面,本申請實施例提供了一種用于圖像識別設備,所述設備包括處理器以及存儲器:
所述存儲器用于存儲程序代碼,并將所述程序代碼傳輸給所述處理器;
所述處理器用于根據所述程序代碼中的指令執行上述方面所述的方法。
另一方面,本申請實施例提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質用于存儲計算機程序,所述計算機程序用于執行上述方面所述的方法。
由上述技術方案可以看出,待識別圖像中包括的文本可以在目標區域中,在進行字形識別時,可以針對該目標區域識別出多個候選字,并確定多個候選字之間的語義連貫性參數。根據語義連貫性參數,從多個候選字中篩選目標字,將目標字組合成目標區域的文本所對應的文本識別結果。由于語義連貫性參數可以體現出多個候選字之間在語義上是否通順,故雖然該多個候選字均具有作為該目標區域文本識別結果的可能,但是通過進一步結合候選字的語義通順程度,由于出現形近字詞識別錯誤的候選字對應的語義通順程度一般較低,使得語義通順程度更好的對應的候選字被確定為目標字的可能性提高,提高了文本識別精度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010212302.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





