[發明專利]基于人工智能的圖像識別方法和相關裝置有效
| 申請號: | 202010212729.0 | 申請日: | 2020-03-24 |
| 公開(公告)號: | CN111444906B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 康健;黃珊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V10/82;G06F40/30;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 常忠良 |
| 地址: | 518064 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 圖像 識別 方法 相關 裝置 | ||
1.一種圖像識別方法,其特征在于,所述方法包括:
通過對待識別圖像中的目標區域中的文本進行字形識別,得到多個候選字組合以及每個候選字組合的整體識別概率;所述整體識別概率用于體現候選字組合的整體識別自信程度;
對于滿足預設識別概率條件的整體識別概率所對應的第一候選字組合,以所述第一候選字組合的整體識別概率,作為所述第一候選字組合的識別可信度;所述第一候選字組合是具有識別自信的候選字組合;
對于不滿足預設識別概率條件的整體識別概率所對應的第二候選字組合,根據預設候選字分布比例對所述第二候選字組合的整體識別概率進行調整,得到所述第二候選字組合的識別可信度;所述第二候選字組合是不具有識別自信的候選字組合;所述預設候選字分布比例用于標識候選字的常用生僻程度,其中,常用程度低而生僻程度高的候選字的分布比例低,常用程度高而生僻程度低的候選字的分布比例高;
根據所述識別可信度、所述第一候選字組合和所述第二候選字組合,確定所述目標區域的文本識別結果。
2.根據權利要求1所述的方法,其特征在于,所述通過對待識別圖像中的目標區域中的文本進行字形識別,得到多個候選字組合以及每個候選字組合的整體識別概率,包括:
通過字形識別模型對所述目標區域中文本進行字形識別,確定多個候選字,所述候選字具有對應的識別概率;
根據所述多個候選字以及對應的識別概率,確定多個候選字組合以及每個候選字組合的整體識別概率。
3.根據權利要求2所述的方法,其特征在于,目標候選字為所述第二候選字組合中的一個候選字,所述目標候選字的分布比例為在訓練所述字形識別模型所采用訓練樣本涉及的文字中,所述目標候選字所占的比例。
4.根據權利要求1所述的方法,其特征在于,所述對于滿足預設識別概率條件的整體識別概率所對應的第一候選字組合,以所述第一候選字組合的整體識別概率,作為所述第一候選字組合的識別可信度,包括:
在所述多個候選字組合中篩選滿足預設識別概率條件的整體識別概率所對應的第一候選字組合,判定所述第一候選字組合為數字組合,以所述數字組合的整體識別概率作為所述數字組合的識別可信度;
所述對于不滿足預設識別概率條件的整體識別概率所對應的第二候選字組合,根據預設候選字分布比例對所述第二候選字組合的整體識別概率進行調整,得到所述第二候選字組合的識別可信度,包括:
在所述多個候選字組合中篩選不滿足預設識別概率條件的整體識別概率所對應的第二候選字組合,判定所述第二候選字組合為文字組合,根據預設候選字分布比例對所述文字組合的整體識別概率進行調整,得到所述文字組合的識別可信度。
5.根據權利要求1-4任意一項所述的方法,其特征在于,所述方法還包括:
確定所述多個候選字之間的語義連貫性參數;
所述對于滿足預設識別概率條件的整體識別概率所對應的第一候選字組合,以所述第一候選字組合的整體識別概率,作為所述第一候選字組合的識別可信度,包括:
對于滿足預設識別概率條件的整體識別概率所對應的第一候選字組合,以所述第一候選字組合的整體識別概率,以及所述第一候選字組合中候選字的語義連貫性參數得到所述第一候選字組合的識別可信度;
所述根據預設候選字分布比例對所述第二候選字組合的整體識別概率進行調整,得到所述第二候選字組合的識別可信度,包括:
根據預設候選字分布比例對所述第二候選字組合的整體識別概率進行調整;根據調整后的整體識別概率,以及所述第二候選字組合中候選字的語義連貫性參數得到所述第二候選字組合的識別可信度。
6.根據權利要求5所述的方法,其特征在于,所述確定所述多個候選字之間的語義連貫性參數,包括:
從所述多個候選字中的選取一個候選字作為目標文字;
確定所述目標文字與所述多個候選字中至少一個上文字之間的語義連貫性參數,直至得到所述多個候選字之間的語義連貫性參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010212729.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種低劑量CT圖片質量改善方法、系統及設備
- 下一篇:對賬的方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





