[發明專利]文本確定方法、裝置、電子設備和計算機可讀存儲介質在審
| 申請號: | 202110699576.1 | 申請日: | 2021-06-23 |
| 公開(公告)號: | CN113361523A | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 呂鵬原;李景泉;章成全;姚錕;韓鈞宇;劉經拓;丁二銳;吳甜;王海峰 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06K9/72;G06N3/04;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 趙林琳;張昊 |
| 地址: | 100094 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 確定 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
1.一種文本確定方法,包括:
確定原始圖像的圖像特征數據;
基于所述圖像特征數據,確定所述原始圖像中包括的多個字符的字符特征數據;
基于所述字符特征數據,確定所述多個字符的分類信息;以及
通過基于所述多個字符的分類信息確定由所述多個字符組成的備選文本,確定對應于所述備選文本的目標文本。
2.根據權利要求1所述的方法,其中確定所述圖像特征數據包括:
通過第一網絡對所述原始圖像進行處理,確定所述原始圖像的特征圖,作為所述圖像特征數據。
3.根據權利要求2所述的方法,其中所述第一網絡是卷積神經網絡。
4.根據權利要求2所述的方法,其中確定所述字符特征數據包括:
基于所述特征圖確定所述多個字符所在的區域;以及
基于所述特征圖中的對應于所述區域的特征數據,確定分別對應于所述多個字符的多個特征向量,作為所述字符特征數據。
5.根據權利要求4所述的方法,其中確定所述多個字符的分類信息包括:
利用第二網絡基于所述多個特征向量確定所述多個字符的分類信息。
6.根據權利要求5所述的方法,其中所述第二網絡是全連接網絡。
7.根據權利要求1所述的方法,其中確定所述多個字符的分類信息包括:
將所述字符特征數據應用于字符識別模型以確定所述多個字符的分類信息,所述字符識別模型是將被設置的參考字符特征數據作為輸入以及對應的經標注的參考字符分類信息作為輸出來訓練得到的。
8.根據權利要求1所述的方法,其中確定所述目標文本包括:
將所述備選文本應用于語義糾錯模型;以及
從所述語義糾錯模型中獲取經確定的所述目標文本。
9.根據權利要求8所述的方法,其中所述語義糾錯模型是將被設置的參考備選文本作為輸入以及將經標注的參考目標文本作為輸出來訓練得到的,所述參考備選文本是基于所述參考目標文本修改后的文本。
10.一種文本確定裝置,包括:
圖像特征數據確定模塊,被配置為確定原始圖像的圖像特征數據;
字符特征數據確定模塊,被配置為基于所述圖像特征數據確定所述原始圖像中包括的多個字符的字符特征數據;
分類信息確定模塊,被配置為基于所述字符特征數據確定所述多個字符的分類信息;以及
目標文本確定模塊,被配置為通過基于所述多個字符的分類信息確定由所述多個字符組成的備選文本來確定對應于所述備選文本的目標文本。
11.根據權利要求10所述的裝置,其中所述圖像特征數據確定模塊包括:
特征圖確定模塊,被配置為通過第一網絡對所述原始圖像進行處理來確定所述原始圖像的特征圖,作為所述圖像特征數據。
12.根據權利要求11所述的裝置,其中所述第一網絡是卷積神經網絡。
13.根據權利要求11所述的裝置,其中所述字符特征數據確定模塊包括:
字符區域確定模塊,被配置為基于所述特征圖確定所述多個字符所在的區域;以及
特征向量確定模塊,被配置為基于所述特征圖中的對應于所述區域的特征數據,確定分別對應于所述多個字符的多個特征向量,作為所述字符特征數據。
14.根據權利要求13所述的裝置,其中所述分類信息確定模塊進一步被配置為:
利用第二網絡基于所述多個特征向量確定所述多個字符的分類信息。
15.根據權利要求14所述的裝置,其中所述第二網絡是全連接網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110699576.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種檸條機械發酵型全混合飼料及其制備方法
- 下一篇:一種打樁設備及打樁方法





