[發明專利]字重的變化方法和裝置在審
| 申請號: | 202210513585.1 | 申請日: | 2022-05-11 |
| 公開(公告)號: | CN114913533A | 公開(公告)日: | 2022-08-16 |
| 發明(設計)人: | 尚太章;唐禮承;劉家銘;洪智濱 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V10/774 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 變化 方法 裝置 | ||
1.一種字重的變化方法,所述方法包括:
獲取包含字的待變化圖像;
獲取目標字重值;
將所述待變化圖像和所述目標字重值輸入字重變化模型,得到從所述字重變化模型輸出的輸出圖像,其中,所述輸出圖像包含所述目標字重值的字,所述待變化圖像包含的字和所述輸出圖像包含的字之間的字重值不同,所述字重變化模型是深度神經網絡。
2.根據權利要求1所述的方法,其中,所述字重變化模型包括編碼器、解碼器和多層感知機;
所述將所述待變化圖像和所述目標字重值輸入字重變化模型,得到從所述字重變化模型輸出的輸出圖像,包括:
將所述待變化圖像輸入所述編碼器,得到所述待變化圖像的特征圖;
根據所述目標字重值和所述多層感知機,得到潛在向量;
將所述特征圖和所述潛在向量輸入所述解碼器,得到所述輸出圖像。
3.根據權利要求2所述的方法,其中,所述字重變化模型的訓練樣本集中包括至少兩個字重標注值;
所述根據所述目標字重值和所述多層感知機,得到潛在向量,包括:
響應于所述目標字重值在所述訓練樣本集的字重標注值中大小相鄰的兩個字重標注值之間,通過所述多層感知機,獲取所述兩個字重標注值對應的兩個潛在向量;
根據所述兩個潛在向量,采用插值算法確定所述目標字重值對應的潛在向量作為得到的潛在向量。
4.根據權利要求2所述的方法,其中,所述根據所述目標字重值和所述多層感知機,得到潛在向量,包括:
響應于所述目標字重值為所述訓練樣本集的字重標注值中的字重值,將所述目標字重值輸入所述多層感知機,得到從所述多層感知機輸出的潛在向量。
5.一種字重變化模型的訓練方法,訓練后的字重變化模型為權利要求1-4之一所述的模型,所述方法包括:
將訓練樣本集的樣本中的樣本字圖像和字重標注值輸入待訓練的字重變化模型,得到從所述待訓練的字重變化模型輸出的字重變化圖像;
確定所述字重變化圖像的文字識別結果,基于所述文字識別結果和所述樣本中的文字識別真值,確定所述字重變化圖像中字的感知損失值;
確定所述字重變化圖像中字的字重確定結果,基于所述字重確定結果和所述字重標注值,確定所述字重變化圖像中字的字重損失值;
基于所述感知損失值和所述字重損失值,訓練所述待訓練的字重變化模型,得到訓練后的字重變化模型。
6.根據權利要求5所述的方法,其中,所述確定所述字重變化圖像的文字識別結果,包括:
將所述字重變化圖像輸入預訓練的文字識別模型,得到所述字重變化圖像中字的文字識別結果;以及
所述確定所述字重變化圖像中字的字重確定結果,包括:
將所述字重變化圖像輸入預訓練的字重確定模型,得到所述字重變化圖像中字的字重確定結果。
7.根據權利要求5所述的方法,其中,所述文字識別結果和所述文字識別真值為字圖像;
所述基于所述文字識別結果和所述樣本中的文字識別真值,確定所述字重變化圖像中字的感知損失值,包括:
對所述文字識別結果和所述文字識別真值進行逐像素比對;
根據比對結果,確定所述字重變化圖像中字的感知損失值。
8.一種字重的變化裝置,所述裝置包括:
圖像獲取單元,被配置成獲取包含字的待變化圖像;
字重獲取單元,被配置成獲取目標字重值;
預測單元,被配置成將所述待變化圖像和所述目標字重值輸入字重變化模型,得到從所述字重變化模型輸出的輸出圖像,其中,所述輸出圖像包含所述目標字重值的字,所述待變化圖像包含的字和所述輸出圖像包含的字之間的字重值不同,所述字重變化模型是深度神經網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210513585.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種四股鋼絲繩及其制備方法
- 下一篇:一種新能源汽車制動器





