[發(fā)明專利]用于處理圖像的方法、裝置、設備和介質有效
| 申請?zhí)枺?/td> | 202011356103.3 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112836692B | 公開(公告)日: | 2023-03-24 |
| 發(fā)明(設計)人: | 楊燁華;杜宇寧;郭若愚;魏勝禹;趙喬;劉其文;畢然;胡曉光;于佃海;馬艷軍 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/20;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 趙林琳;姚杰 |
| 地址: | 100094 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 處理 圖像 方法 裝置 設備 介質 | ||
1.一種用于處理圖像的方法,包括:
獲取初始圖像,所述初始圖像包括字符部分和非字符部分;
基于所述初始圖像確定所述初始圖像的背景圖像,所述背景圖像描述了相對于所述初始圖像的字符的背景;以及
利用所述背景圖像對所述初始圖像進行調(diào)整以生成目標圖像,所述目標圖像中的對應于所述字符部分的第一像素的顏色通道的亮度值和對應于所述非字符部分的第二像素的對應顏色通道的亮度值之間的差值相對于所述初始圖像被增大;
其中基于所述初始圖像確定所述初始圖像的背景圖像包括:確定與所述初始圖像的背景相對應的預定類型,其中所述預定類型包括金屬、卡證、水印或條紋中的一種或多種;獲取與所述背景圖像的所述預定類型相對應的專用背景確定模型,其中所述專用背景確定模型是用于確定所述預定類型的背景圖像的機器學習模型;以及利用所述專用背景確定模型來確定所述初始圖像的所述背景圖像;
其中利用所述背景圖像對所述初始圖像進行調(diào)整以生成目標圖像包括:通過將所述初始圖像的所述非字符部分的像素的顏色通道的亮度值設置為所述背景圖像的對應部分的像素的對應顏色通道的亮度值,并且保持所述初始圖像中的所述字符部分的像素的顏色通道的亮度值不變,來生成所述目標圖像。
2.根據(jù)權利要求1所述的方法,其中獲取所述專用背景確定模型包括
獲取通用背景確定模型,所述通用背景確定模型是用于確定多種類型的背景圖像的機器學習模型;
獲取與所述預定類型相對應的樣本背景圖像;
對所述樣本背景圖像進行調(diào)整以獲取多個經(jīng)調(diào)整的樣本背景圖像;以及
使用所述多個經(jīng)調(diào)整的樣本背景圖像來訓練所述通用背景確定模型以獲取所述專用背景確定模型。
3.根據(jù)權利要求1所述的方法,其中對所述初始圖像進行調(diào)整包括:
將所述初始圖像和所述背景圖像輸入圖像調(diào)整模型以對所述初始圖像進行調(diào)整,所述圖像調(diào)整模型是用于將所述圖像中對應于所述字符部分的所述第一像素的所述顏色通道的亮度值和對應于所述非字符部分的所述第二像素的所述對應顏色通道的亮度值之間的差值增大的機器學習模型。
4.根據(jù)權利要求1所述的方法,還包括:
對所述目標圖像進行識別以確定所述目標圖像中的所述字符;以及
相關聯(lián)地存儲所述字符和所述初始圖像。
5.一種用于處理圖像的裝置,包括:
初始圖像獲取模塊,被配置為獲取初始圖像,所述初始圖像包括字符部分和非字符部分;
第一背景圖像確定模塊,被配置為基于所述初始圖像確定所述初始圖像的背景圖像,所述背景圖像描述了相對于所述初始圖像的字符的背景;以及
目標圖像生成模塊,被配置為利用所述背景圖像對所述初始圖像進行調(diào)整以生成目標圖像,所述目標圖像中的對應于所述字符部分的第一像素的顏色通道的亮度值和對應于所述非字符部分的第二像素的對應顏色通道的亮度值之間的差值相對于所述初始圖像被增大;
其中所述第一背景圖像確定模塊包括:用于確定與所述初始圖像的背景相對應的預定類型的模塊,其中所述預定類型包括金屬、卡證、水印或條紋中的一種或多種;專用背景確定模型獲取模塊,被配置為獲取與所述背景圖像的所述預定類型相對應的專用背景確定模型,其中所述專用背景確定模型是用于確定所述預定類型的背景圖像的機器學習模型;以及第二背景圖像確定模塊,被配置為利用所述專用背景確定模型來確定所述初始圖像的所述背景圖像;
其中所述目標圖像生成模塊還被配置為:通過將所述初始圖像的所述非字符部分的像素的顏色通道的亮度值設置為所述背景圖像的對應部分的像素的對應顏色通道的亮度值,并且保持所述初始圖像中的所述字符部分的像素的顏色通道的亮度值不變,來生成所述目標圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011356103.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





