[發明專利]用于處理圖像的方法、裝置、設備和介質有效
| 申請號: | 202011356103.3 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112836692B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 楊燁華;杜宇寧;郭若愚;魏勝禹;趙喬;劉其文;畢然;胡曉光;于佃海;馬艷軍 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/20;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 趙林琳;姚杰 |
| 地址: | 100094 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 處理 圖像 方法 裝置 設備 介質 | ||
本申請公開了用于處理圖像的方法、裝置、設備和介質,涉及人工智能尤其深度學習、圖像處理領域。該處理圖像方法包括獲取初始圖像,初始圖像包括字符部分。該方法還包括基于初始圖像確定初始圖像的背景圖像,背景圖像描述了相對于初始圖像的字符的背景。該方法還包括利用背景圖像對初始圖像進行調整以生成目標圖像,目標圖像中的對應于字符部分的第一像素的顏色通道的亮度值和對應于非字符部分的第二像素的對應顏色通道的亮度值之間的差值相對于初始圖像被增大。通過該方法,可以有效的提高文字圖片識別結果的準確性,改進檢測的準確率。
技術領域
本公開的實施例主要涉及人工智能領域,并且更具體地,涉及深度學 習和圖像處理領域的用于處理圖像的方法、裝置、設備和介質。
背景技術
圖像處理是利用計算機對圖像進行分析,以獲取所需結果。隨著人工 智能的發展,圖像成為計算機獲取信息的重要途徑。為了更好的處理圖像, 在機器學習領域中各種處理圖像的方法得到了快速的發展。
深度學習(Deep Learning,DL)是機器學習領域中一個新的研究方向。 深度學習是機器學習的一種,其可以用于處理各種圖像。深度學習技術在 對圖像處理以執行各種任務時,不僅需要好的算法模型,還需要高質量的 圖片數據。
發明內容
本公開提供了一種用于處理圖像的方法、裝置、設備以及存儲介質。
根據本公開的第一方面,提供了一種用于處理圖像的方法。該方法包 括獲取初始圖像,初始圖像包括字符部分。該方法還包括基于初始圖 像確定初始圖像的背景圖像,背景圖像描述了相對于初始圖像的字符 的背景。該方法還包括利用背景圖像對初始圖像進行調整以生成目標 圖像,目標圖像中的對應于字符部分的第一像素的顏色通道的亮度值和對應于非字符部分的第二像素的對應顏色通道的亮度值之間的差 值相對于初始圖像被增大。
根據本公開的第二方面,提供了一種用于處理圖像的裝置。該裝置包 括初始圖像獲取模塊,被配置為獲取初始圖像,初始圖像包括字符部分; 第一背景圖像確定模塊,被配置為基于初始圖像確定初始圖像的背景圖 像,背景圖像描述了相對于初始圖像的字符的背景;以及目標圖像生成模 塊,被配置為利用背景圖像對初始圖像進行調整以生成目標圖像,目標圖 像中的對應于字符部分的第一像素的顏色通道的亮度值和對應于非字符 部分的第二像素的對應顏色通道的亮度值之間的差值相對于初始圖像被 增大。
根據本公開的第三方面,提供了一種電子設備。該電子設備包括至少 一個處理器;以及與至少一個處理器通信連接的存儲器;其中,存儲器存 儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使 至少一個處理器能夠執行根據本公開的第一方面的方法。
根據本公開的第四方面,提供一種存儲有計算機指令的非瞬時計算機 可讀存儲介質,計算機指令用于使計算機執行根據本公開的第一方面的方 法。
根據本公開的第五方面,提供一種計算機程序產品,包括計算機程序, 其特征在于,所述計算機程序被處理器執行時實現根據本公開的第一方面 的方法的步驟
根據本申請的技術解決了圖像的調整,提高了獲取字符的準確率。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵 或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下 的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本公開的限定。其中:
圖1示出了本公開的多個實施例能夠在其中實現的環境100的示意 圖;
圖2示出了根據本公開的一些實施例的用于處理圖像的方法200的流 程圖;
圖3A示出了用于本公開的一些實施例的圖像300的示例;
圖3B示出了用于本公開的一些實施例的處理后的圖像300的示例;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011356103.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:PID參數自動整定方法及系統
- 下一篇:用于處理圖像的方法、裝置、設備和介質
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





