[發明專利]包含背景和介質的圖片的生成方法及裝置在審
| 申請號: | 202010818037.0 | 申請日: | 2020-08-14 |
| 公開(公告)號: | CN111951154A | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 張寶華 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06T3/00 | 分類號: | G06T3/00;G06T7/11;G06T7/194;G06K9/62 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 孫乳筍;任默聞 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 包含 背景 介質 圖片 生成 方法 裝置 | ||
本發明公開了一種包含背景和介質的圖片的生成方法及裝置,涉及人工智能技術領域,該方法包括:獲取通過訓練好的第一圖片生成模型生成的目標背景圖片;獲取通過訓練好的第二圖片生成模型生成的第一包含背景和介質的圖片,其中,所述第二圖片生成模型為采用歷史包含背景和介質的圖片作為訓練數據訓練得出的;根據訓練好的摳圖模型從所述第一包含背景和介質的圖片提取出介質圖片;根據所述介質圖片和所述目標背景圖片生成第二包含背景和介質的圖片。本發明實現了高效生成大量包含背景和介質的圖片,有助于提高訓練出的目標檢測和文字識別模型的識別準確性。
技術領域
本發明涉及人工智能技術領域,具體而言,涉及一種包含背景和介質的圖片的生成方法及裝置。
背景技術
在金融領域部分圖像識別場景中,需要識別通過高拍儀拍攝的包含背景(客戶交易憑證)和介質(如客戶身份證、卡片介質、港澳通行證以及U盾等多種介質)的圖片,現有技術可以通過構建目標檢測、文本識別等模型,對圖片中的介質進行檢測和識別,以自動進行信息核對,提升業務處理效率。
金融領域部分圖像識別場景存在樣本量較少、樣本不均衡的問題,并且部分介質圖片極少。主要是由于業務辦理差異,提供的訓練樣本較不均勻,如包含身份證或銀行卡介質圖片數量與包含U盾或密碼器圖片數量相比超過1000:1。而獲取足夠多的包含U盾或密碼器圖片的數量,挑戰較大,需要花費大量人力去查找相關介質圖片。
綜上,由于樣本數量有限,導致該場景目標檢測和文字識別模型效果不佳。因此,如何快速的生成大量的包含背景和介質的圖片,以提升訓練出的目標檢測模型和文字識別模型的準確率,是本領域亟需解決的技術問題。
發明內容
本發明為了解決上述背景技術中的技術問題,提出了一種包含背景和介質的圖片的生成方法及裝置。
為了實現上述目的,根據本發明的一個方面,提供了一種包含背景和介質的圖片的生成方法,該方法包括:
獲取通過訓練好的第一圖片生成模型生成的目標背景圖片,其中,所述第一圖片生成模型為采用歷史背景圖片作為訓練數據訓練得出的;
獲取通過訓練好的第二圖片生成模型生成的第一包含背景和介質的圖片,其中,所述第二圖片生成模型為采用歷史包含背景和介質的圖片作為訓練數據訓練得出的;
根據訓練好的摳圖模型從所述第一包含背景和介質的圖片提取出介質圖片,其中,所述摳圖模型為采用標注出介質的包含背景和介質的圖片作為訓練數據訓練得出的;
根據所述介質圖片和所述目標背景圖片生成第二包含背景和介質的圖片。
可選的,該包含背景和介質的圖片的生成方法,還包括:
獲取第一訓練數據,其中,所述第一訓練數據為歷史背景圖片;
根據所述第一訓練數據采用變分自編碼器和生成對抗網絡訓練出所述第一圖片生成模型。
可選的,所述第一圖片生成模型的損失函數為根據變分自編碼器的損失函數以及生成對抗網絡的損失函數確定得出的。
可選的,該包含背景和介質的圖片的生成方法,還包括:
獲取第二訓練數據,其中,所述第二訓練數據為歷史包含背景和介質的圖片;
根據所述第二訓練數據采用變分自編碼器和生成對抗網絡訓練出所述第二圖片生成模型。
可選的,所述第二圖片生成模型的損失函數為根據變分自編碼器的損失函數以及生成對抗網絡的損失函數確定得出的。
可選的,所述介質圖片為二值圖;
所述根據所述介質圖片和所述目標背景圖片生成第二包含背景和介質的圖片包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010818037.0/2.html,轉載請聲明來源鉆瓜專利網。





