[發明專利]用于訓練用于生成圖像的機器學習系統的設備和方法在審
| 申請號: | 202210106209.0 | 申請日: | 2022-01-28 |
| 公開(公告)號: | CN114842282A | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | A·霍列娃;V·蘇什科 | 申請(專利權)人: | 羅伯特·博世有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 張健;劉春元 |
| 地址: | 德國斯*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 訓練 生成 圖像 機器 學習 系統 設備 方法 | ||
用于訓練機器學習系統(60)的計算機實現方法,其中所述機器學習系統(60)包括被配置成生成至少一個圖像(
技術領域
本發明涉及一種訓練機器學習系統的方法、一種用于執行用于訓練的方法的設備、一種機器學習系統、一種計算機程序和一種機器可讀儲存介質。
背景技術
在https://arxiv.org/abs/1905.01164v2處在線可得的Shaham等人的“SinGAN:Learning a Generative Model from a Single Natural Image”, 02.05.2019公開了一種用于訓練生成式對抗網絡的方法。
發明內容
本發明的優勢
現代圖像分類器(尤其是基于神經網絡的那些)要求用于訓練和用于測試兩者的大量圖像。已知的是,考慮到新圖像示出了多樣的內容,圖像分類器的性能(即,分類準確度)隨訓練圖像的量的增加而提高。同樣地,更多測試數據提高了正確地預測圖像分類器的泛化性能的置信度,即,它的正確地對新的和/或未見的數據進行分類的能力。
然而,獲得增加的量的訓練圖像一般是耗時且高成本的努力,這是由于必須在現實世界中記錄圖像。在所記錄的圖像的小訓練數據集處開始,綜合地生成圖像并利用所生成的圖像增強訓練數據集要方便得多。然而,當使用小訓練數據集(極端地,由僅單個圖像構成)時,已知的圖像生成方法過度擬合于導致所生成的圖像不多樣的訓練數據。因此,所生成的圖像既未實現在用于訓練圖像分類器時的更好性能,它們又不支持對圖像分類器在用于測試時的泛化能力進行近似。
具有獨立權利要求1的特征的方法的優勢是:該方法能夠訓練用于生成圖像的機器學習系統,其中該機器學習系統可以是利用僅單個圖像來訓練的,且仍然能夠避免過度擬合于所述圖像。在訓練之后,該機器學習系統能夠生成多樣且逼真的圖像,其實現了圖像分類器在用于訓練時的增強性能或者圖像分類器在用于測試時的泛化能力的更好近似。
本發明的公開內容
在第一方面中,本發明涉及一種用于訓練機器學習系統的計算機實現方法,其中所述機器學習系統包括被配置成生成至少一個圖像的生成器,所述用于訓練的方法包括下述步驟:
· 由所述生成器基于至少一個隨機抽取的值來生成第一圖像;
· 由所述機器學習系統的鑒別器確定表征所述第一圖像的兩個分類的第一輸出,并由所述鑒別器確定表征所提供的第二圖像的兩個分類的第二輸出,其中所述鑒別器被配置成根據以下步驟來確定針對所供給的圖像的輸出:
- 確定所供給的圖像的中間表示;
- 通過將全局池化操作應用于所述中間表示來確定所供給的圖像的內容表示;
- 通過將卷積操作應用于所述中間表示來確定所供給的圖像的布局表示;
- 確定表征所述內容表示的分類的內容值和表征所述布局表示的分類的布局值,并在針對所供給的圖像的輸出中提供所述內容值和布局值;
· 訓練所述鑒別器,使得所述第一輸出中的內容值和布局值表征到第一類中的分類,并且使得所述第二輸出中的內容值和布局值表征到第二類中的分類;
· 訓練所述生成器,使得所述第一輸出中的內容值和布局值表征到所述第二類中的分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅伯特·博世有限公司,未經羅伯特·博世有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210106209.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





