[發(fā)明專利]渲染圖像獲取方法、裝置、系統(tǒng)和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810490256.3 | 申請日: | 2018-05-21 |
| 公開(公告)號: | CN108876764A | 公開(公告)日: | 2018-11-23 |
| 發(fā)明(設計)人: | 馬里千 | 申請(專利權)人: | 北京曠視科技有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00 |
| 代理公司: | 北京市磐華律師事務所 11336 | 代理人: | 高偉;卜璐璐 |
| 地址: | 100190 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 渲染 渲染圖像 渲染器 存儲介質(zhì) 分類器 計算機視覺 學習訓練 真實圖像 視覺 參數(shù)生成 模型訓練 輸入圖像 對抗 | ||
本發(fā)明提供了一種渲染圖像獲取方法、裝置、系統(tǒng)和存儲介質(zhì),該方法包括:獲取用于特定視覺任務訓練的真實圖像,并利用真實圖像基于對抗學習訓練渲染模型直到訓練結束,渲染模型包括渲染器和分類器,分類器用于區(qū)分輸入圖像是真實的還是渲染得到的;獲取渲染模型訓練結束時渲染器采用的渲染參數(shù)作為最佳渲染參數(shù),并采用渲染器基于最佳渲染參數(shù)生成用于特定視覺任務訓練的最佳渲染圖像。根據(jù)本發(fā)明實施例的渲染圖像獲取方法、裝置、系統(tǒng)和存儲介質(zhì)利用對抗學習訓練渲染器和分類器,使得能夠針對特定邏輯的渲染器以及特定的計算機視覺任務全自動地選取效果最好的渲染參數(shù),從而生成最佳渲染圖像,能夠有效且高效地提升計算機視覺任務的效果。
技術領域
本發(fā)明涉及計算機視覺技術領域,更具體地涉及一種渲染圖像獲取方法、裝置、系統(tǒng)和存儲介質(zhì)。
背景技術
純渲染圖像或生成圖像被廣泛應用在計算機視覺領域,用于解決計算機視覺任務中訓練數(shù)據(jù)不足、標注數(shù)據(jù)不足等問題。渲染圖像的真實度在這個過程中尤其重要,過于虛假的渲染圖像非常不利于計算機視覺任務效果的提升。
針對一個特定邏輯的渲染系統(tǒng),渲染圖像的真實性取決于渲染參數(shù)的選取,而目前并沒有一個合理的方法來自動選取這些參數(shù),基本靠人工經(jīng)驗,這基本決定了渲染數(shù)據(jù)對視覺任務效果的提升全靠人工經(jīng)驗,不僅效率低下且可靠性不高。
發(fā)明內(nèi)容
本發(fā)明提出了一種關于渲染圖像獲取方案,其利用對抗學習訓練渲染器和分類器,使得能夠針對特定邏輯的渲染器以及特定的計算機視覺任務全自動地選取效果最好的渲染參數(shù),從而生成最佳渲染圖像,能夠有效且高效地提升計算機視覺任務的效果。下面簡要描述本發(fā)明提出的關于渲染圖像獲取方案,更多細節(jié)將在后續(xù)結合附圖在具體實施方式中加以描述。
根據(jù)本發(fā)明一方面,提供了一種渲染圖像獲取方法,所述方法包括:獲取用于特定視覺任務訓練的真實圖像,并利用所述真實圖像基于對抗學習訓練渲染模型直到訓練結束,其中,所述渲染模型包括渲染器和分類器,所述分類器用于區(qū)分輸入圖像是真實的還是渲染得到的;以及獲取所述渲染模型訓練結束時所述渲染器采用的渲染參數(shù)作為最佳渲染參數(shù),并采用所述渲染器基于所述最佳渲染參數(shù)生成用于所述特定視覺任務訓練的最佳渲染圖像。
在一個實施例中,所述利用所述真實圖像基于對抗學習訓練渲染模型直到訓練結束包括:獲取m個隨機數(shù),將所述m個隨機數(shù)輸入所述渲染器得到m個渲染圖像,其中m為大于或等于1的整數(shù);將所述m個渲染圖像和所述真實圖像中的n個圖像分別輸入所述分類器,得到m+n個分類結果,并基于所述m+n個分類結果計算所述分類器的損失函數(shù),其中n為大于或等于1的整數(shù);根據(jù)所述分類器的損失函數(shù),采用梯度下降法更新所述分類器的參數(shù),完成所述分類器的一次訓練;計算所述m個渲染圖像的每個渲染圖像中每個像素值對所述渲染器當前采用的渲染參數(shù)的第一偏導數(shù),并計算所述分類器的損失函數(shù)對輸入所述分類器的每個渲染圖像中每個像素值的第二偏導數(shù);基于所述第一偏導數(shù)和所述第二偏導數(shù)計算當前渲染參數(shù)的梯度,并根據(jù)梯度下降法更新所述渲染器采用的渲染參數(shù),從而完成所述渲染模型的一次訓練;以及迭代上述步驟直到所述渲染模型訓練結束。
在一個實施例中,所述基于所述第一偏導數(shù)和所述第二偏導數(shù)計算渲染參數(shù)的梯度包括:將所述第一偏導數(shù)與所述第二偏導數(shù)進行乘法運算,以得到所述分類器的損失函數(shù)對所述當前渲染參數(shù)的第三偏導數(shù)作為所述當前渲染參數(shù)的梯度。
在一個實施例中,所述根據(jù)梯度下降法更新所述渲染器采用的渲染參數(shù)包括:將所述第三偏導數(shù)與學習率進行乘法運算,并將所述當前渲染參數(shù)與所述乘法運算的結果進行減法運算以得到更新后的渲染參數(shù)。
在一個實施例中,所述基于所述m+n個分類結果計算所述分類器的損失函數(shù)包括:基于所述m+n個分類結果中的每一個計算一個子損失函數(shù),并將得到的m+n個子損失函數(shù)之和作為所述分類器的損失函數(shù),或者將得到的m+n個子損失函數(shù)的平均值作為所述分類器的損失函數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司,未經(jīng)北京曠視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810490256.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





