[發明專利]一種基于神經網絡的單光源場景光照重渲染方法及系統在審
| 申請號: | 202011049667.2 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112183637A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 冷聰;李成華;董麗平;江卓龍;程健 | 申請(專利權)人: | 中科方寸知微(南京)科技有限公司;中國科學院自動化研究所南京人工智能芯片創新研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06T5/50;G06N3/08;G06N3/04 |
| 代理公司: | 南京泰普專利代理事務所(普通合伙) 32360 | 代理人: | 張磊 |
| 地址: | 211000 江蘇省南京市江寧區麒麟科*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 光源 場景 光照 渲染 方法 系統 | ||
1.一種基于神經網絡的單光源場景光照重渲染方法,其特征是包括以下步驟:
步驟1、對已有的圖像場景光照數據集進行預處理,同時對數據集進行數據增強;
步驟2、設計光照信息分類網絡;
步驟3、設計自重建網絡模型;
步驟4、構建光照重渲染網絡;
步驟5、使用數據集對光照重渲染網絡進行訓練。
2.根據權利要求1所述的一種基于神經網絡的單光源場景光照重渲染方法,其特征在于,所述步驟1進一步為:
步驟1-1、將圖像分辨率壓縮至預定尺寸,將所有圖像的通道模式統一改為RGB模式,并將所有圖像由H*W*C三維張量在第0維處擴展為N*H*W*C的四維張量;其中H為圖像的高,W為圖像的寬,C為圖像的通道數,N為圖像的個數;
步驟1-2、將通道C與H、W進行位置互換,變成N*C*N*W的四維張量;
步驟1-3、將圖像的像素值由區間[0,255]歸一化到區間[0,1],公式如下:
式中,xnorm是每個通道內歸一化之后的結果,x為原始數據,xmax為每個通道內數據的最大值,xmin為每個通道內數據的最小值。
3.根據權利要求1所述的一種基于神經網絡的單光源場景光照重渲染方法,其特征在于,所述步驟2進一步為:
步驟2-1、采用VIDIT數據集并布置多個虛擬場景,每個虛擬場景至少包括8個方向以及5個色溫,共對應至少40組光照場景;
步驟2-2、為光照信息分類網絡構建損失函數:
式中,表示預測值,y表示真實值;
步驟2-3、對光照信息分類網絡進行訓練,并將得到訓練權重保存,不再改變。
4.根據權利要求1所述的一種基于神經網絡的單光源場景光照重渲染方法,其特征在于,所述步驟3進一步為:
步驟3-1、為內容編碼器構建一個完整的端到端的編碼器解碼器網絡,即先進行分解合成的自重建的訓練,在這個過程中內容編碼器學會圖像中各種低級和高級的特征,同時解碼器也學會將高級的特征還原回低級特征;
步驟3-2、整個預訓練的過程中每次循環迭代時都將一組圖像作為輸入,然后在編碼器中進行卷積編碼,再在解碼器中還原輸入圖像;將最后的輸出和輸入的圖像利用損失函數進行誤差計算,得到損失之后,再回傳網絡進行同時更新梯度,并不斷重復直到網絡收斂,即能夠生成和輸入圖像誤差很小的圖像時停止訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科方寸知微(南京)科技有限公司;中國科學院自動化研究所南京人工智能芯片創新研究院,未經中科方寸知微(南京)科技有限公司;中國科學院自動化研究所南京人工智能芯片創新研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011049667.2/1.html,轉載請聲明來源鉆瓜專利網。





