[發明專利]一種基于低動態范圍的高精圖像信息提取方法在審
| 申請號: | 202010793782.4 | 申請日: | 2020-08-10 |
| 公開(公告)號: | CN111915533A | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 汪昕;金鑫;朱星帆;時超;陳力;蔣尚秀 | 申請(專利權)人: | 上海金橋信息股份有限公司 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T7/90;G06N3/04 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 張乾楨 |
| 地址: | 200234 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 動態 范圍 圖像 信息 提取 方法 | ||
本發明涉及一種基于低動態范圍的高精圖像信息提取方法,包括:步驟1:對圖像進行特征提取,從而得到原始圖像RGB三通道以及HSV顏色空間中的V明度通道;步驟2:使用全卷積神經網絡結構來分組輸出48個系數,并且在其基礎上添加short?cut結構,實現高層特征和低層特征的融合;最后共輸出48個球諧系數,且這48個數分為16個組,每組包含3個數據,分別表示在R通道、G通道和B通道上的分量;步驟3:建立球諧系數損失函數和漫反射貼圖損失函數,計算48個球諧系數的均方誤差損失函數和漫反射貼圖損失函數;步驟4:利用步驟3的48個球諧系數的均方誤差損失函數和漫反射貼圖損失函數反饋約束全卷積神經網絡結構。
技術領域
本發明是一種基于低動態范圍的高精圖像信息提取方法,屬于圖像分析領域。
背景技術
從圖片中恢復原始場景的信息在許多應用中起著非常重要的作用,例如增強現實、電影后期制作、虛擬軍事演習、圖像設計、室內設計、虛擬廣告、虛擬穿衣鏡和娛樂游戲等等。這些應用都包含將虛擬物體、虛擬場景疊加到真實場景中的操作,以對現實世界進行場景增強與擴張。為了使虛實場景完美融合以增加虛擬物體的真實感,必須要保證虛擬物體和真實場景的圖像信息一致,當真實場景的圖像信息發生變化時,虛擬物體的圖像信息也要隨之發生改變。為了保證虛實場景圖像信息的一致性,圖像信息的恢復已成為一項十分重要的工作。
此外,在計算機視覺和計算機圖形學中,許多算法如物體識別、圖像分割和視頻跟蹤等的輸入都是以場景的光度學來表示的,例如圖像像素的RGB值,而物體表面的顏色在很大程度上會受到場景諸多信息的影響,所以場景的圖像信息復雜度是影響許多算法性能的一個重要因素。如人臉識別算法的性能會隨著人臉圖像條件的變化而急劇下降,對圖像信息提取這個問題的解決程度關系著人臉識別實用化的進程。
然而,由于現實場景的復雜性,從一張圖片中恢復其圖像信息是一件十分困難的事。在真實場景中,周圍環境光照、照相機參數、物體表面結構和物體材料特性等諸多因素以極其復雜的方式共同影響著拍攝圖片的形成,并且這些因素的多種組合形式可以產生相同的圖片效果,所以從一張圖片中恢復的圖像信息具有不確定性。
一種簡單直接的獲取圖像信息的方法是在場景中放置圖像信息探針,例如鏡面球和積分球等等。但是我們使用的絕大多數圖片中是不包含圖像信息探針的,而且我們也不可能做到在每個拍攝的場景中都放置圖像信息探針,所以這種方法不具備實際操作性。另外一種較為常用的方法基于手工選取的特征,這些特征包括地面上的陰影、垂直物體表面上的陰影、天空區域或者這些特征的組合。這些特征可以傳達出很多關于圖像的信息,例如天空區域可以告訴我們天氣的陰晴情況和關于太陽位置的信息;地面和垂直物體表面上的陰影則可以告訴我們較多關于太陽位置的信息。但是這種方法存在一些弊端且恢復出的圖像參數不夠準確。
作為機器學習最重要的一個分支,深度學習近幾年來發展迅速,其在計算機視覺、自然語言處理、語音識別和多模態、多任務學習等領域都取得了巨大的成功。而將深度學習應用于圖像信息分析也成為計算機視覺方向的一個重要的研究課題。雖然許多研究已將深度神經網絡應用于從單張室內或室外圖片中恢復圖像信息并且取得較好的結果,但是如何獲取高精度,高質量的圖像信息參數仍然是一個值得探索的問題。
發明內容
為了解決上述技術問題,本發明克服現有技術的不足,設計了基于低動態范圍的高精圖像信息提取方法,并加以實現。隨后針對這個方案的準確率、效率、安全性進行了實驗測試。通過對實驗數據和實驗流程的分析,可以看出本方案準short-cut結構、V明度通道和漫反射貼圖損失函數的有效性。
本發明的技術解決方案為,一種基于低動態范圍的高精圖像信息提取方法,包括如下步驟:
步驟1:對圖像進行特征提取,從而得到原始圖像RGB三通道以及HSV顏色空間中的V明度通道;后者中保存著圖像上每一點的亮度值信息,記錄了整個場景的亮度分布情況,;所述提取出來的特征供后續的神經網絡使用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海金橋信息股份有限公司,未經上海金橋信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010793782.4/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





