[發(fā)明專利]基于卷積神經(jīng)網(wǎng)絡(luò)的對單張室外圖像太陽位置的預(yù)測方法有效
| 申請?zhí)枺?/td> | 201711078072.8 | 申請日: | 2017-11-06 |
| 公開(公告)號: | CN107895385B | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計)人: | 金鑫;孫星;張曉昆;李曉東;孫楠;周興暉;葉超塵 | 申請(專利權(quán))人: | 中共中央辦公廳電子科技學(xué)院 |
| 主分類號: | G06T7/73 | 分類號: | G06T7/73;G06N3/04 |
| 代理公司: | 北京科迪生專利代理有限責(zé)任公司 11251 | 代理人: | 楊學(xué)明;顧煒 |
| 地址: | 100070*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 卷積 神經(jīng)網(wǎng)絡(luò) 單張 室外 圖像 太陽 位置 預(yù)測 方法 | ||
本發(fā)明公開了一種基于卷積神經(jīng)網(wǎng)絡(luò)的對單張室外圖像太陽位置的預(yù)測方法。考慮到卷積神經(jīng)網(wǎng)絡(luò)在提取圖像亮度屬性有著較好的表現(xiàn),該方法將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用拓展到對單幅圖像的太陽位置預(yù)測上。首先,對webcam數(shù)據(jù)集進(jìn)行刪選。統(tǒng)一的圖片尺寸,并修改卷積神經(jīng)網(wǎng)絡(luò)中的卷基層、池化層的相關(guān)參數(shù)。然后,將數(shù)據(jù)轉(zhuǎn)換成為hdf5格式,并將網(wǎng)絡(luò)的數(shù)據(jù)輸入層改為了HDF5Layer層以支持hdf5型的數(shù)據(jù)輸入。最后,在網(wǎng)絡(luò)的輸出層選擇將兩個角度分開輸出,計算兩個損失函數(shù)。本發(fā)明使用了進(jìn)行圖片分類的卷積神經(jīng)網(wǎng)絡(luò)AlexNet以及對MSCR網(wǎng)絡(luò)進(jìn)行一定修改后的網(wǎng)絡(luò)來進(jìn)行對比訓(xùn)練。并對預(yù)測結(jié)果進(jìn)行了統(tǒng)計和對比分析。
技術(shù)領(lǐng)域
本發(fā)明屬于計算機(jī)圖形學(xué)領(lǐng)域,具體涉及一種基于卷積神經(jīng)網(wǎng)絡(luò)的對單張室外圖像太陽位置的預(yù)測方法。
背景技術(shù)
隨著計算機(jī)技術(shù)的進(jìn)步,計算機(jī)圖形學(xué)理論方法和相應(yīng)內(nèi)容實(shí)現(xiàn)方法的不斷更新、進(jìn)步,我們能夠從一張圖片中獲取到的信息越來越多。其中,一張圖片的場景信息(如:光照方向、物體材質(zhì)、物體物理位置、物體顏色等),對于獲取圖片中的光照信息具有決定性的作用,圖片中的各個組成部分在一定光源下都會對彼此的光影分布產(chǎn)生影響。一張圖片中的場景是晴天還是陰天,是早上還是傍晚,圖片是是清晰的還是模糊的,圖片的拍攝地點(diǎn)是在戶外還是在室內(nèi),從圖片中獲取諸如此類的場景信息,對于我們?nèi)藖碚f是直觀、便捷、快速的,但是對于計算機(jī)來說,它“看”到的圖片,只是一個充滿著數(shù)字的矩陣,它無法直觀的從這個矩陣中判斷出圖片的各種場景信息。讓計算機(jī)能夠從圖片中判斷出這些場景信息,對于計算機(jī)圖形學(xué)來說是一項非常重要的研究內(nèi)容。光,作為反映圖片中場景信息的重要客觀條件,在計算機(jī)圖形學(xué)的眾多研究領(lǐng)域中一直是一個不可或缺的因素,但在計算機(jī)圖形學(xué)的研究中,往往將圖片中的光照信息更多的是作為一種噪聲,而不是場景信息一種,希望在獲取圖片信息的過程中,圖片中的光照信息是不變的,這樣可以減少干擾因素?;谶@種理論假設(shè),C.Stauffer等人試圖僅通過圖片背景信息的改變來進(jìn)行追蹤和監(jiān)視,H.Chen等人試圖分析光照的不變性。這些研究都忽略的光照對場景信息的表達(dá)的影響。所以,單獨(dú)分析一張圖片中的光照信息是一個有著豐富應(yīng)用研究價值的題目。在這個基礎(chǔ)上,基于對圖片解析、圖片重構(gòu)等方面的需求,發(fā)展為從一張圖片分析預(yù)測圖片中的光照方向(太陽位置)的研究內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明要解決技術(shù)問題為:基于卷積神經(jīng)網(wǎng)絡(luò)的對單張室外圖像太陽位置的預(yù)測。通過卷積神經(jīng)網(wǎng)絡(luò)自動預(yù)測圖片中的太陽位置。由于太陽位置是相對于拍攝地點(diǎn)而言的相對值,在傳統(tǒng)的方法中,需要結(jié)合拍攝經(jīng)緯度、相機(jī)參數(shù)等外界信息。本發(fā)明選擇通過卷積神經(jīng)網(wǎng)路自動提取圖片的特征信息,直接輸出太陽位置這個相對值。
本發(fā)明采用的技術(shù)方案為:一種基于卷積神經(jīng)網(wǎng)絡(luò)的對單張室外圖像太陽位置的預(yù)測方法,該方法包括如下步驟:
(1)需要兼顧圖片的全局特征和局部特征,將數(shù)據(jù)集中尺寸不一的圖片統(tǒng)一縮小到256×256的圖片大小,并修改卷積神經(jīng)網(wǎng)絡(luò)中的卷基層、池化層的相關(guān)參數(shù),使得網(wǎng)絡(luò)滿足256×256的大小的圖片的輸入。將數(shù)據(jù)集中帶有l(wèi)ogo、帶有明顯噪聲的部分圖片剔除出本次實(shí)驗(yàn),不采用它們作為訓(xùn)練集使用;
(2)將數(shù)據(jù)通過自寫程序轉(zhuǎn)換成了hdf5格式,并在將網(wǎng)絡(luò)的數(shù)據(jù)輸入層改為了HDF5Layer層以支持hdf5型的數(shù)據(jù)輸入;在網(wǎng)絡(luò)的輸出層選擇將兩個角度分開輸出,計算兩個損失函數(shù);
(3)將數(shù)據(jù)在AlexNet和MSCR改上進(jìn)行訓(xùn)練;訓(xùn)練的訓(xùn)練集為520000張圖片,測試集為123500張圖片,基本保持在4:1的比例,訓(xùn)練和測試的batch_size設(shè)置為32,最大迭代次數(shù)為325000次;
(4)通過縱橫向?qū)Ρ葘φ`差進(jìn)行分析。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中共中央辦公廳電子科技學(xué)院,未經(jīng)中共中央辦公廳電子科技學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711078072.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





