[發(fā)明專利]一種基于卷積神經(jīng)網(wǎng)絡(luò)的稠密光流估計(jì)方法有效
| 申請?zhí)枺?/td> | 201711220774.5 | 申請日: | 2017-11-29 |
| 公開(公告)號: | CN107993255B | 公開(公告)日: | 2021-11-19 |
| 發(fā)明(設(shè)計(jì))人: | 項(xiàng)學(xué)智;翟明亮;呂寧;張榮芳;郭鑫立;王帥;于澤婷;張玉琦 | 申請(專利權(quán))人: | 哈爾濱工程大學(xué) |
| 主分類號: | G06T7/269 | 分類號: | G06T7/269 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區(qū)*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 卷積 神經(jīng)網(wǎng)絡(luò) 稠密 估計(jì) 方法 | ||
本發(fā)明屬于計(jì)算機(jī)視覺領(lǐng)域,提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的稠密光流估計(jì)方法,以解決現(xiàn)有技術(shù)計(jì)算時(shí)間長,計(jì)算量大,計(jì)算效率不高的問題,包含如下步驟:(1)提取運(yùn)動圖像信息:構(gòu)建全卷積網(wǎng)絡(luò)架構(gòu),然后在輸入層輸入兩幅通道數(shù)都為C的圖像,從卷積層8輸出光流_6;(2)生成光流:構(gòu)建稠密光流生成模型。光流_6輸入反卷積層1,反卷積層2輸出光流_5,反卷積層3輸出光流_4,反卷積層4輸出光流_3,反卷積層5輸出光流_2,反卷積層6輸出光流_1;(3)模型訓(xùn)練:用最終損失函數(shù)進(jìn)行訓(xùn)練;(4)光流估計(jì):從全卷積網(wǎng)絡(luò)架構(gòu)的輸入層輸入圖像對,輸出最終預(yù)測的光流。本發(fā)明能夠有效地利用先驗(yàn)知識,模型可以預(yù)先訓(xùn)練,大大減少了計(jì)算時(shí)間。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)視覺領(lǐng)域,尤其涉及一種基于卷積神經(jīng)網(wǎng)絡(luò)的稠密光流估計(jì)方法。
背景技術(shù)
光流估計(jì)是計(jì)算機(jī)視覺領(lǐng)域內(nèi)的一個(gè)重要基礎(chǔ)模塊,其研究目的是通過建模計(jì)算出視頻連續(xù)兩幀間的運(yùn)動信息,具體就是第一幀中每個(gè)像素在第二幀中的對應(yīng)匹配像素。經(jīng)過三十多年的發(fā)展,光流估計(jì)問題已經(jīng)有非常多的相關(guān)研究,但在真實(shí)世界視頻里的魯棒光流估計(jì)仍然是個(gè)富有挑戰(zhàn)性的問題。
光流估計(jì)根據(jù)所采用的方法的不同,大體可以分為兩種:一種是基于Horn和Schunck提出的變分能量優(yōu)化模型,一種是基于匹配的插值優(yōu)化模型。基于變分能量優(yōu)化模型的算法雖然能夠在小位移光流估計(jì)中取得非常精確的結(jié)果,但這種方法通常會在有大位移運(yùn)動物體的場景下失敗。基于匹配的插值優(yōu)化模型主要利用了在大位移運(yùn)動中,兩幀之間視覺關(guān)鍵點(diǎn)的匹配信息對光流估計(jì)結(jié)果的重要性。以一種相對稠密的匹配結(jié)果作為光流估計(jì)的初始值,可以很好的解決傳統(tǒng)變分能量優(yōu)化模型存在的問題。然而,基于匹配的插值優(yōu)化模型主要問題在于計(jì)算稠密匹配需要相當(dāng)大的代價(jià),并且其匹配結(jié)果的精度也直接影響到最終光流估計(jì)的效果。針對這種問題,本發(fā)明提出一種新的適用于大位移光流估計(jì)的稠密匹配算法,可以高效地得到精確的匹配信息光流估計(jì)是計(jì)算機(jī)視覺的重要研究方向之一,近年來,光流估計(jì)越來越受到國內(nèi)外學(xué)者的關(guān)注,是計(jì)算機(jī)視覺領(lǐng)域中的研究熱點(diǎn)。
申請公布號為CN105809712A的專利,公開了一種高效大位移光流估計(jì)方法:從視頻里獲取兩張連續(xù)圖像,將兩幀圖像按時(shí)間順序分別標(biāo)記為I1和I2;以I1和I2為最底層分別構(gòu)造圖像金字塔和在圖像金字塔的每層上生成相同數(shù)目的種子點(diǎn),并將最頂層上的種子點(diǎn)的匹配初始化為隨機(jī)值;將獲得的種子點(diǎn)在由圖像金字塔依次從頂層到底層逐層進(jìn)行匹配,每層種子點(diǎn)的匹配結(jié)果作為下一層相應(yīng)種子點(diǎn)的初始值;將最底層種子點(diǎn)的匹配結(jié)果利用對邊緣敏感的插值算法進(jìn)行插值,將插值結(jié)果作為光流估計(jì)的初始值,然后利用變分能量優(yōu)化模型進(jìn)行優(yōu)化,最終得到大位移光流估計(jì)結(jié)果。但該方法計(jì)算量大,效率不高。
從上面來看,傳統(tǒng)的光流估計(jì)模型使用的是變分框架,在能量泛函中定義數(shù)據(jù)項(xiàng)平滑項(xiàng)等約束,通過極小化能量泛函的方式求取光流。該方法不能利用先驗(yàn)知識,并且此種方法在求解過程中往往需要較多的迭代次數(shù),計(jì)算時(shí)間較長,無法達(dá)到較高的計(jì)算速度。所以傳統(tǒng)方法很難達(dá)到實(shí)際場景的應(yīng)用需求。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供計(jì)算時(shí)間少,計(jì)算速度快,能夠有效地利用先驗(yàn)知識的一種基于卷積神經(jīng)網(wǎng)絡(luò)的稠密光流估計(jì)方法。
本發(fā)明的目的是這樣實(shí)現(xiàn)的:
一種基于卷積神經(jīng)網(wǎng)絡(luò)的稠密光流估計(jì)方法,包含如下步驟:
(1)提取運(yùn)動圖像信息:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工程大學(xué),未經(jīng)哈爾濱工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711220774.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 一種基于圖像形態(tài)學(xué)的稠密物體分割方法
- 矩陣處理裝置
- 基于稠密連接的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)方法和系統(tǒng)
- 一種用于目標(biāo)重建的嵌套結(jié)構(gòu)的漸進(jìn)式稠密網(wǎng)絡(luò)
- 基于稠密多路卷積網(wǎng)絡(luò)的圖片分類方法與系統(tǒng)
- 矩陣處理裝置
- 人臉圖像的處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 結(jié)構(gòu)化稀疏參數(shù)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種訓(xùn)練模型和點(diǎn)云的處理方法及裝置
- 一種表面缺陷檢測方法和裝置





