[發(fā)明專利]基于神經網絡的圖像目標跟蹤算法在審
| 申請?zhí)枺?/td> | 201611271054.7 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN106651917A | 公開(公告)日: | 2017-05-10 |
| 發(fā)明(設計)人: | 于瑞國;劉凱;于健;王建榮;喻梅;徐天一 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06T7/246 | 分類號: | G06T7/246 |
| 代理公司: | 天津市北洋有限責任專利代理事務所12201 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 圖像 目標 跟蹤 算法 | ||
技術領域
本發(fā)明屬于人工神經網絡和計算機視覺領域,涉及自編碼器神經網絡和目標追蹤技術,尤其涉及一種基于神經網絡的圖像目標跟蹤算法。
背景技術
圖像序列目標跟蹤具有非常廣泛的應用,是計算機視覺中最經典的問題之一。圖像序列目標跟蹤解決如下問題:在圖像序列的某一幀中使用一個矩形框來界定需要被跟蹤的目標對象,目標跟蹤算法在后續(xù)的圖像序列中給出被跟蹤的目標對象在當前圖像中的位置。圖像目標跟蹤算法在機器人技術、航天、安全監(jiān)控、軍事等諸多領域有著廣泛的應用前景。
基于區(qū)域的目標跟蹤算法把目標一開始所在的區(qū)域的矩形框作為目標對象的模板,在后序的圖像序列中,使用目標對象的模板與圖像中所有可能的位置進行相關度的匹配,匹配度越高說明相關性越強。基于區(qū)域的跟蹤使用了目標對象的全局信息,因此可信度較高,但目標發(fā)生嚴重形變時容易造成跟蹤失敗的發(fā)生。
基于特征的目標跟蹤算法使用目標的顯著的特征來表示目標,比較常用的目標特征有顏色特征、灰度特征、紋理特征等,然后在新的圖像上進行特征的匹配,然后根據原特征和新圖像上的特征的相似性來確定目標對象的位置。
基于運動的目標跟蹤算法會利用一系列圖像序列中的目標的運動信息來對目標對象進行跟蹤。由于二維的圖像無法完整地表示三維空間中物體的運動狀態(tài),在目標對象發(fā)生復雜的運動時,這種方法通常會不穩(wěn)定。
在實際的目標跟蹤過程中,目標對象的外形變化和運動狀態(tài)都非常復雜,當目標對象的外形和運動狀態(tài)發(fā)生變化時,上述跟蹤方法難以快速適應這些變化,容易造成跟蹤效果差甚至跟蹤失敗的情況。
發(fā)明內容
本發(fā)明的目的在于克服上述現有技術的不足,采用神經網絡對原圖像進行編碼,有效克服亮度變化以及被跟蹤的目標外形變化對跟蹤效果的不利影響,同時對跟蹤過程進行動態(tài)調整,使得目標外形變化較快或較慢時都能得到較好的跟蹤效果。
本發(fā)明的技術方案是提供一種基于神經網絡的圖像目標跟蹤算法,包括如下:
步驟一:使用收集的圖像訓練自編碼器,得到神經網絡;
訓練的目標最小化下式(1):
其中:x表示神經網絡的輸入,W表示網絡權值,h表示隱藏層的向量;
步驟二:預處理需要跟蹤的圖像序列,使用自編碼器進行特征提取;
步驟三:使用濾波的方法對目標進行跟蹤;
步驟四:根據每一幀的跟蹤結果對跟蹤器進行更新;
步驟五:根據跟蹤效果動態(tài)調整更新參數。
所述步驟一具體如下:
(1)、收集一系列具有明顯特征的圖像;
(2)、切割每個圖像成多個小的圖像塊;
(3)、使用切割后的圖像塊訓練自編碼器;
(4)、訓練出來的神經網絡用于提取圖像的特征向量。
所述步驟二具體如下:將輸入圖像分割成M×N個圖像塊,使用訓練得到的神經網絡對每個圖像塊進行編碼,得到一組特征向量。
所述步驟三具體如下:使用窗函數過濾提取出特征,首先將經過窗函數過濾的特征向量映射到傅立葉域,使用第一幀圖像的特征向量建立一個線性相關模型;對之后的每一幀圖像,使用該模型預測目標對象在當前圖像的位置。
所述步驟四具體如下:根據目標對象新的位置對跟蹤模型的參數進行調整,以適應目標對象的外形變化。
所述步驟五具體如下:在跟蹤過程中,如檢測到目標對象外形變化速率較快,則提高上述步驟四中模型更新的速率,反之則降低該速率。
本發(fā)明的有益效果:
本發(fā)明有效克服亮度變化對目標對象特征的影響;實時調整跟蹤模型,以適應目標對象的外形變化,得到更精確的跟蹤效果;同時能夠在跟蹤過程中根據實際情況動態(tài)調整學習參數,使目標外形變化快慢均能取得好的跟蹤效果。
本發(fā)明的算法保證了目標跟蹤的準確性和魯棒性。
附圖說明
圖1為本發(fā)明的算法流程圖。
圖2為測試序列跟蹤窗口偏移圖。
具體實施方式
下面通過具體實施例和附圖對本發(fā)明作進一步的說明。本發(fā)明的實施例是為了更好地使本領域的技術人員更好地理解本發(fā)明,并不對本發(fā)明作任何的限制。
本發(fā)明基于神經網絡的圖像目標跟蹤算法,如圖1所示,算法包括如下步驟:步驟一、使用收集的圖像訓練自編碼器,得到神經網絡,具體:
收集一系列具有明顯特征的圖像,將每個圖像切割成多個小的圖像塊,使用這些圖像塊對自編碼器進行訓練,訓練的目標是最小化下式(1):
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611271054.7/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





