[發(fā)明專利]一種混合塊稀疏協(xié)作模型的目標(biāo)跟蹤方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710472577.6 | 申請(qǐng)日: | 2017-06-21 |
| 公開(公告)號(hào): | CN107194408B | 公開(公告)日: | 2021-06-01 |
| 發(fā)明(設(shè)計(jì))人: | 孫戰(zhàn)里;馬書恒 | 申請(qǐng)(專利權(quán))人: | 安徽大學(xué) |
| 主分類號(hào): | G06K9/46 | 分類號(hào): | G06K9/46;G06K9/62;G06T7/11;G06T7/20 |
| 代理公司: | 合肥市浩智運(yùn)專利代理事務(wù)所(普通合伙) 34124 | 代理人: | 丁瑞瑞 |
| 地址: | 230000 *** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 混合 稀疏 協(xié)作 模型 目標(biāo) 跟蹤 方法 | ||
1.一種混合塊稀疏協(xié)作模型的目標(biāo)跟蹤方法,其特征在于:包括候選目標(biāo)的置信值和對(duì)遮擋進(jìn)行處理,包括:
步驟a、從第一幀初始化目標(biāo)并選取目標(biāo)區(qū)域,包括:
根據(jù)所述第一幀的被跟蹤目標(biāo)在整張圖片的真實(shí)坐標(biāo),即p=[x,y,w,h,α]為第一幀的目標(biāo)跟蹤框的位置、仿射參數(shù)β=[β1,β2,β3,β4,β5,β6]、粒子采樣數(shù)z為600個(gè)、sz=[32 32],仿射參數(shù)β是已知條件,用于預(yù)測(cè)候選后目標(biāo),對(duì)所述原始的參數(shù)向量p進(jìn)行處理得到p1=[x,y,w/32,α,w/h,0],其中x,y為中心點(diǎn)像素坐標(biāo),w和h分別為目標(biāo)框的寬和長(zhǎng),α為目標(biāo)框的旋轉(zhuǎn)角度,β1和β2表示目標(biāo)移動(dòng)在橫坐標(biāo)和縱坐標(biāo)方向上的步長(zhǎng),β3表示的步長(zhǎng)的比例因子,β4表示目標(biāo)框的旋轉(zhuǎn)角度,β5表示目標(biāo)框的寬高比,β6表示目標(biāo)框的傾斜角,將p1仿射變換得到幾何意義上的參數(shù)q,q是一個(gè)2*3的仿射變換參數(shù)矩陣,用p中的x,y,w,h初始化參數(shù)就可以確定目標(biāo)在第一幀的位置將目標(biāo)畫出來,當(dāng)跟蹤目標(biāo)運(yùn)動(dòng)時(shí),跟蹤目標(biāo)的尺度變化因子、旋轉(zhuǎn)變化因子發(fā)生改變,從而使跟蹤目標(biāo)在視頻圖像中的大小發(fā)生改變,用L1表示32*32大小的一個(gè)小塊,將L1用滑動(dòng)窗進(jìn)行分塊處理并標(biāo)簽,用于后面將候選樣本模型和詞典進(jìn)行分塊處理的時(shí)候,能夠很好的分塊處理,具體如下:將L1分成尺寸為16*16的局部塊,步長(zhǎng)為8,得到9個(gè)互有重疊的局部塊X1,再將局部塊X1池化成一列,把每一個(gè)小塊X1的坐標(biāo)排到一起,返回每個(gè)塊所含的坐標(biāo)標(biāo)簽用Z表示;
步驟b、利用目標(biāo)的坐標(biāo)通過仿射變換和圖像插值的方法獲取目標(biāo)的正、負(fù)樣本模板;包括:
將每一幀圖像都轉(zhuǎn)換成灰度圖像,根據(jù)p,將第一幀圖像中的目標(biāo)圖像插值成尺寸大小為32*32的目標(biāo)塊L,再將目標(biāo)塊L池化成一列用作訓(xùn)練詞典,以所述第一幀目標(biāo)中心x,y,以內(nèi)半徑r1為0,外半徑r2為4個(gè)像素點(diǎn),
mir=y(tǒng)-r2+1,mic=x-r2+1,mar=y(tǒng)+r2,mac=x+r2,
mir為y移動(dòng)的最小距離,mar為y移動(dòng)的最大距離,mic為x移動(dòng)的最小距離,mac為x移動(dòng)的最大距離,m等于50為最多正樣本個(gè)數(shù),
pro=m/((mar-mir+1)*(mac-mic+1))
pro表示正樣本個(gè)數(shù)占候選樣本個(gè)數(shù)的比例,將mir到mar排列成一行,總共排列成mar-mir+1行,r尺寸大小為8*8,r代表的是y周圍的坐標(biāo),將mic到mac排列成一列,總共排列成mac-mic+1列,c尺寸大小為8*8,c代表的是x周圍的坐標(biāo),
di=(y-r)2+(x-c)2
di為目標(biāo)中心坐標(biāo)到候選正樣本中心點(diǎn)坐標(biāo)的距離,rd為(0,1)之間均勻分布的隨機(jī)數(shù),其尺寸大小為(mac-mic+1)*(mar-mir+1),記錄c中滿足(rdpro)同時(shí)滿足(dir22)同時(shí)滿足(di=r12)這些條件的c和對(duì)應(yīng)的r作為目標(biāo)中心的正樣本坐標(biāo),再結(jié)合q中的參數(shù)仿射反變換成p4大小為6*k1,再將p4仿射變換為q4,根據(jù)q4,在第一幀圖像上插值成尺寸大小為32*32的正樣本A_p1,再將A_p1中每一個(gè)樣本看做一列1024維得到A_p為正樣本模板,同理在第一幀目標(biāo)中心x,y以內(nèi)半徑r1為8,外半徑r2為30個(gè)像素點(diǎn),最多取200個(gè),得到負(fù)樣本模板A_n,其中,k1是正樣本的個(gè)數(shù);
步驟c、根據(jù)上一幀視頻圖像的目標(biāo)通過粒子濾波、仿射變換和圖像插值得到候選目標(biāo);
步驟d、利用k-d樹搜索得到此幀最佳的候選目標(biāo)為i,確定目標(biāo)區(qū)域,將最佳的候選目標(biāo)作為訓(xùn)練的詞典,包括:
在公開的資源中用k-d樹算法計(jì)算并結(jié)合k-d樹的最近鄰搜索算法得到最佳的候選目標(biāo),確定目標(biāo)區(qū)域,對(duì)應(yīng)的候選目標(biāo)框參數(shù)作為此幀的目標(biāo)跟蹤,用于下一幀的預(yù)測(cè),將最佳的候選目標(biāo)用作訓(xùn)練詞典的一部分,并且將第一幀目標(biāo)也用于詞典的一部分,利用前n幀作為訓(xùn)練詞典,用于后面的稀疏表示求候選目標(biāo)的稀疏系數(shù);
步驟e、判斷i是否大于n幀,不大于重復(fù)步驟c至步驟d,大于n幀時(shí)進(jìn)入步驟f,其中n是訓(xùn)練詞典的幀數(shù);
步驟f、i大于n幀后,用滑動(dòng)窗將詞典分塊,并利用增量奇異值分解求取詞典的均值和特征值;
步驟g、根據(jù)上一幀視頻圖像的目標(biāo),通過粒子濾波、仿射變換和圖像插值得到候選目標(biāo);
步驟h、通過稀疏表示和正、負(fù)樣本模板,計(jì)算每個(gè)候選目標(biāo)的置信值;
步驟i、用滑動(dòng)窗將候選目標(biāo)分塊處理,再根據(jù)詞典進(jìn)行稀疏表示;
步驟j、通過后驗(yàn)概率最大化,獲取當(dāng)前幀最可靠的候選目標(biāo)為,確定目標(biāo)區(qū)域;
步驟k、每隔幾幀實(shí)時(shí)更新負(fù)樣本模板和詞典;
步驟l、重復(fù)步驟g至步驟k直到此跟蹤結(jié)束;
所述的步驟i的用滑動(dòng)窗將候選目標(biāo)分塊處理再根據(jù)詞典進(jìn)行稀疏表示,還包括:
利用公式
對(duì)ei進(jìn)行判斷處理用于步驟i后面的計(jì)算,其中,xi為每個(gè)候選目標(biāo)進(jìn)行圖像分塊處理后得到每個(gè)互有重疊的局部塊,D為詞典,wi為每個(gè)候選目標(biāo)進(jìn)行圖像分塊處理后得到每個(gè)互有重疊的局部塊所對(duì)應(yīng)的稀疏系數(shù),ei為每個(gè)候選目標(biāo)對(duì)應(yīng)的每個(gè)局部塊通過詞典D和對(duì)應(yīng)的稀疏系數(shù)得到的重構(gòu)誤差,θ是個(gè)參數(shù)用于判斷目標(biāo)是否遮擋,當(dāng)ei值大于參數(shù)θ對(duì)應(yīng)的值判斷此局部塊被遮擋,局部塊具有較大的重構(gòu)誤差被視為遮擋,相應(yīng)的稀疏系數(shù)向量被設(shè)置為零,用于處理在目標(biāo)跟蹤過程中目標(biāo)出現(xiàn)遮擋的時(shí)候。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽大學(xué),未經(jīng)安徽大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710472577.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種基于業(yè)務(wù)規(guī)則的跨部門流程協(xié)同方法
- 基站協(xié)作的動(dòng)態(tài)連接方法、基站和協(xié)作多輸入多輸出系統(tǒng)
- 一種協(xié)作多點(diǎn)傳輸系統(tǒng)的信號(hào)發(fā)送方法及其裝置
- 協(xié)作方法、網(wǎng)絡(luò)和用戶終端
- 應(yīng)用程序協(xié)作系統(tǒng)、應(yīng)用程序協(xié)作方法以及應(yīng)用程序協(xié)作程序
- 協(xié)作多點(diǎn)傳輸方法、裝置和系統(tǒng)
- 一種面向智能終端的內(nèi)容下載應(yīng)用激勵(lì)方法及其系統(tǒng)
- 一種協(xié)作多點(diǎn)傳輸調(diào)度方法及裝置
- 一種協(xié)作實(shí)現(xiàn)方法和裝置
- 一種區(qū)塊鏈及智能合約系統(tǒng)協(xié)作層設(shè)計(jì)





