[發(fā)明專利]利用腦成像空間特征和底層視覺特征進(jìn)行視頻聚類的方法有效
| 申請?zhí)枺?/td> | 201210293171.9 | 申請日: | 2012-08-17 |
| 公開(公告)號: | CN102855352A | 公開(公告)日: | 2013-01-02 |
| 發(fā)明(設(shè)計(jì))人: | 韓軍偉;吉祥;郭雷;胡新韜 | 申請(專利權(quán))人: | 西北工業(yè)大學(xué) |
| 主分類號: | G06F17/50 | 分類號: | G06F17/50 |
| 代理公司: | 西北工業(yè)大學(xué)專利中心 61204 | 代理人: | 王鮮凱 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 利用 成像 空間 特征 底層 視覺 進(jìn)行 視頻 方法 | ||
1.一種利用腦成像空間特征和底層視覺特征進(jìn)行視頻聚類的方法,其特征在于步驟如下:
步驟1提取腦功能成像空間特征,具體步驟如下:
步驟a1:利用公式
其中:信號向量Si,j=[si,j,1,Si,j,2,...,si,j,r,...Si,j,n],信號向量Si,k=[si,k,1,si,k,2,...,si,k,r,...Si,k,n],i表示N個(gè)功能磁共振圖像序列中的第i個(gè)功能磁共振圖像序列的序號,i=1,2,...,N,j,k=1,2,...,M,j表示第i個(gè)功能磁共振圖像序列中大腦的第j個(gè)區(qū)域的序號,k表示第i個(gè)功能磁共振圖像序列中大腦的第k個(gè)區(qū)域的序號,r表示信號向量Si,j和Si,k中第r個(gè)元素的序號,N∈[1,1000],M∈[1,1000],N表示功能磁共振圖像序列的總數(shù),M表示功能磁共振圖像序列中大腦區(qū)域的總數(shù);Si,j,r表示信號向量Si,j的第r個(gè)元素;si,k,r表示信號向量Si,k的第r個(gè)元素;n表示信號向量Si,j和Si,k的長度;
所述N個(gè)功能磁共振圖像序列,是利用功能磁共振技術(shù),在測試者觀看N個(gè)視頻時(shí)測得的功能磁共振圖像;
步驟b1:取皮爾森相關(guān)系數(shù)矩陣Pi上三角部分,拉伸成向量Qi=[qi,1,qi,2,...,qi,d],d=(M×M)/2-M/2,然后將N個(gè)Qi向量按行排列構(gòu)成矩陣D:
其中,qi,1,qi,2,...,qi,d表示Qi的第1,2,…,d個(gè)元素;
步驟c1:計(jì)算矩陣D每一列元素的均值,將矩陣D的每一列元素減去該列元素的均值,得到矩陣U:
在矩陣U的第v列Uv=[u1,v,u2,v,...,uN,v]T中找出屬于第K類視頻的元素,并計(jì)算屬于第K類視頻的元素均值得到類內(nèi)均值向量
其中,U1,U2,...,Ui,...,UN表示N個(gè)視頻對應(yīng)的功能磁共振圖像序列中提取的N個(gè)向量,N個(gè)視頻可分為C類;u1,v,u2,v,...,uN,v表示Uv=[u1,v,u2,v,...,uN,v]T中的第1,2,...,N個(gè)元素,這N個(gè)元素按照對應(yīng)的C類視頻分為C類;K=1,2,...,C,K表示C類視頻中的第K類;C表示N個(gè)視頻的總類別個(gè)數(shù);
再利用公式計(jì)算累計(jì)分布函數(shù)參數(shù)F;
利用公式
當(dāng)g<T時(shí),T∈(0,10000],保留矩陣U中的第v列;否則,從矩陣U中刪除該列,得到經(jīng)過單因素方差分析選擇后的矩陣B:
其中,C表示視頻的類別總數(shù);||表示取絕對值;L=[l1,l2,...,lK,...,lC]T;lK表示Uv中屬于第K類視頻的元素個(gè)數(shù);θ為向量和L間的夾角;表示Uv的均值;上標(biāo)T表示轉(zhuǎn)置;exp表示指數(shù)函數(shù);g<T中的T表示閾值,T∈(0,10000];下標(biāo)x表示從U中選取的列向量的個(gè)數(shù);
步驟d1:遍歷矩陣B的每一列,利用相關(guān)特征選擇方法將參數(shù)的數(shù)值最高的y列構(gòu)成腦功能成像空間特征矩陣C:
其中:下標(biāo)y表示從B中選取的列向量的個(gè)數(shù);表示向量[r1,w,r2,w,…,rs,w,…,ry,w]的均值;rs,w表示矩陣C的第s個(gè)列向量Cs與類別標(biāo)簽向量W=[1,1,1,...2,2,2,...,K,K,K,...C,C,C]T的相關(guān)性參數(shù);上標(biāo)T表示取向量轉(zhuǎn)置;
中所有元素的均值;rs,o表示矩陣C的第s個(gè)列向量Cs與第o個(gè)列向量Co的相關(guān)性參數(shù);
步驟2提取視頻庫中所有Na個(gè)視頻數(shù)據(jù)的底層視覺特征向量Fvid,具體步驟如下:
步驟a2:利用尺度不變特征變換算法提取第id個(gè)視頻第一幀的Nsi個(gè)描述向量集合FSid={Fsiid,1,Fsiid,2,...,Fsiid,sh,...,Fsiid,Nsi},sh=1,2,...,Nsi,id=1,2,...,Na,Na∈(0,100000],Nsi∈[0,10000],對Na個(gè)視頻都提取描述向量集合,得到
步驟b2:利用k均值算法對進(jìn)行聚類,聚類個(gè)數(shù)為G;
步驟c2:計(jì)算FSid={Fsiid,1,Fsiid,2,...,Fsiid,sh,...,Fsiid,Nsi}中分別屬于G類的向量個(gè)數(shù)[Numid,1,Numid,2,...,Numid,G],得到第id個(gè)視頻的底層視覺特征向量:Fvid=[Numid,1,Numid,2,...,Numid,G];
步驟3利用高斯過程回歸算法預(yù)測Na-N個(gè)視頻數(shù)據(jù)的腦功能成像空間特征向量:
利用腦功能成像空間特征矩陣C和其對應(yīng)N個(gè)視頻的底層視覺特征[Fv1,Fv2,...,Fvidp,...,FvN],idp=1,2,...,N,建立高斯過程回歸模型GPM,利用高斯過程回歸模型GPM預(yù)測得到Na-N個(gè)視頻的腦功能成像空間特征向量:
步驟4利用Na個(gè)腦功能成像空間特征向量[C1,C2,...,Cid,...,CNa]和底層視覺特征[Fv1,Fv2,...,Fvid,...,FvNa]進(jìn)行多模態(tài)譜聚類,具體步驟如下:
步驟a3:計(jì)算[C1,C2,...,Cid,...,CNa]中與空間中的一個(gè)點(diǎn)Cid=(cid,1,cid,2,...,cid,y)歐氏距離最近的k個(gè)點(diǎn),并定義為近鄰關(guān)系,k=[1,10000];再計(jì)算[Fv1,Fv2,...,Fvid,...,FvNa]中與空間中的一個(gè)點(diǎn)Fvid=(fvid,1,fvid,2,...,fvid,y)歐氏距離最近的k個(gè)點(diǎn),并定義為近鄰關(guān)系;其中:cid,1,cid,2,...ci,d表示腦功能成像空間特征Cid中第1、2和y個(gè)元素;fvid,1,fvid,2,...,fvid,y表示底層視覺特征Fvid中第1、2和y個(gè)元素;
步驟b3:利用計(jì)算屬于近鄰關(guān)系的Cid和Cjd?兩點(diǎn)間的權(quán)重CWeightid,jd,得到權(quán)重矩陣;
同理,利用計(jì)算屬于近鄰關(guān)系Fvi和Fvj之間的權(quán)重FvWeightid,jd,得到權(quán)重矩陣:
其中:Cid和Cjd表示第id個(gè)視頻和第jd個(gè)視頻的腦功能成像空間特征向量;∏表示連乘積;cid,l和cjd,l表示Cid和Cjd的第l個(gè)元素;l=1,2,...,y;σl表示一個(gè)常數(shù),σl∈(0,1];Fvid和Fvjd表示第id個(gè)視頻和第jd個(gè)視頻的底層視覺特征向量;Fvid,l和Fvjd,l表示Fvid和Fvjd的第l個(gè)元素;
步驟c3:在矩陣CWeight中令CWeightid,id=0;在矩陣FvWeight中令FvWeightid,id=0;再利用公式
其中:LC和LFv表示矩陣CWeight和FvWeight的拉普拉斯矩陣;DC表示[C1,C2,...,Cid,...,CNa]中兩兩腦功能成像空間特征向量之間的歐式距離所構(gòu)成的矩陣;DFv表示[Fv1,Fv2,...,Fvid,...,F(xiàn)vNa]中兩兩底視覺層特征向量之間的歐式距離所構(gòu)成的矩陣;I表示單位矩陣,大小為Na×Na;α表示常數(shù);
步驟d3:計(jì)算多模態(tài)拉普拉斯矩陣Lmulti-modal的特征值和特征向量,將特征值從大到小排列,選取前C個(gè)特征值對應(yīng)的特征向量Vector1,Vector2,...,VectorC,構(gòu)成矩陣VecMatrix=[Vector1,Vector2,...,VectorC],大小為Na×C,計(jì)算矩陣VecMatrix每一行的和,然后用該行元素分別除以該行元素的和,得到矩陣VecMatrixNew,大小為Na×C;其中:C表示視頻庫中視頻類別個(gè)數(shù);
步驟e3:將VecMatrixNew每行中值最大的元素置為1,其余元素置為0,得到VecMatrixNew1;
步驟f3:將VecMatrixNew1的每一行視為高維空間中的一個(gè)點(diǎn),用光譜旋轉(zhuǎn)算法對VecMatrixNew1矩陣中的Na個(gè)點(diǎn)進(jìn)行聚類,得到類別矩陣Index,大小為Na×C;
步驟g3:利用公式Index0=Index+0.2得到初始類別矩陣Index0,計(jì)算Indexnew=Index0×diag[[diag(Index0T×I×Index0)]-1]-1/2,將Indexnew賦給Index0,再次計(jì)算Indexnew=Index0×diag[[diag(Index0T×I×Index0)]-1]-1/2,將Indexnew賦給Index0,重復(fù)Ne次,Ne∈[1,10000],得到最終的Indexnew,大小為Na×C,計(jì)算Indexnew每行最大值所在的第cg列,將最終標(biāo)簽Indexfinal對應(yīng)行置為cg,cg∈[1,2,..,C],Indexfinal大小為Na×1;其中,diag表示提取矩陣的對角線元素;I表示單位向量;
步驟h3:計(jì)算Indexfinal與視頻真實(shí)類別標(biāo)簽IndexTrue的相同元素個(gè)數(shù),除以Na得到視頻聚類準(zhǔn)確率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué),未經(jīng)西北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210293171.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





