[發(fā)明專利]基于同時(shí)融合多視角特征及多標(biāo)簽信息的支持向量機(jī)分類方法有效
| 申請(qǐng)?zhí)枺?/td> | 201210452040.0 | 申請(qǐng)日: | 2012-11-12 | 
| 公開(kāi)(公告)號(hào): | CN102982344A | 公開(kāi)(公告)日: | 2013-03-20 | 
| 發(fā)明(設(shè)計(jì))人: | 方正;張仲非 | 申請(qǐng)(專利權(quán))人: | 浙江大學(xué) | 
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06F17/30 | 
| 代理公司: | 杭州宇信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 33231 | 代理人: | 張宇娟;施海寅 | 
| 地址: | 310027 浙*** | 國(guó)省代碼: | 浙江;33 | 
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 | 
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 同時(shí) 融合 視角 特征 標(biāo)簽 信息 支持 向量 分類 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于標(biāo)簽技術(shù)領(lǐng)域,特別地涉及一種基于同時(shí)融合多視角特征及多標(biāo)簽信息的支持向量機(jī)分類方法。
背景技術(shù)
隨著信息時(shí)代的到來(lái),各種數(shù)據(jù)以幾何級(jí)數(shù)爆發(fā)增長(zhǎng)。尤其是在互聯(lián)網(wǎng)領(lǐng)域,海量跨媒體數(shù)據(jù)已是人們關(guān)注和研究的熱點(diǎn)。例如,圖像數(shù)據(jù)結(jié)合文本標(biāo)簽數(shù)據(jù)的內(nèi)容理解和提取在互聯(lián)網(wǎng)信息搜索和數(shù)據(jù)挖掘應(yīng)用方面起到了至關(guān)重要的作用。而其中一個(gè)關(guān)鍵就是如何準(zhǔn)確地對(duì)具有多種特征的圖像進(jìn)行內(nèi)容分類。這些特征可以通過(guò)各種特征提取技術(shù)得到,比如圖像sift特征提取技術(shù)、HUE圖像顏色特征提取技術(shù)、Gabor圖像紋理提取技術(shù)。而在文本分析和內(nèi)容分類問(wèn)題中,一篇體育新聞的文章中往往附有比賽圖片、視頻、聲音等信息,同時(shí)這篇文章也可能被翻譯成了其他語(yǔ)言的文字。如何有效地提取和利用這些來(lái)自多種信息視角的特征,并且提高數(shù)據(jù)的分類準(zhǔn)確率,成了當(dāng)今計(jì)算機(jī)數(shù)據(jù)挖掘領(lǐng)域亟待解決的課題。
另一方面,在實(shí)際的數(shù)據(jù)挖掘分類問(wèn)題中,很多情況下數(shù)據(jù)對(duì)象在擁有通過(guò)不同途徑得到的多視角特征信息的同時(shí),往往會(huì)有多個(gè)類屬標(biāo)簽與之關(guān)聯(lián)。這些標(biāo)簽反映了目標(biāo)對(duì)象的對(duì)應(yīng)屬性,是人們對(duì)這些數(shù)據(jù)內(nèi)容的概括或?qū)傩缘姆诸悺@纾诙鄻?biāo)簽圖像數(shù)據(jù)的分類問(wèn)題中,一幅圖擁有類屬標(biāo)簽“山”、“湖水”、“船”。而一篇談?wù)撎O(píng)果公司產(chǎn)品的文章,可以具有“科技”、“經(jīng)濟(jì)”、“數(shù)碼產(chǎn)品”等分類標(biāo)簽。
現(xiàn)有的分類技術(shù),都只關(guān)注了數(shù)據(jù)的多標(biāo)簽分類問(wèn)題或是數(shù)據(jù)的多視角信息特征分類的問(wèn)題,而忽視了如何將多視角信息特征和多標(biāo)簽信息有效融合起來(lái)提高分類問(wèn)題的準(zhǔn)確率。在傳統(tǒng)的多標(biāo)簽分類技術(shù)中,通常是把多標(biāo)簽問(wèn)題轉(zhuǎn)化為一對(duì)多One?Vs?All(OVA)的分類模式,即把多標(biāo)簽分類問(wèn)題分解為多個(gè)二分類問(wèn)題。但在這一多標(biāo)簽問(wèn)題的分解過(guò)程中,沒(méi)有考慮到多標(biāo)簽空間中的數(shù)據(jù)關(guān)聯(lián)信息。例如,一個(gè)已有內(nèi)容標(biāo)簽“山”、“湖泊”、“船”的圖片,它的內(nèi)容中有“人”的概率遠(yuǎn)遠(yuǎn)大于有“建筑樓”的概率。傳統(tǒng)的多標(biāo)簽分類器既沒(méi)有很好地利用這方面的信息,也沒(méi)考慮到利用數(shù)據(jù)多視角特征空間的關(guān)聯(lián)信息和冗余信息。同樣,在現(xiàn)有的多視角信息特征分類技術(shù)中,往往只注意多視角特征在特定標(biāo)簽上的分類一致性,而都忽視了多標(biāo)簽信息對(duì)于多視角特征的鑒別選擇作用。例如,“蘋(píng)果”標(biāo)簽在分類“紅蘋(píng)果”、“綠蘋(píng)果”和“紅旗”圖片的時(shí)候,會(huì)鑒別地選擇形狀特征,而顏色特征在根據(jù)“蘋(píng)果”這個(gè)概念進(jìn)行圖片分類時(shí)會(huì)產(chǎn)生干擾和影響。而且現(xiàn)有的多視角信息特征分類器直接將多種途徑得到的數(shù)據(jù)特征作為分類器的輸入,帶入了很多噪聲干擾和冗余信息,使得分類結(jié)果受到很大影響。
鑒于現(xiàn)有的多標(biāo)簽分類器和多視角特征分類器各自存在的缺點(diǎn)和不足,本發(fā)明提出的鑒別型支持向量機(jī)分類方法能夠同時(shí)融合多視角特征及多標(biāo)簽信息,把分類過(guò)程和特征融合過(guò)程結(jié)合起來(lái)提高分類準(zhǔn)確度,有效解決了實(shí)際數(shù)據(jù)挖掘應(yīng)用中多視角特征、多標(biāo)簽數(shù)據(jù)的智能分類和內(nèi)容識(shí)別問(wèn)題。
發(fā)明內(nèi)容
為解決上述問(wèn)題,本發(fā)明的目的在于提供一種基于同時(shí)融合多視角特征及多標(biāo)簽信息的支持向量機(jī),用于提供一種技術(shù)在支持向量機(jī)分類的同時(shí),學(xué)習(xí)得到新的數(shù)據(jù)空間里的一個(gè)統(tǒng)一的數(shù)據(jù)表達(dá)形式。數(shù)據(jù)的這種新的表達(dá)形式能夠有效地消除多種特征表達(dá)間的冗余,加強(qiáng)相互間的關(guān)聯(lián)輔助信息。由于在學(xué)習(xí)過(guò)程中引入了多標(biāo)簽信息的正則項(xiàng)調(diào)節(jié)因子,新的數(shù)據(jù)表達(dá)鑒別地選擇了多視角特征,從而進(jìn)一步提高了分類器的準(zhǔn)確率。
為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:
一種基于同時(shí)融合多視角特征及多標(biāo)簽信息的支持向量機(jī)分類方法,包括以下步驟S10至S30:
S10,輸入多視角特征訓(xùn)練數(shù)據(jù)以及每個(gè)數(shù)據(jù)所對(duì)應(yīng)的多標(biāo)簽信息,建立同時(shí)融合多視角特征及多標(biāo)簽信息的支持向量機(jī)MVMLSVM分類器的數(shù)學(xué)模型,設(shè)定各個(gè)項(xiàng)的對(duì)應(yīng)權(quán)重因子的值,其具體包括S101至S103,
S101,輸入給定的多視角特征數(shù)據(jù)以及每個(gè)數(shù)據(jù)的多標(biāo)簽信息,i∈{1,2,…,n},v?∈{1,2,…,V},l∈{1,2,…,L},其中L是標(biāo)簽的種數(shù),dv是第v個(gè)視角特征的維度,表示數(shù)據(jù)在第l種標(biāo)簽上的類屬關(guān)系,值為+1表示數(shù)據(jù)屬于第l種標(biāo)簽,-1表示不屬于,采用矩陣形式來(lái)表達(dá)數(shù)據(jù)和數(shù)據(jù)所附有的標(biāo)簽信息,分別用Xv,v∈{1,2,…,V}和來(lái)表示,其中,的每一列屬于L維的標(biāo)簽空間即而的每一行的轉(zhuǎn)置后的列向量表示各個(gè)數(shù)據(jù)在第l種標(biāo)簽上的類屬關(guān)系,用Yl表示,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210452040.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
 
- 專利分類
 
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 多視點(diǎn)視頻的視角切換以及編碼方法和裝置
 - 一種斜視角圖像的模擬方法及裝置
 - 一種斜視角圖像的模擬方法及裝置
 - 一種基于虛擬現(xiàn)實(shí)視頻的多畫(huà)面同時(shí)觀看方法
 - 一種基于視圖的特征匹配三維模型檢索方法
 - 顯示裝置視角補(bǔ)償計(jì)算的方法、視角補(bǔ)償結(jié)構(gòu)及顯示裝置
 - 基于全景照片的動(dòng)畫(huà)生成方法及裝置
 - 顯示驅(qū)動(dòng)電路、顯示驅(qū)動(dòng)方法以及液晶顯示裝置
 - 一種視角切換方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
 - 一種虛擬現(xiàn)實(shí)多視角融合模型的設(shè)計(jì)方法
 





