[發(fā)明專利]基于多標(biāo)簽柔性支持向量機(jī)的分類方法有效
| 申請(qǐng)?zhí)枺?/td> | 201210396793.4 | 申請(qǐng)日: | 2012-10-18 |
| 公開(公告)號(hào): | CN102945371A | 公開(公告)日: | 2013-02-27 |
| 發(fā)明(設(shè)計(jì))人: | 祁仲昂;楊名;張仲非;張正友 | 申請(qǐng)(專利權(quán))人: | 浙江大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06F17/30 |
| 代理公司: | 杭州宇信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 33231 | 代理人: | 張宇娟;施海寅 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 標(biāo)簽 柔性 支持 向量 分類 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于標(biāo)簽技術(shù)領(lǐng)域,特別地涉及一種基于多標(biāo)簽柔性支持向量機(jī)的分類方法。
背景技術(shù)
隨著信息時(shí)代的到來,多媒體數(shù)據(jù)已經(jīng)實(shí)現(xiàn)了爆炸性的增長。標(biāo)簽,作為多媒體的內(nèi)容形式之一,能幫助解決數(shù)據(jù)挖掘方面很多重要的現(xiàn)實(shí)應(yīng)用,特別是在跨媒體領(lǐng)域,體現(xiàn)出非常重要的作用。例如,利用合適的標(biāo)簽作為圖像注釋的一部分,可以開發(fā)出強(qiáng)大的圖像標(biāo)注和圖像檢索技術(shù);利用合適的標(biāo)簽作為電影評(píng)論的一部分,可以開發(fā)出有效的電影推薦系統(tǒng);利用合適的標(biāo)簽作為網(wǎng)頁標(biāo)記的一部分,可以開發(fā)出更有效率的搜索引擎。
標(biāo)簽的種類是多種多樣的,由于數(shù)據(jù)量日新月異爆炸性的增長,僅僅依靠數(shù)據(jù)處理人員對(duì)所有的數(shù)據(jù)手工加標(biāo)簽是不現(xiàn)實(shí)的。在這種前提下,社會(huì)標(biāo)簽就應(yīng)運(yùn)而生了。社會(huì)標(biāo)簽,又稱合作標(biāo)簽,社會(huì)分類法,是一種讓普通大眾用戶能將在線的數(shù)字資源和自己提供的標(biāo)簽做關(guān)聯(lián)的方法,是由用戶產(chǎn)生的、對(duì)網(wǎng)絡(luò)內(nèi)容進(jìn)行組織和共享的自下而上的組織分類體系。在這里,普通民眾都可以通過在線環(huán)境在相應(yīng)的系統(tǒng)中為自己感興趣的數(shù)字資源添加自己覺得合適的標(biāo)簽。正是基于這種特點(diǎn),社會(huì)標(biāo)簽的結(jié)果往往是不準(zhǔn)確的,包含有很多噪聲,因?yàn)槊恳晃粎⑴c社會(huì)標(biāo)簽的普通用戶都不能排除自己的主觀性,粗心大意,甚至是缺乏耐心去提供一個(gè)完美的標(biāo)簽。
為了更好的利用社會(huì)標(biāo)簽為進(jìn)一步的數(shù)據(jù)處理分析服務(wù),必須盡可能的提高標(biāo)簽分類的準(zhǔn)確度,降低噪聲對(duì)標(biāo)簽分類的影響。同時(shí),由于標(biāo)簽的種類是多種多樣的,因此,多標(biāo)簽抗噪分類器應(yīng)運(yùn)而生,并且有著非常廣闊的應(yīng)用前景和非常重要的實(shí)用價(jià)值。傳統(tǒng)的鑒別型分類器應(yīng)用到多標(biāo)簽分類問題中時(shí),一般將多標(biāo)簽問題轉(zhuǎn)化為一對(duì)多(One?Vs?All)的分類模式,即把多標(biāo)簽分類問題轉(zhuǎn)化為多個(gè)二分類問題。傳統(tǒng)的鑒別型分類器在這個(gè)轉(zhuǎn)化過程中并沒有用到多標(biāo)簽空間中所包含的信息。而實(shí)際上,數(shù)據(jù)被標(biāo)上的標(biāo)簽越多,標(biāo)簽空間中包含的信息也就越多,這些信息可以被利用起來。當(dāng)判斷數(shù)據(jù)點(diǎn)是否應(yīng)該標(biāo)上某個(gè)標(biāo)簽時(shí),該數(shù)據(jù)點(diǎn)已有的其他標(biāo)簽會(huì)對(duì)判斷起到一定的幫助作用。例如,當(dāng)一幅包含動(dòng)物的圖像已有的標(biāo)簽為天空,云,草地,樹木的時(shí)候,它更可能被標(biāo)上的標(biāo)簽是鳥而不是魚;而當(dāng)一幅包含動(dòng)物的圖像已有的標(biāo)簽為水,水草,大海,珊瑚的時(shí)候,它更有可能被標(biāo)上的標(biāo)簽是魚而不是鳥。多標(biāo)簽空間中包含的信息在某種程度上可以幫助我們更好的進(jìn)行分類,降低噪聲對(duì)分類的影響。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明的目的在于提供一種基于多標(biāo)簽柔性支持向量機(jī)的分類方法,用于利用多標(biāo)簽空間中包含的信息來提高鑒別型分類器在多標(biāo)簽分類中的分類精度,降低噪聲標(biāo)簽對(duì)分類的影響。
為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:
一種基于多標(biāo)簽柔性支持向量機(jī)的分類方法,包括以下步驟:
首先,在多標(biāo)簽空間中定義一種新型的距離度量方法,用來衡量在特定的分類目標(biāo)下多標(biāo)簽空間中點(diǎn)與點(diǎn)之間的距離,所述新型的距離度量方法為:將多標(biāo)簽訓(xùn)練集表示為訓(xùn)練集中的每個(gè)點(diǎn)都被標(biāo)上了多種多樣的標(biāo)簽,整個(gè)訓(xùn)練集的標(biāo)簽字典組成了S維的多標(biāo)簽空間多標(biāo)簽訓(xùn)練集中的每個(gè)點(diǎn)在視角中的特征向量表示為xi,在標(biāo)簽字典中的標(biāo)簽向量表示為di=(di,1,di,2,...,di,S)′,其中di,r∈{0,1},1≤r≤S表示字典中的第r個(gè)標(biāo)簽Tr是否在Ii中出現(xiàn),同時(shí)用yi,r表示Ii的分類標(biāo)簽,yi,r=2·di,r-1。在多標(biāo)簽一對(duì)多(One?Vs?All)的分類模式中,當(dāng)一個(gè)標(biāo)簽Tr被作為分類目標(biāo)時(shí),標(biāo)簽字典中其余的標(biāo)簽就會(huì)組成一個(gè)S-1維的標(biāo)簽特征空間用ti,r表示Ii在空間中的特征向量,ti,r=(di,1,...,di,r-1,di,r+1,...,di,S)′,
定義當(dāng)給定di,k=0or?1時(shí),di,r=0or1的條件概率如下所示:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210396793.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹形結(jié)構(gòu)的標(biāo)簽存儲(chǔ)方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)





