[發(fā)明專利]一種自加權(quán)融合局部和全局信息的多視圖子空間聚類方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110803225.0 | 申請(qǐng)日: | 2021-07-15 |
| 公開(公告)號(hào): | CN113554082A | 公開(公告)日: | 2021-10-26 |
| 發(fā)明(設(shè)計(jì))人: | 段意強(qiáng);袁浩亮;符政鑫;許斯濱;呂應(yīng)龍 | 申請(qǐng)(專利權(quán))人: | 廣東工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510090 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 加權(quán) 融合 局部 全局 信息 視圖 空間 方法 | ||
本發(fā)明提供一種自加權(quán)融合局部和全局信息的多視圖子空間聚類方法,該方法首先對(duì)獲取的多視圖數(shù)據(jù)進(jìn)行預(yù)處理。其次通過圖學(xué)習(xí)挖掘原始多視圖數(shù)據(jù)的局部信息時(shí)加入自表示學(xué)習(xí)來挖掘原始多視圖數(shù)據(jù)的全局信息從而獲得高質(zhì)量和高魯棒性的相似度矩陣。然后采取自加權(quán)的方式將所有視圖的相似度矩陣進(jìn)行融合形成一致的相似度矩陣。通過對(duì)一致的相似度矩陣引入秩約束,使得一致的相似度矩陣中連通分量的個(gè)數(shù)等于聚類簇的個(gè)數(shù),從而直接獲得多視圖聚類結(jié)果。這避免了在獲取一致的相似度矩陣之后,還需要執(zhí)行額外的聚類步驟去獲取聚類結(jié)果。本發(fā)明所提供的方法在生成一致的相似度矩陣的同時(shí)也揭示了數(shù)據(jù)的聚類結(jié)構(gòu),無需再執(zhí)行額外的聚類步驟去獲取聚類結(jié)果。綜述所述,因此本發(fā)明所提供的方法對(duì)多視圖數(shù)據(jù)具有良好的聚類效果。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)視覺、模式識(shí)別和數(shù)據(jù)挖掘等技術(shù)領(lǐng)域,更具體地,涉及一種自加權(quán)融合局部和全局信息的多視圖子空間聚類方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,人們獲取數(shù)據(jù)的手段越來越多樣化,使得大量無標(biāo)簽的數(shù)據(jù)不斷產(chǎn)生。在當(dāng)今大數(shù)據(jù)時(shí)代環(huán)境的影響下,如何對(duì)這些無標(biāo)簽的數(shù)據(jù)進(jìn)行分析和處理從而揭示其內(nèi)在規(guī)律成為各行各業(yè)廣泛關(guān)注的問題。聚類做為一種無監(jiān)督學(xué)習(xí)技術(shù),在機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺和數(shù)據(jù)挖掘等領(lǐng)域被廣泛使用。聚類試圖對(duì)無標(biāo)簽的數(shù)據(jù)依據(jù)其數(shù)據(jù)自身的內(nèi)在特性,將數(shù)據(jù)劃分成若干個(gè)簇,即使得“簇內(nèi)相似度”高且“簇間相似度”低。為下一步的數(shù)據(jù)分析提供基礎(chǔ)。
傳統(tǒng)的聚類方法通過挖掘單視圖數(shù)據(jù)的內(nèi)在結(jié)構(gòu)來對(duì)數(shù)據(jù)進(jìn)行劃分。例如:K均值聚類、密度聚類、層次聚類、譜聚類、子空間聚類等方法。單視圖數(shù)據(jù)由單一特征構(gòu)成的數(shù)據(jù)。當(dāng)單視圖數(shù)據(jù)不足以全面描述對(duì)象時(shí)和/或嚴(yán)重?fù)p壞的情況下,會(huì)導(dǎo)致傳統(tǒng)聚類方法的性能不佳。真實(shí)世界的數(shù)據(jù)通常具有多種表現(xiàn)形式,即每個(gè)對(duì)象被不同類型的特征進(jìn)行表示,這些不同類型的特征被稱為多視圖數(shù)據(jù)。例如,一個(gè)物體通過主視圖、側(cè)視圖和俯視圖來共同描述物體的外部特征。同一段文字被翻譯成不同國(guó)家的語言,如:中文,英文,日文等等。一張圖片提取方向梯度直方圖(histograms of oriented gradients,HOG)、局部二值模式(local binary patterns,LBP)以及尺度不變特征變換(scale invariant featuretransform,SIFT)等。多視圖數(shù)據(jù)不僅擁有每個(gè)視圖下特有的信息,還擁有視圖之間的互補(bǔ)信息。使用多視圖數(shù)據(jù)進(jìn)行聚類發(fā)揮每個(gè)視圖的優(yōu)勢(shì),同時(shí)也規(guī)避自身視圖的風(fēng)險(xiǎn),從而獲取更好的聚類性能。
現(xiàn)有的多視圖聚類方法大致分為以下幾類:基于K均值多視圖聚類,基于矩陣分解多視圖聚類,多視圖圖聚類和多視圖子空間聚類。多視圖圖聚類和多視圖子空間由于其良好的聚類性能和數(shù)學(xué)可解釋性而受到廣泛的關(guān)注。多視圖圖聚類通過采用不同的度量(二元相似度,余弦相似度,高斯核相似度)手段去度量不同樣本之間的相似度,然后采用完整圖或k近鄰圖其中一種去構(gòu)造每個(gè)視圖的圖矩陣,然后將所有視圖的圖矩陣進(jìn)行融合形成統(tǒng)一的圖矩陣,最后對(duì)統(tǒng)一的圖矩陣進(jìn)行譜聚類或圖割算法獲得聚類結(jié)果。多視圖子空間聚類通常使用自表示學(xué)習(xí)去得到每個(gè)視圖的子空間表示,然后將所有視圖的子空間表示進(jìn)行融合形成統(tǒng)一的子空間表示,最后對(duì)統(tǒng)一的子空間表示進(jìn)行譜聚類獲得聚類結(jié)果。多視圖圖聚類在原始數(shù)據(jù)的局部層面上構(gòu)建圖矩陣,多視圖子空間在原始數(shù)據(jù)的全局層面上構(gòu)建相似度矩陣。將多視圖圖聚類和多視圖子空間聚類進(jìn)行結(jié)合來考慮原始數(shù)據(jù)的局部信息和全局信息,并引入秩約束直接對(duì)一致的子空間進(jìn)行限制。在獲取一致的子空間表示的同時(shí),能夠直接獲得多視圖數(shù)據(jù)的聚類結(jié)構(gòu),而無需再執(zhí)行額外的聚類算法。
發(fā)明內(nèi)容
本發(fā)明提供一種自加權(quán)融合局部和全局信息的多視圖子空間聚類方法,該方法在生成一致的相似度矩陣的同時(shí)也揭示了數(shù)據(jù)的聚類結(jié)構(gòu),從而獲取良好的聚類效果。
為了達(dá)到上述技術(shù)效果,本發(fā)明的技術(shù)方案如下:
一種自加權(quán)融合局部和全局信息的多視圖子空間聚類方法,包括以下步驟:
S1:采集多視圖數(shù)據(jù)并進(jìn)行預(yù)處理;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學(xué),未經(jīng)廣東工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110803225.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于靈活柵格光網(wǎng)絡(luò)全局優(yōu)化的系統(tǒng)架構(gòu)及其全局優(yōu)化方法
- 一種基于多數(shù)據(jù)庫類型的SQL執(zhí)行方法和裝置
- 用于移動(dòng)AdHoc網(wǎng)絡(luò)的路由入侵檢測(cè)系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 全局資源分配方法和裝置
- 一種通信方法及裝置
- 一種高效分布式全局鎖協(xié)調(diào)方法
- 一種帶上下文信息編碼的語義分割卷積神經(jīng)網(wǎng)絡(luò)
- 一種批量腳本的全局參數(shù)替換方法及裝置
- 一種基于全局變量的家居參數(shù)化模型建模系統(tǒng)及方法





