[發(fā)明專利]一種基于學(xué)習(xí)低秩表達(dá)的子空間聚類方法在審
| 申請?zhí)枺?/td> | 202011369979.1 | 申請日: | 2020-11-30 | 
| 公開(公告)號(hào): | CN112488189A | 公開(公告)日: | 2021-03-12 | 
| 發(fā)明(設(shè)計(jì))人: | 彭沖;陳程立詔;秦國峰;司建偉;魏計(jì)鵬 | 申請(專利權(quán))人: | 青島大學(xué) | 
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06F17/16 | 
| 代理公司: | 成都方圓聿聯(lián)專利代理事務(wù)所(普通合伙) 51241 | 代理人: | 宋紅賓 | 
| 地址: | 266071 *** | 國省代碼: | 山東;37 | 
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 學(xué)習(xí) 表達(dá) 空間 方法 | ||
本發(fā)明公開了一種基于學(xué)習(xí)低秩表達(dá)的子空間聚類方法,包括以下步驟:S1.提出模型:采用自我表達(dá)的方式構(gòu)建相應(yīng)的表達(dá)字典,對自我表達(dá)矩陣和誤差擬合項(xiàng)同時(shí)使用核范數(shù),并加入流形項(xiàng),幫助模型提取數(shù)據(jù)間的非線性關(guān)系;S2.模型優(yōu)化:采用ALM的方法交替迭代優(yōu)化;S3.模型應(yīng)用,根據(jù)輸入的數(shù)據(jù)集獲得相應(yīng)的自我表達(dá)矩陣Z;S4.根據(jù)自我表達(dá)矩陣做譜聚類:將自我表達(dá)矩陣作為譜聚類輸入的相似矩陣,通過譜聚類算法得到最終的聚類的簇的劃分。本發(fā)明能夠有效獲取二維數(shù)據(jù)集中的結(jié)構(gòu)信息,流形的加入使得模型更具普適性,減少子空間聚類中對于數(shù)據(jù)集的嚴(yán)苛要求,提高了聚類的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘領(lǐng)域,特別是涉及一種基于學(xué)習(xí)低秩表達(dá)的子空間聚類方法。
背景技術(shù)
現(xiàn)有的子空間聚類方法,例如low-rank representation(LRR)和sparsesubspaceclustering(SSC),通過一些必要的特征工程處理,在絕大多數(shù)情況下,都可以獲得一個(gè)不錯(cuò)的聚類效果。
但是由于所采用的擬合函數(shù)大多都為Frobenius范數(shù),這就使得在做子空間聚類的時(shí)候,通常要把二維數(shù)據(jù)向量化;這樣一來反而損失了數(shù)據(jù)間的結(jié)構(gòu)化信息。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于學(xué)習(xí)低秩表達(dá)的子空間聚類方法,通過改變核范數(shù)將獲得矩陣的低秩表達(dá),并結(jié)合流形項(xiàng)的加入,獲得相應(yīng)的非線性關(guān)系;通過ALM優(yōu)化方法解決了模型優(yōu)化困難的技術(shù)難題。
本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的:
S1.提出模型;
S101.采用自我表達(dá)的方式構(gòu)建相應(yīng)的表達(dá)字典:
表達(dá)字典的具體形式為矩陣Z,其中,Xi指的是數(shù)據(jù)集X中的第i個(gè)樣本;Xj指的是數(shù)據(jù)集X中的第j個(gè)樣本;Zji指的是以Xj作為基底來表示樣本Xi的表達(dá)系數(shù);數(shù)據(jù)集X由待處理的二維圖像組成,是數(shù)據(jù)樣本的集合。
S102.對自我表達(dá)矩陣和誤差擬合項(xiàng)同時(shí)使用核范數(shù):
根據(jù)S101中矩陣的自我表達(dá)形式,確定誤差擬合項(xiàng)為最小化每個(gè)樣本的擬合誤差中結(jié)構(gòu)信息,從而最大化地保留數(shù)據(jù)結(jié)構(gòu)信息。
考慮到低秩的Z具有清晰的類結(jié)構(gòu),同時(shí)對自我表達(dá)矩陣和誤差擬合項(xiàng)采用核范數(shù),保證矩陣Z的低秩結(jié)構(gòu),得到:
S103.在提出的最終模型上加入流形項(xiàng),幫助模型提取數(shù)據(jù)間的非線性關(guān)系:
通過加入流形項(xiàng)Tr(ZLZT)從數(shù)據(jù)中學(xué)習(xí)到的拉普拉斯矩陣,獲取數(shù)據(jù)間的相關(guān)性,從而學(xué)習(xí)到數(shù)據(jù)間的非線性關(guān)系。
根據(jù)數(shù)據(jù)集X完成拉普拉斯矩陣L的構(gòu)造,對數(shù)據(jù)集X采用KNN算法,默認(rèn)k=5,來構(gòu)造鄰接矩陣,鄰接矩陣的權(quán)重我們采用heat kernel的形式,根據(jù)度矩陣和鄰接矩陣來構(gòu)造拉普拉斯矩陣;在使用heat kernel的方式求解數(shù)據(jù)間的權(quán)重即數(shù)據(jù)間的相似性時(shí),實(shí)際上已經(jīng)引入了數(shù)據(jù)間的非相似性關(guān)系,而最小化流形項(xiàng)可以幫助我們保證如果Xi和Xj在非線性數(shù)據(jù)空間中的相似性高,那么在新的表達(dá)式Zi和Zj中,即低維的線性的空間中的相似性同樣高,數(shù)據(jù)的相似性在高維的非線性空間中和低維的線性空間中的表達(dá)是連續(xù)的;即低維的線性空間中的Zi和Zj相似性可以反映出高維非線性空間中Xi和Xj的相似性,因此,模型具有非線性關(guān)系。
綜上所述,我們可以得到我們的最終模型:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青島大學(xué),未經(jīng)青島大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011369979.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
 
- 專利分類
 
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
 - 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
 - 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
 - 輔助學(xué)習(xí)的方法及裝置
 - 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
 - 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
 - 一種線上視頻學(xué)習(xí)系統(tǒng)
 - 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
 - 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
 - 游戲?qū)W習(xí)效果評(píng)測方法及系統(tǒng)
 
- RNAi轉(zhuǎn)染子的改良選擇方法
 - 雙控雙調(diào)節(jié)原核表達(dá)載體系統(tǒng)及其構(gòu)建方法和用途
 - 表達(dá)載體組織、新的生產(chǎn)用細(xì)胞產(chǎn)生方法及其在重組產(chǎn)生多肽中的用途
 - 大腸桿菌表達(dá)系統(tǒng)表達(dá)人淀粉樣Aeta蛋白及純化的方法
 - 一種智能表達(dá)式解析平臺(tái)及方法
 - 一種復(fù)合表達(dá)式解析方法及系統(tǒng)
 - 一種制備N-乙酰氨基半乳糖轉(zhuǎn)移酶的方法
 - 定制生成表達(dá)式方法及裝置
 - 文本的表達(dá)方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
 - 基因表達(dá)調(diào)節(jié)DNA,表達(dá)盒,表達(dá)載體
 





