[發明專利]一種分數階圖嵌入多重集典型相關分析方法在審
| 申請號: | 202210559435.4 | 申請日: | 2022-05-18 |
| 公開(公告)號: | CN114841284A | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | 袁運浩;陳治安;李云;強繼朋;朱毅;張濤 | 申請(專利權)人: | 揚州大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V10/77;G06V10/774;G06V10/764;G06V40/16 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 225009 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分數 嵌入 多重 典型 相關 分析 方法 | ||
本發明公開了一種分數階圖嵌入多重集典型相關分析方法,該方法針對現實應用中常見的噪聲干擾,數據量遠小于數據維度等干擾特征提取的因素。在本發明方法中,通過在樣本數據的奇異值上直接添加分數階參數來緩解噪聲干擾、小樣本問題帶來的估計偏差,使得奇異值更加接近真實值,從而提升后續特征提取的精確度,使得投影后得到的低維表示更加能夠反映真實個體的特征,提升識別率。本方法僅在降維前調整樣本數據的奇異值,在并未提高原有算法的時間復雜度的同時,提升了算法的性能。
技術領域
本發明屬于模式識別領域,具體涉及一種分數階嵌入的多視圖典型相關分析方法。
背景技術
在實際應用中,同一對象集總是可由不同視圖的高維數據集進行描述。由于數據采 集能力的不斷提高,使得這種多維特征在許多領域中更為常見和更容易獲得。然而,數據集的高維性無疑增加了處理的難度和消耗的時空成本。因此,從具有不同特征的數據 集中找尋其共同的低維表示,即多視圖學習,是一個有意義和挑戰性的課題。
近年來,研究人員提出了多種有效的方法,其中典型相關分析(CCA)是最流行的方法之一。與主成分分析(PCA)不同,CCA的目的是尋求同一組特征內部的線性投影, 使每個視圖都與其余視圖的相似性最高,而主成分分析主要用于分析單個視圖,這就不 可避免地忽略了數據集的內部聯系。由于CCA良好的特性,其在圖像識別、分類、回 歸、缺陷預測、自然語言處理、遺傳學等領域都有大量的應用。
結合不同的需求,研究者引入了許多基于CCA的擴展方法。提出并擴展了核CCA(KCCA)和局部保持CCA(LPCCA)來尋找兩個數據集之間潛在的非線性關聯。此 外,與神經網絡相結合,CCA在近年來備受關注的深度學習方面也有所應用。某些高 維數據也獲得了人們的關注。當數據的維數足夠高時,無用信息在數據分析中總是占很 大的比例。如果典型相關變量包含了原始空間中的所有特征,那么得到的典型的載荷矩 陣通常不是稀疏的,這使得CCA的效果大大降低。因此,為了彌補這一缺陷,稀疏CCA 被提出,其使得在學習典型相關表示時忽略了集合的許多不相關的特征。
當遇到至少三種特征視圖時,CCA由于其較低的效率和非最優結果而顯得無能為力。因此,多視圖典型相關分析(MCCA)被用于這種多特征提取。求解MCCA的直 接方法是使每個多集標準變量之間的成對相關的總和最大化,這也被稱為相關和 (SUMCOR)算法。然而,SUMCOR的計算是一個NP-hard問題,這就促使了一些松 弛理論的建立:Rupnik等人將半定規劃(SDP)邊界應用于全局最優性,Kanatsoulis等 人提出了一個算法框架,在計算多個大視圖的規范組件時,可以處理各種結構提升項。 Kettenning等人還總結了MCCA的其他主要解決方案,包括平方相關和(SSCOR)、廣 義方差(GENVAR)、最大方差(MAXVAR)和最小方差程序(MINVAR)。本文基于 MAXVAR-CCA,它可以通過特征分解來求解,得到一個簡單的解決方案。
近年來,為了充分利用數據集的已知信息,許多研究集中在圖嵌入上。由于圖是特征提取的一種重要表現形式,它出現在各種各樣的現實場景中,因此有效的圖分析提供 了更深入的數據集背后的信息,從而對特征提取有很大的幫助。Yuan等人和Chen等人 分別提出了作用于每個視圖的多圖拉普拉斯算子(GrMCCs)和單一圖作用于公共源 (GMCCA)的策略。兩種方法在分類精度上都表現出了良好的性能。
然而,當利用MCCA及其擴展方法(如GMCCA)時,用于特征提取的訓練樣本 可能存在噪聲干擾和其他不良信息,從而導致得到的低維特征偏離真實特征。在圖像識 別任務中,如果不能準確估計出區別于其他實體的最有代表性的特征,則會導致識別率 顯著降低。除此之外,還存在訓練樣本數量小于樣本得特征維數的情況,稱為小樣本問 題。在這種情況下,有限的樣本也是導致偏差的因素之一,因為當樣本規模不夠大時, 無法深入了解數據的結構,最終導致低維數據的不準確。
發明內容
發明目的:針對現實應用中常見的噪聲干擾,數據量遠小于數據維度等干擾特征提 取的因素,提出一種分數階圖嵌入多重集典型相關分析方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于揚州大學,未經揚州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210559435.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有集熱/散熱結構的電子設備
- 下一篇:一種多功能辦公室檔案存儲裝置





