[發(fā)明專利]一種圖的特征選擇方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010679163.2 | 申請日: | 2020-07-15 |
| 公開(公告)號: | CN111898710B | 公開(公告)日: | 2023-09-29 |
| 發(fā)明(設計)人: | 何芳;賈維敏;張峰干;伍宗偉;沈曉衛(wèi);趙建偉;胡豪杰;金偉;何佑明;朱玉杰 | 申請(專利權)人: | 中國人民解放軍火箭軍工程大學 |
| 主分類號: | G06V10/771 | 分類號: | G06V10/771;G06V10/766;G06V10/778;G06F17/14;G06F17/16 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 崔玥 |
| 地址: | 710025 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 特征 選擇 方法 系統(tǒng) | ||
本發(fā)明涉及一種圖的特征選擇方法及系統(tǒng)。所述方法包括根據(jù)圖的像素點構造自適應近鄰圖;根據(jù)所述圖的像素點確定投影矩陣;對所述初始圖和所述投影矩陣進行半監(jiān)督學習,得到半監(jiān)督特征選擇模型;獲取待特征選擇的圖;采用所述半監(jiān)督特征選擇模型對所述待特征選擇的圖進行特征選擇。本發(fā)明所提供的一種圖的特征選擇方法及系統(tǒng),選取數(shù)據(jù)的重要特征,降低數(shù)據(jù)間的冗余性,解決大規(guī)模數(shù)據(jù)降維問題。
技術領域
本發(fā)明涉及機器學習領域,特別是涉及一種圖的特征選擇方法及系統(tǒng)。
背景技術
隨著時代的進步,社會的發(fā)展,海量高維數(shù)據(jù)的處理是當前大數(shù)據(jù)時代下不可避免的任務。大量不同媒體源都會產(chǎn)生海量高維形式的數(shù)據(jù),如文本數(shù)據(jù)、圖像數(shù)據(jù)、視頻數(shù)據(jù)、交易數(shù)據(jù)和基因數(shù)據(jù)等。降維算法是處理高維數(shù)據(jù)的有效手段。采用合適的降維算法可以減少存儲,降低計算負擔,同時也能減少冗余特征。
根據(jù)實現(xiàn)方式的不同,降維方法又可以分為特征提取和特征選擇。特征提取方法采用合適的映射函數(shù)將高維數(shù)據(jù)映射到低維空間,實現(xiàn)對高維特征的重組,生成新的特征分量形成數(shù)據(jù)的低維表示。特征選擇方法要求不改變原始特征,從中選取出有價值的特征子集。特征選擇方法能夠保留數(shù)據(jù)的物理意義,具有重要的研究價值。
根據(jù)是否利用類標信息,特征選擇方法又可以分為:有監(jiān)督,無監(jiān)督和半監(jiān)督方法。有監(jiān)督的特征選擇方法需要利用大量的類標信息訓練模型,往往能取得較好的效果。無監(jiān)督的特征選擇方法不需要任何類標信息,能解決重要的現(xiàn)實問題,但是效果并不一定能達到最佳。半監(jiān)督特征選擇方法利用少量的類標信息和大量的無類標信息共同訓練模型,具有重要的現(xiàn)實意義。但是,傳統(tǒng)的基于圖的半監(jiān)督特征選擇方法一般是輸入初始圖,然后進行特征選擇。圖的質(zhì)量直接影響后續(xù)特征選擇的結果。既無法解決大規(guī)模數(shù)據(jù)降維問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種圖的特征選擇方法及系統(tǒng),選取數(shù)據(jù)的重要特征,降低數(shù)據(jù)間的冗余性,解決大規(guī)模數(shù)據(jù)降維問題。
為實現(xiàn)上述目的,本發(fā)明提供了如下方案:
一種圖的特征選擇方法,包括:
根據(jù)圖的像素點構造自適應近鄰圖;所述自適應近鄰圖作為初始圖;
根據(jù)所述圖的像素點確定投影矩陣;
對所述初始圖和所述投影矩陣進行半監(jiān)督學習,得到半監(jiān)督特征選擇模型;所述半監(jiān)督特征選擇模型用于進行所述初始圖的優(yōu)化和特征選擇;
獲取待特征選擇的圖;
采用所述半監(jiān)督特征選擇模型對所述待特征選擇的圖進行特征選擇。
可選的,所述根據(jù)圖的像素點構造自適應近鄰圖,具體包括:
根據(jù)所述圖的像素點確定相似矩陣;
根據(jù)所述相似矩陣構造所述自適應近鄰圖。
可選的,所述根據(jù)所述相似矩陣構造所述自適應近鄰圖,具體包括:
利用公式確定所述自適應近鄰圖的目標函數(shù);其中,為相似矩陣的第i行,α是規(guī)則化參數(shù),為規(guī)則化項,用于避免出現(xiàn)平凡解,即與像素點xi距離最近的點成為xi近鄰的概率為1,而其他像素點都不是xi的近鄰;
利用拉格朗日函數(shù)法對所述自適應近鄰圖的目標函數(shù)進行求解。
可選的,所述對所述初始圖和所述投影矩陣進行半監(jiān)督學習,得到半監(jiān)督特征選擇模型,具體包括:
利用公式確定所述半監(jiān)督特征選擇模型的目標函數(shù);其中,W為投影矩陣,α、γ和λ均為規(guī)則化參數(shù),γ||W||2,1為稀疏項用于對W進行稀疏約束,為平滑項,衡量投影后特征的平滑性,LS為拉普拉斯矩陣,F(xiàn)為像素點的標簽;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍火箭軍工程大學,未經(jīng)中國人民解放軍火箭軍工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010679163.2/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





