[發明專利]一種圖的特征選擇方法及系統有效
| 申請號: | 202010679163.2 | 申請日: | 2020-07-15 |
| 公開(公告)號: | CN111898710B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 何芳;賈維敏;張峰干;伍宗偉;沈曉衛;趙建偉;胡豪杰;金偉;何佑明;朱玉杰 | 申請(專利權)人: | 中國人民解放軍火箭軍工程大學 |
| 主分類號: | G06V10/771 | 分類號: | G06V10/771;G06V10/766;G06V10/778;G06F17/14;G06F17/16 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 崔玥 |
| 地址: | 710025 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 特征 選擇 方法 系統 | ||
本發明涉及一種圖的特征選擇方法及系統。所述方法包括根據圖的像素點構造自適應近鄰圖;根據所述圖的像素點確定投影矩陣;對所述初始圖和所述投影矩陣進行半監督學習,得到半監督特征選擇模型;獲取待特征選擇的圖;采用所述半監督特征選擇模型對所述待特征選擇的圖進行特征選擇。本發明所提供的一種圖的特征選擇方法及系統,選取數據的重要特征,降低數據間的冗余性,解決大規模數據降維問題。
技術領域
本發明涉及機器學習領域,特別是涉及一種圖的特征選擇方法及系統。
背景技術
隨著時代的進步,社會的發展,海量高維數據的處理是當前大數據時代下不可避免的任務。大量不同媒體源都會產生海量高維形式的數據,如文本數據、圖像數據、視頻數據、交易數據和基因數據等。降維算法是處理高維數據的有效手段。采用合適的降維算法可以減少存儲,降低計算負擔,同時也能減少冗余特征。
根據實現方式的不同,降維方法又可以分為特征提取和特征選擇。特征提取方法采用合適的映射函數將高維數據映射到低維空間,實現對高維特征的重組,生成新的特征分量形成數據的低維表示。特征選擇方法要求不改變原始特征,從中選取出有價值的特征子集。特征選擇方法能夠保留數據的物理意義,具有重要的研究價值。
根據是否利用類標信息,特征選擇方法又可以分為:有監督,無監督和半監督方法。有監督的特征選擇方法需要利用大量的類標信息訓練模型,往往能取得較好的效果。無監督的特征選擇方法不需要任何類標信息,能解決重要的現實問題,但是效果并不一定能達到最佳。半監督特征選擇方法利用少量的類標信息和大量的無類標信息共同訓練模型,具有重要的現實意義。但是,傳統的基于圖的半監督特征選擇方法一般是輸入初始圖,然后進行特征選擇。圖的質量直接影響后續特征選擇的結果。既無法解決大規模數據降維問題。
發明內容
本發明的目的是提供一種圖的特征選擇方法及系統,選取數據的重要特征,降低數據間的冗余性,解決大規模數據降維問題。
為實現上述目的,本發明提供了如下方案:
一種圖的特征選擇方法,包括:
根據圖的像素點構造自適應近鄰圖;所述自適應近鄰圖作為初始圖;
根據所述圖的像素點確定投影矩陣;
對所述初始圖和所述投影矩陣進行半監督學習,得到半監督特征選擇模型;所述半監督特征選擇模型用于進行所述初始圖的優化和特征選擇;
獲取待特征選擇的圖;
采用所述半監督特征選擇模型對所述待特征選擇的圖進行特征選擇。
可選的,所述根據圖的像素點構造自適應近鄰圖,具體包括:
根據所述圖的像素點確定相似矩陣;
根據所述相似矩陣構造所述自適應近鄰圖。
可選的,所述根據所述相似矩陣構造所述自適應近鄰圖,具體包括:
利用公式確定所述自適應近鄰圖的目標函數;其中,為相似矩陣的第i行,α是規則化參數,為規則化項,用于避免出現平凡解,即與像素點xi距離最近的點成為xi近鄰的概率為1,而其他像素點都不是xi的近鄰;
利用拉格朗日函數法對所述自適應近鄰圖的目標函數進行求解。
可選的,所述對所述初始圖和所述投影矩陣進行半監督學習,得到半監督特征選擇模型,具體包括:
利用公式確定所述半監督特征選擇模型的目標函數;其中,W為投影矩陣,α、γ和λ均為規則化參數,γ||W||2,1為稀疏項用于對W進行稀疏約束,為平滑項,衡量投影后特征的平滑性,LS為拉普拉斯矩陣,F為像素點的標簽;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍火箭軍工程大學,未經中國人民解放軍火箭軍工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010679163.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種元器件進料機構
- 下一篇:一種頁面訪問數據的統計方法及裝置





