[發明專利]一種基于圖的半監督分類機器學習新方法在審
| 申請號: | 201810437033.0 | 申請日: | 2018-05-09 |
| 公開(公告)號: | CN108596272A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 劉建峰 | 申請(專利權)人: | 重慶三峽學院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N99/00 |
| 代理公司: | 重慶晶智匯知識產權代理事務所(普通合伙) 50229 | 代理人: | 李靖 |
| 地址: | 404100 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預處理 樣本標記 半監督 半監督學習 無監督學習 訓練樣本集 分類機器 難度降低 數據樣本 訓練樣本 樣本分類 訓練集 分類 學習 監督 | ||
1.一種基于圖的半監督分類新方法,包括如下步驟:
步驟S001:劃分訓練集;
訓練集X=L∪U={x1,…xl,xl+1,…xl+u},L={x1,…xl}是少量有標簽樣本,U={xl+1,…xl+u}為大量無標簽樣本;標記樣本占比
步驟S002:構造非對稱稀疏權重矩陣;
式中,j=1,2,…,k-1,k+1,…,n表示樣本xk由其余樣本線性表示的稀疏分解系數;
步驟S003:求解非對稱權重矩陣;通過求解優化問題求解非對稱權重矩陣;
步驟S004:計算目標函數
步驟S005:采用符號函數判斷樣本類別。
2.根據權利要求1所述的一種基于圖的半監督分類新方法,其特征在于:在所述步驟S001劃分訓練集中,采用主動樣本標記方法,標記具有最大邊界信息量樣本,對樣本進行預處理,包括如下步驟:
步驟D000:計算為所有無標簽樣本的類別概率差值Li,j(x);所述類別概率差值計算公式為:
步驟D001:選取類別概率差值Li,j(x)小于預設閾值δ的所有無標簽樣本作為具有最大邊界信息量樣本;
步驟D002:將選取具有最大邊界信息量樣本由訓練完成的3個初始化分類器進行類別標定,將標定后樣本劃分為有標簽樣本集。
3.根據權利要求2所述的一種基于圖的半監督分類新方法,其特征在于:所述預設閾值δ=2.5×10-2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶三峽學院,未經重慶三峽學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810437033.0/1.html,轉載請聲明來源鉆瓜專利網。





