[發明專利]基于局部類別一致聚類和多任務學習的分類方法及設備在審
| 申請號: | 201710662859.2 | 申請日: | 2017-08-04 |
| 公開(公告)號: | CN107563410A | 公開(公告)日: | 2018-01-09 |
| 發明(設計)人: | 胡衛明;毛雪 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京瀚仁知識產權代理事務所(普通合伙)11482 | 代理人: | 郭文浩,王世超 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 局部 類別 一致 任務 學習 分類 方法 設備 | ||
1.一種基于局部類別一致聚類和多任務學習的分類方法,其特征在于,所述方法包括如下步驟:
步驟1:利用K-均值聚類方法對待分類數據進行聚類,生成多個第一聚類,在每個所述第一聚類上訓練一個線性的第一支持向量機,根據所述第一聚類和所述第一支持向量機生成初始分類模型的參數;
步驟2:根據局部類別一致聚類的方法將所述待分類數據劃分為多個第二聚類,在每個所述第二聚類上訓練一個線性的第二支持向量機;
步驟3:在一個產生式模型中融合所述第二聚類,并訓練所述第二支持向量機;
步驟4:使用多任務學習方法同時學習所述第二支持向量機,并在各個所述第二支持向量機之間遷移知識;所述知識為由屬性或特征組成的特征信息;
步驟5:利用期望最大化算法來求解所述局部類別一致聚類的參數和所述第二支持向量機的參數,并根據所述局部類別一致聚類的參數和所述第二支持向量機的參數更新所述初始分類模型的參數,生成分類模型;
步驟6:利用所述分類模型來對所述待分類數據進行分類。
2.根據權利要求1所述的方法,其特征在于,所述步驟1包括:
步驟11:使用K-均值聚類方法對所述待分類數據進行聚類操作,生成多個第一聚類;
步驟12:計算每個第一聚類的第一混合系數、第一均值向量和第一協方差矩陣;
步驟13:在每個聚類上訓練一個線性的第一支持向量機,獲得K個線性的第一支持向量機;
步驟14:根據所述第一混合系數、第一均值向量、第一協方差矩陣和各個第一支持向量機的權重向量,計算初始分類模型的參數。
3.根據權利要求2所述的方法,其特征在于,所述步驟2包括:
步驟21:使用局部一致高斯混合模型對所述待分類數據進行聚類操作,生成第二聚類,其中,所述局部一致高斯混合模型是局部一致正則化項下的高斯模型;
步驟22:計算每個第二聚的類第二混合系數、第二均值向量和第二協方差矩陣,生成所述第二聚類的參數;
步驟23:在每個所述第二聚類上訓練一個線性的第二支持向量機。
4.根據權利要求3所述的方法,其特征在于,所述步驟3包括:
步驟31:在產生式模型中,融合所述第二聚類和所述第二聚類上訓練的線性的第二支持向量機;
步驟32:根據所述產生式模型樣本的分布計算出第二聚類之間的聯合概率,以及依據所述聯合概率計算出正則化的對數似然函數;
步驟33:將所述線性第二支持向量機融入到所述對數似然函數,優化目標函數得到訓練好的所述線性第二支持向量機;其中,為線性支持向量機權重向量的正則項,是在訓練集上總的損失函數,為數據x和y聚類的損失函數。
5.根據權利要求4所述的方法,其特征在于,所述步驟4包括:
步驟41,基于多任務學習方法在每個所述第二聚類上訓練一個線性的第二支持向量機;
步驟42,根據每個所述第二支持向量機的權重向量將全部所述第二聚類聚成多個組;
步驟43,依據各組聚類的平均權重向量和各所述第二支持向量機權重向量的正則項,在各所述第二支持向量機之間遷移知識。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710662859.2/1.html,轉載請聲明來源鉆瓜專利網。





