[發明專利]一種基于張量多屬性特征遷移的分類方法在審
| 申請號: | 202210529783.7 | 申請日: | 2022-05-16 |
| 公開(公告)號: | CN115019084A | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 劉欣剛;葉嘉林;陳捷元;呂卓祺;章權江;張澤龍 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 閆樹平 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 張量 屬性 特征 遷移 分類 方法 | ||
本發明涉及遷移學習和張量領域,具體為一種基于張量多屬性特征遷移的分類方法;該方法結合張量體系和基于特征的遷移方法實現了對無標簽數據集的有效分類。分類過程中,首先通過張量建模的方式建立有標簽源域和無標簽目標域的張量模型,然后使用動態分布自適應方法對源域樣本張量和目標域樣本張量每一個特征階迭代進行了特征對齊,實現了源域樣本和目標域樣本多屬性間統計特征的遷移。相較于傳統的特征遷移方法提高了對無標簽目標域數據樣本的分類準確率。
技術領域
本發明涉及遷移學習和張量領域,具體涉及一種基于張量多屬性特征遷移的分類方法。
背景技術
隨著大數據時代的來臨,能否對收集到的數據及時有效的處理影響生產生活中諸多智能 系統的應用效果。受客觀環境因素限制,部分收集到的數據存在著樣本量少,缺少標簽等問 題。對于這些數據,傳統的數據處理方法的性能將會出現明顯下降或者直接失效。若直接丟 棄這些數據則會造成資源損失與浪費,降低了數據的有效利用率。遷移學習作為一種思想, 為高效利用這些殘缺的新數據提供了一種新的思路。
遷移學習旨在通過學習過的知識與新數據間的相似性,遷移相似的要素到新數據的處理 過程中。依據遷移要素的不同,遷移學習大致分為基于實例的遷移、基于特征的遷移、基于 模型的遷移及基于關系的遷移。其中基于特征的遷移主要遷移的是兩個域間的統計特征,即 通過一個特征變換對齊源域和目標域間的聯合分布差異,然后在對齊后的兩個域中遷移預測 函數,從而完成對無標簽、少樣本的目標域數據的分類。由于真實環境中所產生的大數據往 往是多屬性的,需要在數據樣本多種屬性間進行聯合分析才能更有效地發掘事物內的關聯關 系。針對高階數據,傳統的基于特征的遷移僅從某一階上單一的特征進行考慮,將高階多屬 性數據人為展開成一階向量的形式,導致部分關鍵的空間特征丟失,從而降低了遷移以及最 終分類的效果。
因此,在處理高階多屬性數據時,針對數據樣本量少以及缺少標簽等問題,提供一種結 合張量表示及計算體系的,對高階數據多個屬性都進行特征遷移并保留關鍵空間特征的方法 就顯得尤為重要。
發明內容
本發明的發明目的在于:提供一種基于張量多屬性特征遷移的分類方法,以解決現有的 基于特征的遷移學習方法在處理高階多屬性數據時,不能從多種屬性聯合分析、導致部分關 鍵的空間特征丟失,降低了遷移及最終分類的效果等問題。
本發明的一種基于張量多屬性特征遷移的分類方法,包括下列步驟:
步驟S1、張量建模:將所有源域數據樣本和目標域數據樣本都表示成高階張量的形式, 得到源域數據樣本張量和目標域數據樣本張量其中源域數據樣本為帶標簽的數據樣 本,目標域數據樣本為無標簽的數據樣本;
步驟S2、偽標簽獲取:將源域所有數據樣本的標簽組成源域標簽矩陣Ys;使用源域樣本 張量和其對應的源域標簽矩陣Ys訓練一個分類器fs();對目標域數據樣本張量進行預 測,獲得對應的目標域偽標簽矩陣
步驟S3、多屬性特征遷移:根據源域數據樣本張量和目標域數據張量結合源域標 簽矩陣Ys和目標域偽標簽矩陣采用動態分布自適應方法依次迭代減小每一個特征階上源域 樣本張量和目標域樣本張量的聯合分布差異;獲得所有特征階上聯合分布差異都減小 后的新源域樣本張量和目標域樣本張量
步驟S4、標簽更新:結合新源域樣本張量和其對應的源域標簽矩陣Ys再次訓練一個簡 單的分類器用于對目標域樣本張量進行預測,從而獲取新目標域的標簽;
步驟S5、重復步驟S3和S4,通過不斷迭代獲得更準確的標簽,以實現對無標簽目標域數 據樣本的分類。
進一步的,所述步驟S1建立張量模型的詳細過程,包括如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210529783.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種ACE抑制肽及其應用
- 下一篇:一種數據處理方法、裝置、設備及存儲介質





