[發明專利]基于加權分布對齊和幾何特征對齊的無監督跨領域自適應數據標定方法及系統在審
| 申請號: | 201811547551.4 | 申請日: | 2018-12-18 |
| 公開(公告)號: | CN109635951A | 公開(公告)日: | 2019-04-16 |
| 發明(設計)人: | 何慧;張偉哲;方濱興;楊洪偉;李韜;白雅雯 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06N7/00 | 分類號: | G06N7/00 |
| 代理公司: | 哈爾濱市松花江專利商標事務所 23109 | 代理人: | 楊立超 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對齊 數據標定 幾何特征 加權 樣本數據 無監督 自適應 有效地 準確率 條件概率分布 概率分布 幾何結構 實驗對比 可分性 正則化 減小 樣本 挖掘 開發 | ||
1.一種基于加權分布對齊和幾何特征對齊的無監督跨領域自適應數據標定方法,其特征在于,所述方法的實現過程為:
所述方法的輸入:Xs,Xt,Xs表示源領域樣本,已知標簽樣本;Xt表示目標領域樣本,待標記樣本;表示源領域樣本標簽;
參數:
α=1為待標記樣本方差最大化的重要性程度評估,
λ=1為廣義特征變換內部差異的重要性程度評,
β為類間方差最大化重要性程度評估,
μ∈[0,1]為評估領域內邊際分布和條件分布重要性參數,
δ∈[0,1]為圖拉普拉斯正則化項系數,
p為樣本的最近鄰個數,
k為子空間個數,T為迭代次數;
所述方法的輸出為:
變換矩陣Φ,Ψ;Xs經過變換矩陣Φ得到的Zs,Xt經過變換矩陣Ψ得到的Zt;適應分類器:f;
步驟1、計算目標域散度矩陣St、數據的類間散度矩陣Sb、類內散度矩陣Sw,
M′s,M′t,M′st,M′ts為源領域樣本和目標領域樣本的邊際概率分布與條件概率分布的加權和與其對應的加權拉普拉斯正則化項之和;
M′s,M′t,M′st,M′ts是一個矩陣中的四個分塊;
M′s表示源領域樣本的邊際概率分布與條件概率分布的加權和與其對應的加權拉普拉斯正則化項之和;
M′t表示目標領域樣本的邊際概率分布與條件概率分布的加權和與其對應的加權拉普拉斯正則化項之和;
M′st表示源領域樣本、目標領域樣本的邊際概率分布與條件概率分布的加權和與其對應的加權拉普拉斯正則化項之和;
M′ts表示目標領域樣本、源領域樣本的邊際概率分布與條件概率分布的加權和與其對應的加權拉普拉斯正則化項之和;
用在源領域中訓練的分類器來初始化目標領域的偽標簽
步驟2:重復步驟3至步驟6;
步驟3:求解廣義特征值問題并且相應的k個特征向量,以及前k個特征值作為廣義特征變換U的特征值,接下來得到源域數據樣本變換矩陣Φ,目標域數據樣本變換矩陣Ψ;
步驟4:將原始數據映射到相應的子空間得到嵌入:
步驟5:在上訓練一個分類器來更新目標域的偽標簽
步驟6:更新M′s,M′t,M′st,M′ts;
步驟7:直至收斂;
步驟8:得到最終在上的分類器f。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811547551.4/1.html,轉載請聲明來源鉆瓜專利網。





