[發明專利]一種基于判別聯合概率的域適配方法及系統在審
| 申請號: | 202010515089.0 | 申請日: | 2020-06-08 |
| 公開(公告)號: | CN111626376A | 公開(公告)日: | 2020-09-04 |
| 發明(設計)人: | 楊楊;陶卓;石曉丹;劉祖龍;張藝馨;趙倩;王健鑫;葛忠迪;嚴雨;張振威 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 陳新生 |
| 地址: | 100876 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 判別 聯合 概率 配方 系統 | ||
1.一種基于判別聯合概率的域適配方法,其特征在于,包括:
獲取歷史流量數據集;
根據所述歷史流量數據集,構建帶標簽的源域數據集和帶標簽的目標域數據集;
根據所述帶標簽的源域數據集和所述帶標簽的目標域數據集,計算源域和目標域之間的聯合概率差異;
根據所述聯合概率差異獲取最小化聯合概率差異;
基于所述最小化聯合概率差異,將所述帶標簽的源域數據集向所述帶標簽的目標域數據集進行域適配。
2.根據權利要求1所述的基于判別聯合概率的域適配方法,其特征在于,所述計算源域和目標域之間的聯合概率差異,包括:
計算所述帶標簽的源域數據集和所述帶標簽的目標域數據集之間相同類別的聯合概率差異;
計算所述帶標簽的源域數據集和所述帶標簽的目標域數據集之間不同類別的聯合概率差異。
3.根據權利要求2所述的基于判別聯合概率的域適配方法,其特征在于,所述計算所述帶標簽的源域數據集和所述帶標簽的目標域數據集之間相同類別的聯合概率差異,具體為:
所述計算所述帶標簽的源域數據集和所述帶標簽的目標域數據集之間相同類別的聯合概率差異,具體為:
其中,C為源域的標簽集、c為源域標簽的類別;為目標域的標簽集、為目標域標簽的類別;Mt為源域與目標域之間相同類別的聯合概率差異、Md為源域與目標域之間不同類別之間的聯合概率差異;Xs為源域數據集中的數據、Xt為目標域數據集中的數據;為源域的c類標簽、為目標域的類標簽;P為概率;ns為源域中的數據量,nt為目標域的數據量,為第i個源域的數據;A為線性映射的權重矩陣、AT為A的轉置矩陣;為第j個目標域數據;為目標域中標簽為的數據量;為源域中標簽為c的數據量。
4.根據權利要求3所述的基于判別聯合概率的域適配方法,其特征在于,所述根據所述聯合概率差異獲取最小化聯合概率差異,具體為:
其中,d(Ds,Dt)為聯合概率差異;Ds為源域、Dt為目標域;μ為權衡參數,且μ>0;F為分布函數;Ns表示源域獨熱編碼標簽歸一化矩陣,Nt表示預測的目標域獨熱編碼標簽歸一化矩陣;Ys表示源域獨熱編碼標簽矩陣,表示預測的目標域獨熱編碼標簽矩陣;ns為源域中的數據量,nt為目標域的數據量;Ys(:,c)表示Ys的第c列,表不的第2行及以后;Hs和Ht均為中間變量。
5.根據權利要求1所述的基于判別聯合概率的域適配方法,其特征在于,所述對所述歷史流量數據集進行預處理,構建帶標簽的源域數據集和帶標簽的目標域數據集,包括:
對所述歷史流量數據集中的數據進行啞變量編碼,獲取數值型特征值集;
對所述數值型特征值集進行Z-score標準化處理,獲取標準化數據集;
將所述標準化數據集按預設比例劃分為帶標簽的源域訓練集和帶標簽的源域測試集;
將所述帶標簽的源域訓練集確定為所述帶標簽的源域數據集,將所述帶標簽的源域測試集確定為所述帶標簽的目標域數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010515089.0/1.html,轉載請聲明來源鉆瓜專利網。





