[發(fā)明專利]一種基于生成式對抗網絡的多任務分類消歧方法與裝置有效
| 申請?zhí)枺?/td> | 202010746184.1 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111813943B | 公開(公告)日: | 2022-06-10 |
| 發(fā)明(設計)人: | 陳晉音;徐國寧;徐思雨;陳治清;繆盛歡 | 申請(專利權)人: | 浙江工業(yè)大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62;G06Q10/04 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 曹兆霞 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生成 對抗 網絡 任務 分類 方法 裝置 | ||
1.一種基于生成式對抗網絡的多任務分類消歧方法,其特征在于,包括以下步驟:
(1)獲取文本數(shù)據,編碼每條文本數(shù)據獲得文本向量,標記文本向量中的歧視特征,并給出每條文本數(shù)據的信用標簽和收入標簽,以構建樣本集;
(2)基于生成式對抗網絡構建訓練系統(tǒng),包括用于根據樣本數(shù)據預測信用水平的第一分類器,用于根據樣本數(shù)據預測收入水平的第二分類器,用于根據信用標簽、收入標簽、信用水平預測結果、收入水平預測結果生成編碼向量的生成器;
其中,生成器的輸入向量的構建方式為:
首先,利用sigmoid激活函數(shù)分別對第一分類器輸出的信用水平預測結果和第二分類器輸出的收入水平預測結果激活:
s1=sigmoid(2*p1)
s2=sigmoid(2*p2)
其中,sigmoid()為sigmoid激活函數(shù),p1、p2分別為信用水平預測結果和收入水平預測結果,s1、s2分別為p1、p2的sigmoid激活值;
然后,將sigmoid激活值s1、s2與信用標簽t1、收入標簽t2拼接成輸入向量h1:
h1=[(s1,s1*t1,s1*(1.0-t1)),(s2,s2*t2,s2*(1.0–t2))];
(3)構建訓練系統(tǒng)的損失函數(shù),根據信用水平的預測結果和信用標簽的交叉熵和生成器輸出的編碼向量與標記的歧視特征的交叉熵構建第一分類器的第一損失函數(shù),根據收入水平的預測結果和收入標簽的交叉熵和生成器輸出的編碼向量與標記的歧視特征的交叉熵構建第二分類器的第二損失函數(shù),根據生成器的輸入向量和輸出編碼向量的交叉熵構建生成器的第三損失函數(shù);
其中,第一損失函數(shù)loss_d1為:
第二損失函數(shù)loss_d2為:
第三損失函數(shù)loss_d3為:
loss_d3=-[yi*lnpi+(1-yi)ln(1-pi)]
其中,為第i條文本數(shù)據的文本向量經過第一分類器輸出獲得信用水平預測結果,Y1i為第i條文本數(shù)據對應的信用標簽,為文本向量對應的生成器的輸出,即將對應的Y2i以及Y1i拼接后輸入至生成器得到的編碼向量,gi為第i條文本數(shù)據的文本向量中的歧視特征,為第i條文本數(shù)據的文本向量經過第二分類器輸出獲得收入水平預測結果,Y2i為第i條文本數(shù)據對應的收入標簽,L(·)為交叉熵函數(shù),Lc(·)為交叉熵函數(shù),λ為權重參數(shù),取值范圍為0~1,l3為交叉熵函數(shù)計算得到的交叉熵損失,yi為第i條文本數(shù)據的真實標簽,pi為生成器輸出的第i條文本數(shù)據對應的輸出向量;
(4)利用第一損失函數(shù)、第二損失函數(shù)、第三損失函數(shù)對訓練系統(tǒng)進行訓練,訓練結束時,第一分類器及確定的參數(shù)組成信用預測模型,第二分類器及確定的參數(shù)組成收入預測模型;
(5)應用時,將文本數(shù)據編碼成文本向量后,輸入至信用預測模型和收入預測模型中,經計算獲得信用預測結果和收入預測結果。
2.如權利要求1所述的基于生成式對抗網絡的多任務分類消歧方法,其特征在于,采用onehot編碼方式對每條文本數(shù)據進行編碼,并將編碼結果統(tǒng)一到固定長度,獲得文本向量。
3.如權利要求1所述的基于生成式對抗網絡的多任務分類消歧方法,其特征在于,所述第一分類器、第二分類器均為兩層線性回歸神經網絡和sigmoid激活層。
4.如權利要求1所述的基于生成式對抗網絡的多任務分類消歧方法,其特征在于,所述生成器為兩層線性回歸神經網絡和sigmoid激活層。
5.如權利要求1所述的基于生成式對抗網絡的多任務分類消歧方法,其特征在于,對訓練系統(tǒng)進行訓練時,優(yōu)化器采用adam,學習率采用指數(shù)衰減法,的dropout為0.8。
6.一種基于生成式對抗網絡的多任務分類消歧裝置,包括計算機存儲器、計算機處理器以及存儲在所述計算機存儲器中并可在所述計算機處理器上執(zhí)行的計算機程序,其特征在于,所述計算機存儲器中采用權利要求1~5任一項所述的基于生成式對抗網絡的多任務分類消歧方法構建的信用預測模型和收入預測模型;
所述計算機處理器執(zhí)行所述計算機程序時實現(xiàn)以下步驟:
將文本數(shù)據編碼成文本向量后,輸入至信用預測模型和收入預測模型中,經計算獲得信用預測結果和收入預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業(yè)大學,未經浙江工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010746184.1/1.html,轉載請聲明來源鉆瓜專利網。





