[發明專利]一種基于生成式對抗網絡的多任務分類消歧方法與裝置有效

申請號：	202010746184.1	申請日：	2020-07-29
公開（公告）號：	CN111813943B	公開（公告）日：	2022-06-10
發明（設計）人：	陳晉音;徐國寧;徐思雨;陳治清;繆盛歡	申請（專利權）人：	浙江工業大學
主分類號：	G06F16/35	分類號：	G06F16/35;G06K9/62;G06Q10/04
代理公司：	杭州天勤知識產權代理有限公司 33224	代理人：	曹兆霞
地址：	310014 浙***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于生成對抗網絡任務分類方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種基于生成式對抗網絡的多任務分類消歧方法與裝置，包括：(1)獲取文本數據并構建樣本集；(2)基于生成式對抗網絡構建訓練系統，包括用于根據樣本數據預測信用水平的第一分類器，用于根據樣本數據預測收入水平的第二分類器，用于根據信用標簽、收入標簽、信用水平預測結果、收入水平預測結果生成編碼向量的生成器；(3)根據交叉熵損失構建生成器、第一分類器和第二分類器的損失函數；(4)利用損失函數對訓練系統進行訓練，并將第一分類器形成信用預測模型，第二分類器形成收入預測模型；(5)將文本數據編碼成文本向量后輸入至信用預測模型和收入預測模型中，經計算獲得信用預測結果和收入預測結果。

技術領域

本發明屬于數據分類領域，具體涉及一種基于生成式對抗網絡的多任務分類消歧方法與裝置。

背景技術

如今，人工智能在多個領域得到了廣泛的應用，如在犯罪領域預測犯人將來再犯罪的概率；在貸款領域，利用數據判斷一個人的未來信用程度；在司法決策、警力分配、健康管理、學生錄取等方面，也越來越偏向使用智能決策。人工智能的學習過程需要建立模型對數據進行學習，然而基于歷史數據學習，進行分析決策的系統，會獲取延續數據中相關的歧視信息，即帶有我們不希望看到的用于最終決策的歧視性預測。如預測個人信用的系統對女性可能會帶有偏見，使女性更有可能被判斷為低信用群體，這種基于性別的決策會帶來不公平的影響，引發人工智能的歧視問題。經過訓練的模型大大擴大了目標標簽與性別的關聯，超出了人們對有偏見的數據集的應有的期望，放大了其中的歧視成分。即便數據集是平衡的，每個標簽都與每個性別平等，學習的模型也會放大標簽和性別之間的關聯，產生不公平的分類現象。

目前針對這一歧視現象，已經出現了多種消歧算法用于減輕分類中的歧視問題。現有的消歧算法主要分為三類：基于原始數據集的消歧方法、基于模型的消歧方法以及基于分類結果的消歧方法。基于原始數據及的消歧方法需要對原始數據集進行修改，或給特征變量加權重值，例如，文獻Data preprocessing techniques for classificationwithout discrimination.Knowledge and Information Systems，Faisal Kamiran，ToonCalders(2012)提出的reweighing算法對原始數據集進行處理，加權值以消歧。基于分類結果的消歧衍生出equality odds算法，出自文獻Equality of opportunity in supervisedlearning.Hardt,Proceedings of the 30th International Conference on NeuralInformation Processing.M.,Price,E.,Srebro,N..(2016)。

但是，目前的消歧算法都基于單任務的分類任務，只能同時在一個分類任務上進行處理，不能適應日益增長的多種場合的分類需求。在信貸領域中，個人的信用水平和收入水平會作為信貸的評價標準，在這個應用場景中，在評述信用水平和收入水平時往往會存在種族歧視和性別歧視，因為該種族歧視和性別歧視的存在導致信用水平和收入水平評估結果不準確，直接影響信貸。

發明內容

本發明的目的是提供一種基于生成式對抗網絡的多任務分類消歧方法與裝置，通過消除種族歧視和性別歧視來提升信用水平和收入水平預測準確性。

為實現上述發明目的，本發明提供的技術方案為：

一種基于生成式對抗網絡的多任務分類消歧方法，包括以下步驟：

(1)獲取文本數據，編碼每條文本數據獲得文本向量，標記文本向量中的歧視特征，并給出每條文本數據的信用標簽和收入標簽，以構建樣本集；

(2)基于生成式對抗網絡構建訓練系統，包括用于根據樣本數據預測信用水平的第一分類器，用于根據樣本數據預測收入水平的第二分類器，用于根據信用標簽、收入標簽、信用水平預測結果、收入水平預測結果生成編碼向量的生成器；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學，未經浙江工業大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010746184.1/2.html，轉載請聲明來源鉆瓜專利網。