[發明專利]基于遷移學習的數據處理方法、裝置、設備及存儲介質在審
| 申請號: | 202011393272.4 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112418443A | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 康焱;劉洋 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 張志江 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遷移 學習 數據處理 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種基于遷移學習的數據處理方法、裝置、設備及存儲介質,其中,方法包括:獲得第一樣本特征組,并獲得第二樣本特征組;基于第一樣本特征組確定第一樣本特征表征,并基于第二樣本特征組確定第二樣本特征表征;基于每一個第一樣本特征表征及每一個第二樣本特征表征,更新特征提取模型;基于所述第一樣本特征表征以及可解釋的待訓練預測模型,確定目標預測模型以及目標特征提取模型。本發明能夠得到兼顧模型遷移和模型可解釋的目標模型,通過目標特征提取模型對樣本的知識進行遷移,在遷移學習過程中通過領域區分模型提高遷移學習的效率,提高了數據處理的效率以及計算機算力資源的利用率。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種基于遷移學習的數據處理方法、裝置、設備及存儲介質。
背景技術
機器學習在大量標記的數據上進行監督式訓練可以獲得很好的性能和效果,然而大型的標記數據集在數量和應用領域方面均有限,且手動標記足量的訓練數據往往需要高昂的代價。針對這一問題,通常采用遷移學習方法解決,即訓練一個鑒別器用于調整遷移學習網絡的參數,使得參數調整后的遷移學習網絡下,源領域的數據與目標領域的數據間的分布偏移減小,從而遷移學習網絡應用目標領域完成目標任務時有較佳的效果。
但是,深度學習模型的缺乏可解釋性使其在要求模型可解釋性的應用中(比如,金融風險控制)很難被用于遷移學習,而復雜度低的深度學習模型從原始數據中學習到可遷移知識的能力較弱,因此其遷移能力不強。這就產生了一個矛盾,遷移能力強的深度學習模型缺乏可解釋性,可解釋性強的深度學習模型遷移能力不強,導致深度學習模型無法兼顧可解釋性以及遷移能力。同時,在遷移學習中,由于不能對不同領域或場景的數據進行有效的領域區分,使得遷移學習過程中需要訓練更長時間才能使得訓練后的模型達到目標性能,造成遷移學習的效率低,進而導致計算機需要耗費大量資源算力,致使計算機算力資源的利用率低。
上述內容僅用于輔助理解本發明的技術方案,并不代表承認上述內容是現有技術。
發明內容
本發明的主要目的在于提供一種基于遷移學習的數據處理方法、裝置、設備及存儲介質,旨在解決深度學習模型無法兼顧可解釋性以及遷移能力,以及遷移學習的效率低而導致計算機算力資源的利用率低的技術問題。
為實現上述目的,本發明提供一種基于遷移學習的數據處理方法,所述基于遷移學習的數據處理方法包括以下步驟:
基于預設業務需求對第一業務場景的第一樣本的特征進行分組,以獲得預設個數的第一樣本特征組,并基于預設業務需求對第二業務場景的第二樣本的特征進行分組,以獲得預設個數的第二樣本特征組;
基于每一個第一樣本特征組及其對應的特征提取模型,確定第一樣本特征表征,并基于每一個第二樣本特征組及其對應的特征提取模型,確定第二樣本特征表征;
基于每一個第一樣本特征表征及其對應的領域區分模型,確定第一領域區分損失值,基于每一個第二樣本特征表征及其對應的領域區分模型,確定第二領域區分損失值,并基于第一領域區分損失值以及第二領域區分損失值,更新各個特征提取模型;
基于所述第一樣本特征表征以及可解釋的待訓練預測模型,確定預測損失值以及目標預測模型,并基于所述預測損失值以及更新后的特征提取模型,確定目標特征提取模型。
進一步地,所述基于每一個第一樣本特征表征及其對應的領域區分模型,確定第一領域區分損失值的步驟包括:
將每一個第一樣本特征表征輸入對應的領域區分模型,以獲得各個第一樣本特征表征對應的第一領域區分損失值;
基于所述第一領域區分損失值更新對應的領域區分模型,以獲得更新后的領域區分模型,并基于各個第一領域區分損失值通過領域對抗學習,更新各個第一樣本特征表征對應的特征提取模型,以獲得中間特征提取模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011393272.4/2.html,轉載請聲明來源鉆瓜專利網。





