[發明專利]基于遷移學習的資源分配方法、裝置及電子設備在審
| 申請號: | 202011159526.6 | 申請日: | 2020-10-27 |
| 公開(公告)號: | CN112015562A | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 張國光;宋孟楠;蘇綏綏 | 申請(專利權)人: | 北京淇瑀信息科技有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06K9/62;G06N20/00 |
| 代理公司: | 北京清誠知識產權代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遷移 學習 資源 分配 方法 裝置 電子設備 | ||
本公開涉及一種基于遷移學習的資源分配方法、裝置、電子設備及計算機可讀介質。該方法包括:獲取第一預設場景中的用戶的基礎數據;將所述基礎數據輸入用戶分析模型中,生成用戶評分,其中,所述用戶分析模型通過第二預設場景中的其他用戶的基礎數據和遷移學習方法生成;基于所述用戶評分為所述用戶進行資源分配。本公開涉及的基于遷移學習的資源分配方法、裝置、電子設備及計算機可讀介質,能夠直接將不同應用場景下的相關模型進行復用,進而快速準確的為用戶進行資源分配,既能節約時間,又能在缺少用戶樣本的情況下,自動的為用戶分配資源配額,進而使得該應用場景下的資源分配效率更高,減小誤差和人力成本。
技術領域
本公開涉及計算機信息處理領域,具體而言,涉及一種基于遷移學習的資源分配方法、裝置、電子設備及計算機可讀介質。
背景技術
在機器學習模型的訓練過程中,樣本的特征對于構建機器學習模型起著決定性的作用,比如在某互聯網金融服務企業中,具有A,B,C三個業務部門,需要對這三個業務部門的用戶分別進行仿真建模。還可例如,在某互聯網金融服務企業中,A部門用戶數量多,已累積了大量帶標簽的樣本,通過A部門的用戶樣本訓練得到的模型效果很好,而B部門的用戶少,樣本量較少,僅通過B部門的用戶樣本是沒辦法獲得訓練效果很好的機器學習模型。對于一個公司的業務部門來講,雖然具體業務有差異,但是一般都是同一個業務背景下的不同業務分支,其中有很多共性的特點可以共用。如果能將A業務的相關模型復用到B業務上使用,既能節約時間,又能改善單獨用B業務的用戶進行訓練效果不好的問題。
在經典的機器學習問題中,往往假設訓練集和測試集分布一致,在訓練集上訓練模型,在測試集上測試。然而在實際問題中,測試場景往往不可控,測試集和訓練集分布有很大差異,這時候就會出現所謂過擬合問題:模型在測試集上效果不理想。以人臉識別為例,如果用東方人臉數據訓練,用于識別西方人,相比東方人識別性能會明顯下降。當訓練集和測試集分布不一致的情況下,通過在訓練數據上按經驗誤差最小準則訓練的模型在測試上性能不好。
在所述背景技術部分公開的上述信息僅用于加強對本公開的背景的理解,因此它可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
有鑒于此,本公開提供一種基于遷移學習的資源分配方法、裝置、電子設備及計算機可讀介質。本發明一方面旨在解決:現有技術對于某些應用場景中,由于用戶樣本較少而無法完成機器學習模型的訓練,在這種情況下,無法自動的,智能的為當前用戶分配用戶策略和資源,必須采用大量人工審核的方式進行分配,浪費了大量的時間和資源。本發明另一方面旨在解決如何能夠在缺少用戶樣本的情況下,自動的為用戶分配資源配額,進而使得該應用場景下的資源分配效率更高,減小誤差和人力成本。
本公開的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本公開的實踐而習得。
根據本公開的一方面,提出一種基于遷移學習的資源分配方法,該方法包括:獲取第一預設場景中的用戶的基礎數據;將所述基礎數據輸入用戶分析模型中,生成用戶評分,其中,所述用戶分析模型通過第二預設場景中的其他用戶的基礎數據和遷移學習方法生成;基于所述用戶評分為所述用戶進行資源分配。
可選地,還包括:基于第二預設場景中的其他用戶的基礎數據生成初始模型;基于第一預設場景中的多個歷史用戶的基礎數據對所述初始模型進行遷移學習以生成所述用戶分析模型。
可選地,基于第二預設場景中的其他用戶的基礎數據生成初始模型,包括:獲取第二預設場景中的其他用戶的基礎數據;基于所述其他用戶的基礎數據生成多個用戶特征組合;基于所述多個用戶特征組合對邏輯回歸模型進行訓練以生成所述初始模型。
可選地,基于所述其他用戶的基礎數據生成用戶特征組合,包括:確定所述其他用戶的基礎數據的標簽;將帶有標簽的所述其他用戶的基礎數據輸入極端梯度提升決策樹模型中以生成多個用戶特征組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京淇瑀信息科技有限公司,未經北京淇瑀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011159526.6/2.html,轉載請聲明來源鉆瓜專利網。





