[發明專利]樣本數據閉環生成方法、裝置、設備及存儲介質有效
| 申請號: | 202110570309.4 | 申請日: | 2021-05-25 |
| 公開(公告)號: | CN113505805B | 公開(公告)日: | 2023-10-13 |
| 發明(設計)人: | 郭寧;尤薇;俞加偉 | 申請(專利權)人: | 平安銀行股份有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06N20/00;G06F9/54 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 數據 閉環 生成 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能技術,揭露了一種樣本數據閉環生成方法,包括:利用樣本數據集對待訓練模型集群進行訓練,得到標準模型集群,利用標準模型集群對實時業務請求進行預測,得到集群響應結果,對集群響應結果進行預測反饋,得到業務反饋結果,將業務反饋結果及集群響應結果進行關聯,得到關聯結果并標注,得到標注后的樣本數據,將標注后的樣本數據補充至樣本數據集,對離線業務日志進行加工,將加工后的樣本數據補充至樣本數據集。此外,本發明還涉及區塊鏈技術,所述標準模型集群可存儲在區塊鏈的節點中。本發明還提出一種樣本數據閉環生成裝置、電子設備以及計算機可讀存儲介質。本發明可以解決因樣本數據不足而導致的模型精度較低的問題。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種樣本數據閉環生成方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
當今5G網絡下,數據爆炸式增長,機器學習發展越來越大,廣泛應用于各種領域。一些機器學習算法,如深度學習等算法,目前遇到的主要困境是,如何能夠獲得大量的、高質量的已標注樣本數據。機器學習發展初期,都是由人工標注為主,但人工標注會帶來大量人工成本且標注質量不高;后來發展的眾包標注方法,也對標注的數據質量提出了新的挑戰,而且在特定領域,如銀行背景下,像身份證等敏感信息,由于防泄漏門檻,標注難度更大。現有技術下會出現由于防止數據泄露而導致樣本數據不足,樣本數據標注特征不足等問題,從而引起模型欠擬合和過擬合,導致模型精度較低。
發明內容
本發明提供一種樣本數據閉環生成方法、裝置、設備及存儲介質,其主要目的在于解決因樣本數據不足而導致的模型精度較低的問題。
為實現上述目的,本發明提供的一種樣本數據閉環生成方法,包括:
獲取樣本數據集,根據所述樣本數據集構建訓練樣本集,并基于所述訓練樣本集對待訓練模型集群進行訓練,得到標準模型集群;
獲取實時業務請求,基于所述標準模型集群對所述實時業務請求進行預測,得到集群響應結果,基于所述集群響應結果生成消息隊列;
對所述集群響應結果進行預測反饋,得到業務反饋結果,并將所述業務反饋結果發送至所述消息隊列;
對所述消息隊列中的所述業務反饋結果及所述集群響應結果進行關聯,得到關聯結果;
對所述關聯結果進行標注處理,得到標注后的樣本數據,并將所述標注后的樣本數據補充至所述樣本數據集。
可選地,所述根據所述樣本數據集構建訓練樣本集,并基于所述訓練樣本集對待訓練模型集群進行訓練,得到標準模型集群,包括:
對所述樣本數據集中的數據進行分類,得到分類數據集;
根據預構建的待訓練模型集群,將所述分類數據集進行數據劃分,得到所述訓練樣本集;
利用所述訓練樣本集對所述待訓練模型集群中所述訓練樣本集對應的模型進行訓練,得到標準模型,匯總所有訓練完成的標準模型,得到所述標準模型集群。
可選地,所述基于所述標準模型集群對所述實時業務請求進行預測,得到集群響應結果,包括:
利用預設的網關生成所述實時業務請求的請求唯一標識;
利用所述標準模型集群中的標準模型對所述實時業務請求中的真實數據進行預測,得到預測結果;
對所述真實數據、所述請求唯一標識及所述預測結果進行封裝,得到所述集群響應結果。
可選地,所述對所述集群響應結果進行預測反饋,得到業務反饋結果,包括:
調用預設的反饋接口,利用所述反饋接口獲取所述集群響應結果的驗證數據;
基于所述驗證數據對所述集群響應結果中的預測結果進行驗證;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安銀行股份有限公司,未經平安銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110570309.4/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





