[發明專利]基于深度學習的目標產品確定方法、裝置、設備和介質在審
| 申請號: | 202110846693.6 | 申請日: | 2021-07-26 |
| 公開(公告)號: | CN113538105A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 徐瑩雪 | 申請(專利權)人: | 平安資產管理有限責任公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06N3/04;G06N3/08 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 姜曉云 |
| 地址: | 200135 上海市浦東新區自*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 目標 產品 確定 方法 裝置 設備 介質 | ||
本申請涉及人工智能領域,尤其是一種基于深度學習的目標產品確定方法、裝置、設備和介質。所述方法包括:獲取當前產品數據;將所述當前產品數據輸入至深度強化學習模型中得到目標產品和所述目標產品的目標分配結果;獲取與所述當前產品數據對應的歷史產品數據;根據所述歷史產品數據判斷所述深度強化學習模型是否符合要求;當所述深度強化學習模型符合要求時,輸出所述目標產品和所述目標產品的目標分配結果。采用本方法能夠提高智能化水平。此外,本發明還涉及區塊鏈技術,深度強化學習模型、產品數據可存儲于區塊鏈節點中。
技術領域
本申請涉及人工智能技術領域,特別是涉及一種基于深度學習的目標產品確定方法、裝置、設備和介質。
背景技術
隨著計算機技術的發展,越來越多的產品可以在網上進行購買,但是在購買的時候。用戶希望自己所購買的產品可以實現最大的收益。
傳統技術中,為了實現所購買的產品的收益最大化,用戶需要根據產品數據來進行計算,一般地,用戶獲取到產品數據,然后根據其中一個規則進行產品收益的估計,最后獲取估計的收益最大的產品進行購買,但是這種方式一方面用戶所選取的規則是否適用于所要購買的產品并不知道,另外一方面通過該規則進行計算時對應的產品中是否存在對應的計算數據也無法確定,因此最后所得到的目標產品的準確性有待商榷。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠提高智能化水平的基于深度學習的目標產品確定方法、裝置、設備和介質。
一種基于深度學習的目標產品確定方法,所述方法包括:
獲取當前產品數據;
將所述當前產品數據輸入至深度強化學習模型中得到目標產品和所述目標產品的目標分配結果;
獲取與所述當前產品數據對應的歷史產品數據;
根據所述歷史產品數據判斷所述深度強化學習模型是否符合要求;
當所述深度強化學習模型符合要求時,輸出所述目標產品和所述目標產品的目標分配結果。
在其中一個實施例中,所述根據所述歷史產品數據判斷所述深度強化學習模型是否符合要求,包括:
計算在標準分配下所述歷史產品數據對應的標準收益率,以及在所述歷史產品數據通過所述深度強化學習模型計算得到的參考分配結果下對應的參考收益率和參考超額收益率;
獲取待選擇分配結果,分別計算所述待選擇分配結果下所述歷史產品數據對應的對照超額收益率;
當所述參考收益率高于所述標準收益率,且所述參考超額收益率高于所述對照超額收益率的中位數時,所述深度強化學習模型符合要求,否則所述深度強化學習模型不符合要求。
在其中一個實施例中,所述根據所述歷史產品數據判斷所述深度強化學習模型是否符合要求之后,還包括:
當所述深度強化學習模型不符合要求時,則獲取并輸出所述超額收益率最高的所述待分配結果。
在其中一個實施例中,所述將所述當前產品數據輸入至深度強化學習模型中得到目標產品和所述目標產品的目標分配結果,包括:
獲取時間序列長度,根據所述時間序列長度以及所述當前產品數據計算得到數據序列;
將所述數據序列輸入至包括用于提取時序特征的第一特征抽取網絡中的到第一狀態特征;
根據所述第一狀態特征計算得到目標產品和所述目標產品的目標分配結果。
在其中一個實施例中,所述輸出所述目標產品和所述目標產品的目標分配結果之后,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安資產管理有限責任公司,未經平安資產管理有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110846693.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種測量輪裝置及軌檢小車
- 下一篇:一種陶瓷飾面磚背膠粘結性能的檢測方法





