[發明專利]一種報價的確定方法、裝置、設備及存儲介質在審
| 申請號: | 202010501337.6 | 申請日: | 2020-06-04 |
| 公開(公告)號: | CN111695967A | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 王蓓蓓;楊朋朋;撖晨宇 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06Q50/06;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 報價 確定 方法 裝置 設備 存儲 介質 | ||
本發明實施例公開了一種報價的確定方法、裝置、設備及存儲介質。該方法包括:獲取目標資源的被測狀態參數和被測資源參數,其中,所述被測資源參數包括至少一個被測報價系數;將所述被測狀態參數和被測資源參數輸入到預先訓練完成的目標報價模型中,得到輸出的目標報價系數和與所述目標報價系數對應的目標收益,其中,所述目標報價模型基于深度強化學習算法訓練得到。本發明實施例通過基于深度強化學習算法訓練目標報價模型,解決了不完全信息影響報價準確度的問題,為目標資源的供應商提供最優的報價決策,以使得供應商的市場收益最大化。
技術領域
本發明實施例涉及電力技術領域,尤其涉及一種報價的確定方法、裝置、設備及存儲介質。
背景技術
在市場環境下,資源供應商為獲得更高的利潤,總是不斷優化自身的投標策略。由于資源供應商對市場環境還不熟悉,且不能掌握完整的市場信息,因此需要完善的報價策略理論作為指導。高效的報價決策工具可以幫助決策人員和報價人員進行一次成功的報價從而獲得高額的收益。除此之外,研究和推演資源供應商的報價行為,還有助于市場的監管機構對資源供應商的行為進行考察,從而識別市場規則中的存在的漏洞,不斷完善市場的政策法規。
由于市場信息對于資源供應商而言并不完全,資源供應商對于自身報價策略的優化具有較大的難度。傳統的資源供應商的報價策略研究方法主要是基于博弈論方法,博弈論方法對于從理論上探討市場成員的最優投標策略以及比較粗略地研究資源供應商的投標行為是很有用的,但由于博弈論方法的固有缺陷使得其實用性不強,因此不適合用來研究完整的投標策略,得到的仿真結果并不準確。
發明內容
本發明實施例提供了一種報價的確定方法、裝置、設備及存儲介質,以目標資源的供應對象提供最優的報價決策,以使得供應對象的市場收益最大化。
第一方面,本發明實施例提供了一種報價的確定方法,該方法包括:
獲取目標資源的被測狀態參數和被測資源參數,其中,所述被測資源參數包括至少一個被測報價系數;
將所述被測狀態參數和被測資源參數輸入到預先訓練完成的目標報價模型中,得到輸出的目標報價系數和與所述目標報價系數對應的目標收益,其中,所述目標報價模型基于深度強化學習算法訓練得到。
第二方面,本發明實施例還提供了一種報價的確定裝置,該裝置包括:
被測資源參數獲取模塊,用于獲取目標資源的被測狀態參數和被測資源參數,其中,所述被測資源參數包括至少一個被測報價系數;
目標報價系數輸出模塊,用于將所述被測狀態參數和被測資源參數輸入到預先訓練完成的目標報價模型中,得到輸出的目標報價系數和與所述目標報價系數對應的目標收益,其中,所述目標報價模型基于深度強化學習算法訓練得到。
第三方面,本發明實施例還提供了一種設備,該設備包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行時,使得所述一個或多個處理器實現上述所涉及的任一所述的報價的確定方法。
第四方面,本發明實施例還提供了一種包含計算機可執行指令的存儲介質,所述計算機可執行指令在由計算機處理器執行時用于執行上述所涉及的任一所述的報價的確定方法。
本發明實施例通過基于深度強化學習算法訓練目標報價模型,解決了不完全信息影響報價準確度的問題,為目標資源的供應商提供最優的報價決策,以使得供應商的市場收益最大化。
附圖說明
圖1是本發明實施例一提供的一種報價的確定方法的流程圖。
圖2是本發明實施例二提供的一種報價的確定方法的流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010501337.6/2.html,轉載請聲明來源鉆瓜專利網。





