[發(fā)明專利]基于強化學(xué)習(xí)的云制造服務(wù)組合方法在審
| 申請?zhí)枺?/td> | 202211666315.0 | 申請日: | 2022-12-23 |
| 公開(公告)號: | CN116029662A | 公開(公告)日: | 2023-04-28 |
| 發(fā)明(設(shè)計)人: | 周麗娟;劉文瑾;羅寧;韋冰;張樹東 | 申請(專利權(quán))人: | 海南大學(xué) |
| 主分類號: | G06Q10/10 | 分類號: | G06Q10/10;G06Q50/04;G06Q10/0639;G06Q10/0633;G06N20/00 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 張大威 |
| 地址: | 570228 海南*** | 國省代碼: | 海南;46 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 強化 學(xué)習(xí) 制造 服務(wù) 組合 方法 | ||
1.一種基于強化學(xué)習(xí)的云制造服務(wù)組合方法,其特征在于,包括以下步驟:
通過科技服務(wù)協(xié)同平臺接收來自需求方發(fā)布的項目的任務(wù)請求;
通過STS-協(xié)同服務(wù)評價指標(biāo),對科技服務(wù)協(xié)同平臺中的服務(wù)組合方案進(jìn)行評分;
根據(jù)所述評分利用Q-Learning算法通過無監(jiān)督的方式訓(xùn)練一個學(xué)習(xí)最優(yōu)服務(wù)組合路徑的agent,對所述任務(wù)請求進(jìn)行最佳的組合服務(wù)方案的選擇。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過STS-協(xié)同服務(wù)評價指標(biāo),對科技服務(wù)協(xié)同平臺中的服務(wù)組合方案進(jìn)行評分,包括:
通過需求方在所述科技服務(wù)協(xié)同平臺上發(fā)布定制需求的評價分?jǐn)?shù),以及由專業(yè)人員對云制造服務(wù)組合方案的評價分?jǐn)?shù)以及所述組合服務(wù)方案在科技服務(wù)協(xié)同平臺的交易比例進(jìn)行加權(quán)計算。
3.根據(jù)根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括:
所述STS-協(xié)同服務(wù)綜合評價指標(biāo)的計算方式如以下等式所示:
Score=ω1Savg+ω2S2+ω3S3,
其中,Score是該云制造組合服務(wù)的分?jǐn)?shù),ω1,ω2,ω3是權(quán)重參數(shù),Savg是需求方對該組合服務(wù)中每一個服務(wù)的評價分?jǐn)?shù)的平均值,si是需求方對第i個服務(wù)的評價分?jǐn)?shù),n是組合服務(wù)中服務(wù)的數(shù)量,S2是專家對該云制造組合服務(wù)的評分,S3是該組合服務(wù)在科技服務(wù)協(xié)同平臺中交易次數(shù)比例的得分。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在對科技服務(wù)協(xié)同平臺中的服務(wù)組合方案進(jìn)行評分之后,還包括:
使用天際線運算消除用戶不感興趣的服務(wù)減小組合服務(wù)問題求解的規(guī)模。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述評分利用Q-Learning算法通過無監(jiān)督的方式訓(xùn)練一個學(xué)習(xí)最優(yōu)服務(wù)組合路徑的agent,包括:
任意數(shù)值初始化Q(s,a),并且Q(terminal-state,·)=0
重復(fù):初始化狀態(tài)S;
重復(fù):使用預(yù)定策略,根據(jù)狀態(tài)S選擇一個動作執(zhí)行;
執(zhí)行完成動作后得到reward和新的狀態(tài)S′;
Q(st,At)←Q(st,At)+α[r+γmaxa'Q(s',a')-Q(s,a)];
S←S'
循環(huán)到S終止;
其中,s表示狀態(tài),a表示動作,S表示狀態(tài)集合,A表示動作集合,t表示時刻,r表示回報,Q表示記錄在Q表中的Q值,ε表示衰減因子,γ表示考慮未來獎勵的因子,α表示權(quán)衡上一次學(xué)到結(jié)果和這一次學(xué)習(xí)結(jié)果的量。
6.一種基于強化學(xué)習(xí)的云制造服務(wù)組合裝置,其特征在于,包括以下模塊:
接收模塊,用于通過科技服務(wù)協(xié)同平臺接收來自需求方發(fā)布的項目的任務(wù)請求;
評分模塊,用于通過STS-協(xié)同服務(wù)評價指標(biāo),對科技服務(wù)協(xié)同平臺中的服務(wù)組合方案進(jìn)行評分;
選擇模塊,用于根據(jù)所述評分利用Q-Learning算法通過無監(jiān)督的方式訓(xùn)練一個學(xué)習(xí)最優(yōu)服務(wù)組合路徑的agent,對所述任務(wù)請求進(jìn)行最佳的組合服務(wù)方案的選擇。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述評分模塊,還用于:
通過需求方在所述科技服務(wù)協(xié)同平臺上發(fā)布定制需求的評價分?jǐn)?shù),以及由專業(yè)人員對云制造服務(wù)組合方案的評價分?jǐn)?shù)以及所述組合服務(wù)方案在科技服務(wù)協(xié)同平臺的交易比例進(jìn)行加權(quán)計算。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述評分模塊,還用于:
使用天際線運算消除用戶不感興趣的服務(wù)減小組合服務(wù)問題求解的規(guī)模。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于海南大學(xué),未經(jīng)海南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211666315.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





