[發明專利]一種基于深度神經網絡的協作頻譜共享智能契約設計方法有效
| 申請號: | 201910097980.4 | 申請日: | 2019-01-31 |
| 公開(公告)號: | CN109982328B | 公開(公告)日: | 2022-09-13 |
| 發明(設計)人: | 趙楠;譚惠文;劉暢;裴一揚;劉聰;曾春艷;賀瀟;劉澤華 | 申請(專利權)人: | 湖北工業大學 |
| 主分類號: | H04W16/10 | 分類號: | H04W16/10;H04W16/14;H04W16/22 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 張火春 |
| 地址: | 430068 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 神經網絡 協作 頻譜 共享 智能 契約 設計 方法 | ||
1.一種基于深度神經網絡的協作頻譜共享智能契約設計方法,其特征在于,針對契約簽訂前后信息和行為隱匿性雙重非對稱動態網絡信息問題,在研究小基站SBSs多階段流量卸載能力類型和流量卸載服務行為的數學模型描述方法的基礎上,通過探索多階段私有信息甄別機制,以規避動態逆向選擇問題;通過設計多階段私有行為激勵策略,以規避動態道德風險行為;并且通過建立神經網絡框架模型,研究實現雙重信息非對稱場景下多階段動態契約優化,所述方法包括如下步驟:
步驟1,多階段動態契約優化問題建模:在雙重非對稱動態網絡信息場景下,建立多階段動態契約優化問題模型;
步驟2,構建動態契約優化的神經網絡模型,并訓練動態契約優化的神經網絡:針對雙重非對稱動態網絡信息場景下多階段動態契約模型的非凸優化求解問題,利用SBSs的私有信息和聲譽信息,通過建立多層神經網絡結構框架,研究雙重信息非對稱場景下多階段動態契約優化設計策略,從而保證多階段協作頻譜共享實現;
步驟1中,所述建立多階段動態契約優化問題模型實現過程包括:
考慮由M個宏基站MBSs、N個小型基站SBSs和若干個隨機分布的移動用戶組成的兩層異構蜂窩網絡,在每階段t契約設計中,MBSs依據SBSs私有能力類型信息和聲譽信息向SBSs提出當前期的契約其中,為固定收益,為收益提成;
引入契約服務矩陣以描述SBSi與MBSj簽訂頻譜共享契約的方式,每一SBS最多只為一個MBS提供流量卸載服務,即
于是,當SBSi提供流量卸載服務時,MBSj獲得的期望效用為SBSi獲得的期望效用為
為了激勵SBSs提供流量卸載服務,協作頻譜共享契約需滿足個人理性(individuallyrational,IR)約束條件,以確保SBSs參與協作所獲得的效用至少不低于其保留效用U0,即
為了激勵SBSs忠實地向MBSs反饋其私有能力類型信息協作頻譜共享契約需滿足激勵相容IC約束條件,以確保私有能力類型信息為的SBSs通過選擇與自身能力類型相匹配的契約條款才能可實現期望效用最大,即
為了激勵SBSs高效地參與流量卸載服務,協作頻譜共享契約需滿足激勵相容約束,以確保每個SBS獲得最大的期望效用,即
由此,雙重非對稱動態網絡信息場景下多階段動態契約優化問題為在滿足上述約束條件下,MBSs總期望效用的最大化:
步驟2中,構建動態契約優化的神經網絡模型,實現過程包括:
在建立多階段動態契約優化問題基礎上,研究基于深度神經網絡的動態契約優化設計方法,以獲得最優的多階段協作頻譜共享契約策略;
在基于深度學習的智能契約機制中,在給定神經網絡模型參數ω的前提下,假設服從先驗分布上述IR約束建模為預期違反IR約束條件,即
上述約束條件(3)建模為預期事后regret,即
于是,從機器學習角度來看,多階段動態契約優化問題能夠描述為在滿足上述約束條件的前提下期望損失函數的最小化,即:
在基于深度神經網絡契約設計框架中,網絡結構由兩個邏輯上不同的組件組成:服務網絡和支付網絡SBSs私有能力類型信息和聲譽信息均作為輸入數據進入網絡的輸入層;服務網絡使用R個全連接的隱藏層建模和1個全連接的輸出層,每個隱藏層采用sigmoidal激活函數,通過softmax激活函數后,輸出契約服務矩陣支付網絡使用T個全連接的隱藏層建模和1個全連接的輸出層,通過ReLU激活函數后輸出固定收益通過softmax激活函數后輸出收益提成
2.根據權利要求1所述的基于深度神經網絡的協作頻譜共享智能契約設計方法,其特征在于:步驟2中,訓練動態契約優化的神經網絡,實現過程包括:
在網絡結構訓練階段,優化問題(8)中的預期損失函數、預期事后regret、預期IR懲罰等數據均由樣本以某種先驗分布產生,于是,預期損失函數用經驗損失函數代替,預期事后被經驗事后代替,預期IR懲罰被經驗IR懲罰代替,訓練優化問題轉化成:
進一步,采用增廣拉格朗日乘子方法解決上述訓練優化問題,通過在拉格朗日函數Cρ(ω;λirv';λrgt')中增加違反約束條件的二次懲罰項:
其中,λirv',λrgt'∈Rn為拉格朗日乘子的向量,ρ>0為二次懲罰項的權重;
在每次迭代中執行以下更新:
選取適當的懲罰參數,以保證增廣拉格朗日方法能夠收斂到優化問題的最優解,并利用Adam算法獲得最小的損失函數,以優化神經網絡的權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業大學,未經湖北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910097980.4/1.html,轉載請聲明來源鉆瓜專利網。





