[發明專利]一種基于生成對抗模仿學習的同質平臺發展效應預測方法有效
| 申請號: | 202010697890.1 | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN111882124B | 公開(公告)日: | 2022-06-07 |
| 發明(設計)人: | 熊盛武;陳小英;王盛;陳偉;謝澤豐 | 申請(專利權)人: | 武漢理工大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q50/26;G06N3/04 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生成 對抗 模仿 學習 同質 平臺 發展 效應 預測 方法 | ||
1.一種基于生成對抗模仿學習的同質平臺發展效應預測方法,其特征在于,包括以下步驟:
步驟1:針對智能網聯汽車產業,構建完整的產業圖譜,使用知識圖譜嵌入模型將產業圖譜內的實體和關系映射到低維的向量空間,實現實體和關系的向量化;
其中,使用TransE模型對產業圖譜內的實體和關系進行表示學習,將實體和關系映射到低維的向量空間,實現實體和關系的向量化,后續步驟的實體和關系均以嵌入向量的方式輸入;
步驟2:構建基于生成對抗模仿學習的路徑推理模型;
所述路徑推理模型包括路徑生成器、路徑采樣器以及路徑鑒別器;
其中,將基于策略的強化學習模型作為路徑生成器,并初始化路徑生成器的圖譜環境空間,包括狀態空間St、動作空間At、獎勵函數R(st);并使用長短期記憶網絡LSTM和多層感知器MLP構建策略網絡,其中長短期記憶網絡LSTM用于提取代理Agent歷史路徑的路徑歷史特征;策略網絡的輸出為代理Agent所在的當前實體et的動作空間概率分布,根據概率分布引導代理Agent進行下一步動作;代理Agent在策略網絡和問題三元組(ehead,r,etail)的引導下,在產業圖譜上逐步搜尋多視角路徑,為后續的同質平臺發展效應預測作支撐;其中,ehead和r表示問題的起始實體和問題關系,etail表示該問題的答案實體;
路徑采樣器使用BI-BFS算法在產業圖譜中搜索訓練集問題三元組中頭實體和尾實體之間的多條路徑,并將搜索的路徑進行拓撲結構的過濾;其過濾過程是針對每個問題三元組(ehead,r,etail),引入一個關注關系集合Ratt,讓每條路徑的起始關系在關注關系集合之內,以此提高采樣路徑的有效性;
路徑鑒別器使用卷積神經網絡CNN抽取生成路徑的語義特征D(p)或采樣路徑的語義特征D(p),以此區分路徑生成器生成的路徑pg和路徑采樣器采集的路徑pe;使用路徑語義特征D(pg)作為路徑生成器代理Agent的獎勵,并使用REINFORCE算法訓練路徑生成器,讓代理Agen獲得獎勵;
步驟3:對路徑鑒別器進行訓練,使路徑鑒別器能夠區分路徑生成器生成的路徑pg和路徑采樣器采集的路徑pe之間的區別;
步驟4:使用長短期記憶網絡LSTM提取各個區域的時序經濟指標的特征;
步驟5:基于路徑生成器生成路徑的語義特征和時序經濟指標特征,結合政策、產業布局和經濟指標,使用基于生成對抗模仿學習的路徑推理模型對各個區域的發展效應進行預測,其中政策和產業布局以路徑的形式體現。
2.根據權利要求1所述的基于生成對抗模仿學習的同質平臺發展效應預測方法,其特征在于:步驟1中,基于TransE模型,將知識圖譜內的每個知識三元組(h,r,t)中的關系向量看作頭實體向量到尾實體向量的翻譯;通過不斷調整關系向量的值,使得頭實體向量和關系向量之和與尾實體向量相等,即h+r≈t;
TransE模型的目標函數如下所示:
其中,T表示產業圖譜中的知識三元組,T′表示將三元組隨機打亂后的負采樣三元組,h,r,t分別表示T中三元組的頭實體、關系和尾實體,h′,t′分別表示T′中隨機打亂三元組中的頭實體和尾實體;γ為TransE模型中的超參數;L表示TransE模型中的損失函數,通過訓練讓其逐漸變??;d表示距離函數,用來衡量h+r和t之間的距離,在這里
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢理工大學,未經武漢理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010697890.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電器線生產系統
- 下一篇:一種成形編織的柔性傳感開關電路
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





