[發(fā)明專利]一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法有效

申請?zhí)枺?/td>	202010697890.1	申請日：	2020-07-20
公開（公告）號：	CN111882124B	公開（公告）日：	2022-06-07
發(fā)明（設(shè)計(jì)）人：	熊盛武;陳小英;王盛;陳偉;謝澤豐	申請（專利權(quán)）人：	武漢理工大學(xué)
主分類號：	G06Q10/04	分類號：	G06Q10/04;G06Q10/06;G06Q50/26;G06N3/04
代理公司：	武漢科皓知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222	代理人：	魏波
地址：	430070 湖***	國省代碼：	湖北;42
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于生成對抗模仿學(xué)習(xí) 同質(zhì) 平臺發(fā)展效應(yīng) 預(yù)測方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法，首先針對智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)構(gòu)建完整的產(chǎn)業(yè)圖譜，將產(chǎn)業(yè)圖譜內(nèi)的實(shí)體和關(guān)系映射到低維的向量空間；然后構(gòu)建基于生成對抗模仿學(xué)習(xí)的路徑推理模型；接著對路徑鑒別器進(jìn)行訓(xùn)練，使路徑鑒別器能夠盡可能的區(qū)分路徑生成器生成的路徑和路徑采樣器采集的路徑之間的區(qū)別；提取各個區(qū)域的時序經(jīng)濟(jì)指標(biāo)的特征；最后基于路徑生成器生成路徑的語義特征和時序經(jīng)濟(jì)指標(biāo)特征，結(jié)合政策、產(chǎn)業(yè)布局、經(jīng)濟(jì)指標(biāo)，在政府同質(zhì)化的引導(dǎo)下對各個區(qū)域的發(fā)展效應(yīng)進(jìn)行預(yù)測。本發(fā)明避免了人為設(shè)計(jì)獎勵函數(shù)，以區(qū)域政策、區(qū)域產(chǎn)業(yè)布局、區(qū)域經(jīng)濟(jì)指標(biāo)等多視角方式預(yù)測各個區(qū)域在同質(zhì)化引導(dǎo)下的發(fā)展效應(yīng)。

技術(shù)領(lǐng)域

本發(fā)明屬于生成對抗模仿學(xué)習(xí)與知識圖譜技術(shù)領(lǐng)域，涉及一種發(fā)展效應(yīng)預(yù)測方法，具體涉及一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法，結(jié)合各個區(qū)域的產(chǎn)業(yè)布局，對各個區(qū)域的發(fā)展效應(yīng)進(jìn)行預(yù)測，以求在同質(zhì)化現(xiàn)象下脫穎而出。

背景技術(shù)

隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展，知識圖譜的規(guī)模也日漸龐大。大規(guī)模的知識圖譜在很多應(yīng)用中起到支撐作用，例如問答系統(tǒng)、智能推薦、趨勢預(yù)測等。一個包含產(chǎn)業(yè)結(jié)構(gòu)、產(chǎn)業(yè)分布、產(chǎn)業(yè)分工、產(chǎn)業(yè)內(nèi)企業(yè)關(guān)系等因素的完整湖北省智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)圖譜內(nèi)，蘊(yùn)含了各個區(qū)域的產(chǎn)業(yè)布局，以及各個產(chǎn)業(yè)的上中下游關(guān)系。這種產(chǎn)業(yè)布局以及上中下游關(guān)系在產(chǎn)業(yè)圖譜內(nèi)可以以路徑的形式體現(xiàn)，基于路徑的知識推理可以通過推理模型在產(chǎn)業(yè)圖譜內(nèi)搜尋需要的路徑。而同質(zhì)平臺發(fā)展效應(yīng)預(yù)測則是在產(chǎn)業(yè)圖譜內(nèi)各種與政策和產(chǎn)業(yè)布局相關(guān)的路徑上，結(jié)合各個區(qū)域的經(jīng)濟(jì)指標(biāo)，為各個區(qū)域進(jìn)行發(fā)展效應(yīng)預(yù)測。

常見的路徑推理模型主要包括路徑排序算法RPA和基于強(qiáng)化學(xué)習(xí)的推理模型。PRA算法通過隨機(jī)游走來執(zhí)行多個有界深度優(yōu)先搜索過程以找到關(guān)系路徑，但PRA算法在完全離散的空間中運(yùn)行，難以評估和比較知識圖譜中的相似實(shí)體和關(guān)系。基于強(qiáng)化學(xué)習(xí)的路徑推理模型將推理順序決策問題，并利用強(qiáng)化學(xué)習(xí)(RL)來逐步的進(jìn)行路徑搜索，以求讓代理獲得最大的獎勵。但是這種方法需要針對不同的數(shù)據(jù)集設(shè)計(jì)不同的獎勵函數(shù)，常用的終端獎勵函數(shù)也會造成獎勵稀疏問題。

發(fā)明內(nèi)容

為了解決上述技術(shù)問題，本發(fā)明提出一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法，使用基于生成對抗模仿學(xué)習(xí)的路徑推理模型，將鑒別器提取的生成路徑的語義特征作為代理搜尋路徑的獎勵，從而避免了人為設(shè)計(jì)獎勵函數(shù)，并且通過模仿學(xué)習(xí)能夠加快生成器的訓(xùn)練過程。

本發(fā)明所采用的技術(shù)方案是：一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法，其特征在于，包括以下步驟：

步驟1：針對智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)，構(gòu)建完整的產(chǎn)業(yè)圖譜，使用知識圖譜嵌入模型將產(chǎn)業(yè)圖譜內(nèi)的實(shí)體和關(guān)系映射到低維的向量空間，實(shí)現(xiàn)實(shí)體和關(guān)系的向量化；

其中，使用TransE模型對產(chǎn)業(yè)圖譜內(nèi)的實(shí)體和關(guān)系進(jìn)行表示學(xué)習(xí)，將實(shí)體和關(guān)系映射到低維的向量空間，實(shí)現(xiàn)實(shí)體和關(guān)系的向量化，后續(xù)步驟的實(shí)體和關(guān)系均以嵌入向量的方式輸入；

步驟2：構(gòu)建基于生成對抗模仿學(xué)習(xí)的路徑推理模型；

所述路徑推理模型包括路徑生成器、路徑采樣器以及路徑鑒別器；

其中，將基于策略的強(qiáng)化學(xué)習(xí)模型作為路徑生成器，并初始化路徑生成器的圖譜環(huán)境空間，包括狀態(tài)空間S_t、動作空間A_t、獎勵函數(shù)R(s_t)；并使用長短期記憶網(wǎng)絡(luò)LSTM和多層感知器MLP構(gòu)建策略網(wǎng)絡(luò)，其中長短期記憶網(wǎng)絡(luò)LSTM用于提取代理Agent歷史路徑的路徑歷史特征；策略網(wǎng)絡(luò)的輸出為代理Agent所在的當(dāng)前實(shí)體e_t的動作空間概率分布，根據(jù)概率分布引導(dǎo)代理Agent進(jìn)行下一步動作；代理Agent在策略網(wǎng)絡(luò)和問題三元組(e_head,r,e_tail)的引導(dǎo)下，在產(chǎn)業(yè)圖譜上逐步搜尋多視角路徑，為后續(xù)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測作支撐；其中，e_head和r表示問題的起始實(shí)體和問題關(guān)系，e_tail表示該問題的答案實(shí)體；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢理工大學(xué)，未經(jīng)武漢理工大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010697890.1/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：電器線生產(chǎn)系統(tǒng)
下一篇：一種成形編織的柔性傳感開關(guān)電路

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法；其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政；管理
G06Q10-02 .預(yù)定，例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化，例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理，例如組織、規(guī)劃、調(diào)度或分配時間、人員或機(jī)器資源；企業(yè)規(guī)劃；組織模型
G06Q10-08 .物流，例如倉儲、裝貨、配送或運(yùn)輸；存貨或庫存管理，例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化，例如電子郵件或群件的計(jì)算機(jī)輔助管理

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】