[發(fā)明專利]一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法有效
| 申請?zhí)枺?/td> | 202010697890.1 | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN111882124B | 公開(公告)日: | 2022-06-07 |
| 發(fā)明(設(shè)計(jì))人: | 熊盛武;陳小英;王盛;陳偉;謝澤豐 | 申請(專利權(quán))人: | 武漢理工大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q50/26;G06N3/04 |
| 代理公司: | 武漢科皓知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 生成 對抗 模仿 學(xué)習(xí) 同質(zhì) 平臺 發(fā)展 效應(yīng) 預(yù)測 方法 | ||
本發(fā)明公開了一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法,首先針對智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)構(gòu)建完整的產(chǎn)業(yè)圖譜,將產(chǎn)業(yè)圖譜內(nèi)的實(shí)體和關(guān)系映射到低維的向量空間;然后構(gòu)建基于生成對抗模仿學(xué)習(xí)的路徑推理模型;接著對路徑鑒別器進(jìn)行訓(xùn)練,使路徑鑒別器能夠盡可能的區(qū)分路徑生成器生成的路徑和路徑采樣器采集的路徑之間的區(qū)別;提取各個區(qū)域的時序經(jīng)濟(jì)指標(biāo)的特征;最后基于路徑生成器生成路徑的語義特征和時序經(jīng)濟(jì)指標(biāo)特征,結(jié)合政策、產(chǎn)業(yè)布局、經(jīng)濟(jì)指標(biāo),在政府同質(zhì)化的引導(dǎo)下對各個區(qū)域的發(fā)展效應(yīng)進(jìn)行預(yù)測。本發(fā)明避免了人為設(shè)計(jì)獎勵函數(shù),以區(qū)域政策、區(qū)域產(chǎn)業(yè)布局、區(qū)域經(jīng)濟(jì)指標(biāo)等多視角方式預(yù)測各個區(qū)域在同質(zhì)化引導(dǎo)下的發(fā)展效應(yīng)。
技術(shù)領(lǐng)域
本發(fā)明屬于生成對抗模仿學(xué)習(xí)與知識圖譜技術(shù)領(lǐng)域,涉及一種發(fā)展效應(yīng)預(yù)測方法,具體涉及一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法,結(jié)合各個區(qū)域的產(chǎn)業(yè)布局,對各個區(qū)域的發(fā)展效應(yīng)進(jìn)行預(yù)測,以求在同質(zhì)化現(xiàn)象下脫穎而出。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,知識圖譜的規(guī)模也日漸龐大。大規(guī)模的知識圖譜在很多應(yīng)用中起到支撐作用,例如問答系統(tǒng)、智能推薦、趨勢預(yù)測等。一個包含產(chǎn)業(yè)結(jié)構(gòu)、產(chǎn)業(yè)分布、產(chǎn)業(yè)分工、產(chǎn)業(yè)內(nèi)企業(yè)關(guān)系等因素的完整湖北省智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)圖譜內(nèi),蘊(yùn)含了各個區(qū)域的產(chǎn)業(yè)布局,以及各個產(chǎn)業(yè)的上中下游關(guān)系。這種產(chǎn)業(yè)布局以及上中下游關(guān)系在產(chǎn)業(yè)圖譜內(nèi)可以以路徑的形式體現(xiàn),基于路徑的知識推理可以通過推理模型在產(chǎn)業(yè)圖譜內(nèi)搜尋需要的路徑。而同質(zhì)平臺發(fā)展效應(yīng)預(yù)測則是在產(chǎn)業(yè)圖譜內(nèi)各種與政策和產(chǎn)業(yè)布局相關(guān)的路徑上,結(jié)合各個區(qū)域的經(jīng)濟(jì)指標(biāo),為各個區(qū)域進(jìn)行發(fā)展效應(yīng)預(yù)測。
常見的路徑推理模型主要包括路徑排序算法RPA和基于強(qiáng)化學(xué)習(xí)的推理模型。PRA算法通過隨機(jī)游走來執(zhí)行多個有界深度優(yōu)先搜索過程以找到關(guān)系路徑,但PRA算法在完全離散的空間中運(yùn)行,難以評估和比較知識圖譜中的相似實(shí)體和關(guān)系。基于強(qiáng)化學(xué)習(xí)的路徑推理模型將推理順序決策問題,并利用強(qiáng)化學(xué)習(xí)(RL)來逐步的進(jìn)行路徑搜索,以求讓代理獲得最大的獎勵。但是這種方法需要針對不同的數(shù)據(jù)集設(shè)計(jì)不同的獎勵函數(shù),常用的終端獎勵函數(shù)也會造成獎勵稀疏問題。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本發(fā)明提出一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法,使用基于生成對抗模仿學(xué)習(xí)的路徑推理模型,將鑒別器提取的生成路徑的語義特征作為代理搜尋路徑的獎勵,從而避免了人為設(shè)計(jì)獎勵函數(shù),并且通過模仿學(xué)習(xí)能夠加快生成器的訓(xùn)練過程。
本發(fā)明所采用的技術(shù)方案是:一種基于生成對抗模仿學(xué)習(xí)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測方法,其特征在于,包括以下步驟:
步驟1:針對智能網(wǎng)聯(lián)汽車產(chǎn)業(yè),構(gòu)建完整的產(chǎn)業(yè)圖譜,使用知識圖譜嵌入模型將產(chǎn)業(yè)圖譜內(nèi)的實(shí)體和關(guān)系映射到低維的向量空間,實(shí)現(xiàn)實(shí)體和關(guān)系的向量化;
其中,使用TransE模型對產(chǎn)業(yè)圖譜內(nèi)的實(shí)體和關(guān)系進(jìn)行表示學(xué)習(xí),將實(shí)體和關(guān)系映射到低維的向量空間,實(shí)現(xiàn)實(shí)體和關(guān)系的向量化,后續(xù)步驟的實(shí)體和關(guān)系均以嵌入向量的方式輸入;
步驟2:構(gòu)建基于生成對抗模仿學(xué)習(xí)的路徑推理模型;
所述路徑推理模型包括路徑生成器、路徑采樣器以及路徑鑒別器;
其中,將基于策略的強(qiáng)化學(xué)習(xí)模型作為路徑生成器,并初始化路徑生成器的圖譜環(huán)境空間,包括狀態(tài)空間St、動作空間At、獎勵函數(shù)R(st);并使用長短期記憶網(wǎng)絡(luò)LSTM和多層感知器MLP構(gòu)建策略網(wǎng)絡(luò),其中長短期記憶網(wǎng)絡(luò)LSTM用于提取代理Agent歷史路徑的路徑歷史特征;策略網(wǎng)絡(luò)的輸出為代理Agent所在的當(dāng)前實(shí)體et的動作空間概率分布,根據(jù)概率分布引導(dǎo)代理Agent進(jìn)行下一步動作;代理Agent在策略網(wǎng)絡(luò)和問題三元組(ehead,r,etail)的引導(dǎo)下,在產(chǎn)業(yè)圖譜上逐步搜尋多視角路徑,為后續(xù)的同質(zhì)平臺發(fā)展效應(yīng)預(yù)測作支撐;其中,ehead和r表示問題的起始實(shí)體和問題關(guān)系,etail表示該問題的答案實(shí)體;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢理工大學(xué),未經(jīng)武漢理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010697890.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 農(nóng)業(yè)信息對抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對抗行為搜索算法
- 面向多種對抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對抗強(qiáng)度的對抗訓(xùn)練方法
- 對抗攻擊模型的訓(xùn)練方法及裝置
- 對抗樣本的生成方法和裝置
- 多樣本對抗擾動生成方法、裝置、存儲介質(zhì)和計(jì)算設(shè)備
- 一種無人集群協(xié)同博弈對抗的控制方法及系統(tǒng)





