[發(fā)明專利]一種結(jié)合馬爾科夫決策過程的動作知識提取方法在審
| 申請?zhí)枺?/td> | 201710173631.7 | 申請日: | 2017-03-22 |
| 公開(公告)號: | CN106997488A | 公開(公告)日: | 2017-08-01 |
| 發(fā)明(設(shè)計)人: | 呂強(qiáng);李兆榮;李歡 | 申請(專利權(quán))人: | 揚州大學(xué) |
| 主分類號: | G06N99/00 | 分類號: | G06N99/00;G06K9/62 |
| 代理公司: | 南京理工大學(xué)專利中心32203 | 代理人: | 唐代盛 |
| 地址: | 225009 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 結(jié)合 馬爾科夫 決策 過程 動作 知識 提取 方法 | ||
1.一種結(jié)合馬爾科夫決策過程的動作知識提取方法,其特征在于,包括如下步驟:
步驟1:訓(xùn)練隨機(jī)森林模型H;
步驟2:定義動作知識提取問題AKE:針對隨機(jī)森林模型H,對屬性進(jìn)行分割,定義屬性變化、動作,在此基礎(chǔ)上定義動作知識提取問題AKE;
步驟3、用馬爾科夫決策過程求解AKE優(yōu)化問題:對任意輸入數(shù)據(jù),定義馬爾科夫決策過程MDP,并定義策略,通過策略迭代更新策略,最后求解得到一個最優(yōu)策略。
2.如權(quán)利要求1所述的一種結(jié)合馬爾科夫決策過程的動作知識提取方法,其特征在于,步驟1中的訓(xùn)練隨機(jī)森林模型H具體為:
給定一個訓(xùn)練數(shù)據(jù)集,建立一個隨機(jī)森林模型H;定義訓(xùn)練數(shù)據(jù)集為{X,Y},X為輸入數(shù)據(jù)向量集合,Y為輸出類別標(biāo)記集合,通過隨機(jī)采樣和完全分裂建立隨機(jī)森林模型H,隨機(jī)森林模型H的預(yù)測函數(shù)為
其中,為輸入向量,y∈Y,y為隨機(jī)森林模型H在輸入向量為的情況下輸出的預(yù)測分類,c為期望分類目標(biāo),d為第d棵決策樹,D為隨機(jī)森林中決策樹的總棵數(shù),wd為第d棵決策樹的權(quán)重,為第d棵決策樹在輸入的情況下對應(yīng)的輸出,為指示函數(shù),表示在輸入數(shù)據(jù)向量為的情況下輸出的預(yù)測分類為c的概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于揚州大學(xué),未經(jīng)揚州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710173631.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于馬爾科夫模型的進(jìn)程時間片長度確定方法
- 一種利用時空馬爾科夫隨機(jī)場模型的視頻超分辨方法
- 基于馬爾科夫鏈的數(shù)控現(xiàn)場總線時鐘同步抖動修正方法
- 一種基于多實例馬爾科夫模型的行為識別方法
- 一種再入動態(tài)等離子鞘套馬爾科夫信道建模方法
- 一種對冗余系統(tǒng)進(jìn)行可靠性分析的方法
- 一種用可逆單分子反應(yīng)實現(xiàn)馬爾科夫鏈的設(shè)計方法
- 一種基于大數(shù)據(jù)的三維素材推薦方法
- 基于安卓系統(tǒng)的移動設(shè)備老化重生方法
- 一種基于馬爾科夫決策過程的自適應(yīng)系統(tǒng)更新與修復(fù)方法
- 決策協(xié)調(diào)方法、執(zhí)行裝置和決策協(xié)調(diào)器
- 一種基于循環(huán)更新模式的決策樹構(gòu)建方法
- 一種基于群決策的建筑項目決策系統(tǒng)及決策方法
- 一種基于反射弧的智慧大腦決策系統(tǒng)及決策方法
- 一種三維消防指揮決策輔助系統(tǒng)
- 一種決策方法、系統(tǒng)以及電子設(shè)備
- 基于決策引擎和模型平臺的業(yè)務(wù)決策邏輯更新方法
- 一種雙層優(yōu)先級決策系統(tǒng)
- 一種應(yīng)用程序的業(yè)務(wù)執(zhí)行方法、裝置及電子設(shè)備
- 基于區(qū)塊鏈的決策方法及裝置和電子設(shè)備





