[發明專利]一種預測行為規劃的期望效用的方法無效
| 申請號: | 201210322641.X | 申請日: | 2012-09-03 |
| 公開(公告)號: | CN102867224A | 公開(公告)日: | 2013-01-09 |
| 發明(設計)人: | 毛文吉;王飛躍;曾大軍;李曉晨 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 預測 行為 規劃 期望 效用 方法 | ||
技術領域
本發明屬于計算機科學技術領域,可基于規劃知識自動進行概率推理,并根據個體或組織的行為或狀態觀察給出對其最可能采取的行為及行為意圖的分析結果,以預測行為規劃的期望效用。
背景技術
行為分析方法在國家與社會公共安全、商業管理、決策評估等領域都具有十分重要的應用。以往的行為分析方法主要基于Markov或Bayesian模型,這些模型方法存在計算空間和條件概率表的賦值等一些固有的弱點,使得其應用受到較大的局限。而且,基于Markov和Bayesian方法只能提供行為分析結果,在行為的深層分析和結果的解釋方面都存在較大欠缺。相對于這些傳統的行為分析方法,基于規劃知識的行為分析方法由于采用了明晰的行為知識表示,且不但可以提供行為分析結果,還可以分析個體或組織采取行為的意圖和目標,因此在行為分析結果的可解釋性和豐富程度上較以往方法具有明顯的優勢。
近年來,基于規劃知識的行為意圖分析方法以概率方法為代表。Charniak和Goldman(Artificial?Intelligence,1993)采用貝葉斯推理方法建立了第一個基于規劃知識、用于意圖分析的概率模型。Panadath和Wellman(UAI,2000)提出一種基于PSDGs文法的概率意圖分析方法。Avrahami-Zilberbrand和Kaminka(AAAI,2007)提出一種結合符號規劃識別和觀察者自身偏見的混合意圖分析方法。Geib和Goldman(Artificial?Intelligence,2009)提出一種基于規劃執行模型的概率意圖分析算法。盡管所采用的具體方法各不相同,目前提出的行為意圖分析方法存在著以下不足:
1、以往行為意圖分析方法中均未考慮規劃表示的行為知識間固有的因果聯系,特別是行為與行為前提、行為與行為結果以及行為與行為間的內在關聯,因而所提出的方法中均未結合這些類行為知識進行因果推理;
2、行為意圖分析的過程可以看作是識別被觀察者(個體或組織)的行為決策策略,即通過模擬被觀察者的行為決策策略達到分析識別行為意圖的目的,而以往方法中均未考慮結合行為決策理論進行意圖分析與識別。
發明內容
(一)要解決的技術問題
本發明要解決的技術問題是:給定當前行為或狀態觀察,基于個體或組織行為的規劃知識描述,分析識別被觀察者(個體或組織)最可能采取的行為及其行為意圖。
(二)技術方案
為解決上述技術問題,本發明提出一種預測行為規劃的期望效用的方法,所述行為規劃是指為達到一個目標的行為的集合,該方法根據所觀察到的證據獲得行為規劃的期望效用值,所述方法包括:步驟S1、根據證據計算狀態出現的概率,所述證據指的是對行為和狀態的觀察結果,所述狀態指的是行為的前提和結果的出現情況;步驟S2、根據狀態出現的概率計算行為發生的概率;步驟S3、根據行為出現的概率計算行為結果出現的概率和行為的期望效用值;步驟S4、根據行為結果出現的概率和行為的期望效用值計算行為規劃結果出現的概率和行為規劃的期望效用值。
根據本發明的一種具體實施方式,在所述步驟S1中,當證據E給定,如果觀察到狀態x,則狀態x出現的概率P(x|E)為1;如果觀察到正在執行或已經執行行為A,則行為A的每個行為前提的狀態出現的概率為1;如果觀察到正在執行行為A,則行為A的行為結果e出現的概率為其執行概率Pexecution(A|precondition(A))與該行為的行為結果出現的概率Peffect(e|A)的乘積,precondition(A)表示行為A的前提狀態;如果行為A已經執行完畢,則行為A的行為結果e出現的概率為Peffect(e|A)。
根據本發明的一種具體實施方式,在步驟S2中,當證據E給定,如果觀察到已經執行行為A,則行為A發生的概率P(A|E)為1;如果觀察到正在執行A,則行為A發生的概率P(A|E)等于行為A的執行概率Pexecution(A|precondition(A)),precondition(A)表示行為A的前提狀態;如果沒有觀察到行為A被執行,則行為A出現的概率等于行為A的執行概率與它的每個行為前提(狀態)出現的概率的乘積。
根據本發明的一種具體實施方式,在步驟S3中,行為結果出現的概率等于行為發生的概率與當行為發生時的行為結果出現的概率的乘積;行為的期望效用值等于由該行為的每個行為結果出現的概率及其效用值的乘積的加權。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210322641.X/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





