[發明專利]一種基于隨機森林的航空安全因果預測方法有效
| 申請號: | 202011111711.8 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112257914B | 公開(公告)日: | 2023-06-06 |
| 發明(設計)人: | 任博;崔利杰;劉嘉;王強;史越;胡良謀;李大偉;劉超;苗卓廣;周之;王新河 | 申請(專利權)人: | 中國人民解放軍空軍工程大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/0635;G06Q10/067;G06Q50/30;G06N7/01;G06F18/2113;G06F18/214;G06F18/2431;G06F18/27 |
| 代理公司: | 西安研創天下知識產權代理事務所(普通合伙) 61239 | 代理人: | 楊鳳娟 |
| 地址: | 710051 陜西*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隨機 森林 航空安全 因果 預測 方法 | ||
1.一種基于隨機森林的航空安全因果預測方法,其特征在于,包括以下步驟,
S1:利用航空公司的原始安全數據庫,構建基于Bow-tie模型的航空安全致因變量關聯辨識模型,確定航空安全不安全事件的關鍵致因變量;
S2:根據步驟S1中確定的關鍵致因變量,建立航空安全規模數據采集清單,標簽原始安全數據庫中的不安全事件數據特征;
S3:對步驟S2中不安全事件數據特征,考慮特定安全輸出的特征約簡,實現降維處理,得到航空公司的不安全事件建模數據;
S4:以隨機森林模型結合特征選舉和樣本抽樣法從步驟S3中得到的不安全事件建模數據中得到訓練和測試樣本子集,構建基于隨機森林模型的航空安全態勢預測模型;
S5:結合航空公司的原始安全數據庫,對航空安全態勢預測模型的預測能力進行評價;
S6:根據致因變量對航空安全態勢預測結果的影響分析,對關鍵致因變量對航空安全不安全事件的貢獻進行排序;
步驟S1的具體操作包括,
S11:利用航空公司的原始安全數據庫,確定航空安全不安全事件的致因變量X=(x1,x2,…,xm)和對應的不同類型航空安全不安全事件Y=(y1,y2,…,yn),Y=G(X),其中,Y=(y1,y2,…,yn)表示n種不同類型的航空安全不安全事件,X=(x1,x2,…,xm)表示導致航空安全不安全事件的致因變量;
S12:將航空安全不安全事件的致因變量、可能后果及相應的控制措施與Bow-tie模型的基本事件BE、中間事件IE、頂事件CE、控制事件SE和后果事件OE一一對應;其中,航空安全不安全事件的致因變量對應Bow-tie模型的基本事件BE,航空安全不安全事件的控制措施對應Bow-tie模型的控制事件SE,航空安全不安全事件的可能后果對應Bow-tie模型的后果事件OE,航空安全不安全事件的可能后果的上一級輕微后果對應Bow-tie模型的中間事件IE;
S13:令每個基本事件發生的概率為pBE,考慮存在一個分支能夠導致第i個后果事件OEi發生的可能性,假設第m個分支上k個控制事件發生的概率為則第m個分支的后果事件發生的概率為
式中,當某一分支上環節事件發生時,當環節事件不發生時,
S14:根據步驟S13的結果,將后果事件OEi的發生概率表示為n個基本事件與m個后果事件發生概率的函數,也即航空安全致因變量關聯辨識模型,
S15:基于步驟S14中建立的航空安全致因變量關聯辨識模型,從致因變量中確定航空安全不安全事件的關鍵致因變量;
步驟S3的具體操作包括,
S31:利用互信息原理定義致因變量X與航空安全不安全事件Y之間的互信息式中,I(x,y)表示致因變量X與航空安全不安全事件Y之間的互信息;f(x,y)是致因變量X與航空安全不安全事件Y聯合概率密度函數,f(x)和f(y)是致因變量X與航空安全不安全事件Y邊緣概率密度函數;
S32:對于任何一組樣本大小為N的多元數據序列(X,Y),的計算方法為
S33:利用核密度估計結合低偏差確定抽樣方法求解致因變量X與航空安全不安全事件Y之間的互信息;
S34:根據步驟S33中求解得到的互信息,確定致因變量X與航空安全不安全事件Y之間的因果關系強弱,根據致因變量X與航空安全不安全事件Y之間的因果關系強弱得到航空公司的不安全事件建模數據;
步驟S4的具體操作包括,
S41:對所有的不安全事件建模數據進行歸一化處理;
S42:通過有放回地隨機抽樣,從歸一化處理后的不安全事件建模數據中有放回重復抽樣得K個與不安全事件建模數據相等的訓練樣本N,根據訓練樣本構成決策樹;
S43:對每棵決策樹上每個分裂節點隨機抽取所有致因變量中的Mtry個變量作為當前節點分裂的特征子集,根據分類回歸樹方法在特征子集中選擇最優分裂方式進行分裂;
S44:計算輸入變量xj(j=1,2,3,…,h)在第k棵樹上的重要性
式中,h為輸入的致因變量的個數,NOOB為袋外數據樣本數,fk(xn)為袋外數據第n個樣本值,fk(x′n)為隨機置換變量后第k棵樹上袋外數據第n個樣本估測值;I(·)為判別函數,當fk(xn)=fk(x′n)時I(·)取值為1,否則為0;
S45:計算輸入變量xj在整個隨機森林中的重要性得分
S46:將輸入變量xj多次求得的重要性得分取平均值,得到各致因變量的權重;
S47:對回歸航空安全態勢預測模型參數進行優化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍空軍工程大學,未經中國人民解放軍空軍工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011111711.8/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





