[發明專利]基于規則檢索和關鍵詞檢索的化學事故數據挖掘方法有效
| 申請號: | 201810583729.4 | 申請日: | 2018-06-06 |
| 公開(公告)號: | CN110633305B | 公開(公告)日: | 2023-03-28 |
| 發明(設計)人: | 王延平;姜春明 | 申請(專利權)人: | 中國石油化工股份有限公司;中石化安全工程研究院有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/242 |
| 代理公司: | 青島智地領創專利代理有限公司 37252 | 代理人: | 陳海濱 |
| 地址: | 100020 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 規則 檢索 關鍵詞 化學 事故 數據 挖掘 方法 | ||
1.一種基于自定義規則檢索和關鍵詞檢索的化學事故數據挖掘方法,其特征在于,包括以下步驟:
步驟1:數據預處理,用戶登錄化學品事故案例庫,使用邏輯樹分析方法,對原始事故文本信息進行規則處理,描述化學事故的機理和演變歷程,并與事故的文本信息庫關聯在一起,形成基礎數據庫;
步驟2:數據檢索,根據用戶需求,使用多個搜索引擎對基礎數據庫進行檢索,檢索目標事故,生成事故中間表單;搜索引擎包括:
基礎字段檢索:根據一個或多個基礎字段進行一般檢索和高級檢索,篩選事故;
自定義規則檢索:根據用戶需求,按照所建立的邏輯規則,使用自定義規則檢索,在以邏輯樹表述的事故庫中,根據所輸入詞組、句子的相似度篩選出所需的事故組;
自定義關鍵詞檢索:根據用戶需求,使用自定義檢索內容,作為關鍵詞,在以文本表述的事故庫中,反復篩選,找出所需的事故組;
步驟3:數據挖掘,建立一個中間數據庫,將步驟2檢索出的事故中間表單存儲在中間數據庫中,對中間數據庫的事故組進行處理和研究;具體包括以下子步驟:
步驟3.1:對通過預設字段篩選出的事故組,提取特征信息,輸入到統計公式編輯器,使用預先編輯的公式,得出常規統計數據;
步驟3.2:對通過自定義條件,通過自定義規則檢索和關鍵詞檢索兩種方式,對在文本庫和邏輯樹庫中檢索篩選出的事故組進行研究,提取特征字段,歸納關聯關系,再運用小樣本統計對關聯關系進行驗證;
如果關聯關系不成立,則通過總結失敗經驗,重新確定數據挖掘方向,重新定義檢索詞,在基礎數據庫存儲的表單或中間數據庫存儲的事故中間表單中檢索,重復步驟1至3的過程,反復迭代,直至找到關聯關系;
關聯關系確定后,即可確定新的統計字段,返回基礎數據庫,篩選出事故組,提取特征字段,編輯統計公式,得出統計數據;
步驟4:統計結果輸出,統計數據,找出事故新動向和趨勢,并完善數據庫預設字段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油化工股份有限公司;中石化安全工程研究院有限公司,未經中國石油化工股份有限公司;中石化安全工程研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810583729.4/1.html,轉載請聲明來源鉆瓜專利網。





