[發明專利]一種對相似事件信息進行分析聚合的處理方法及系統在審
| 申請號: | 201611092213.7 | 申請日: | 2016-12-01 |
| 公開(公告)號: | CN106776933A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 陳志飛;周成祖;鄢小征;吳鴻偉 | 申請(專利權)人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/26 |
| 代理公司: | 廈門市精誠新創知識產權代理有限公司35218 | 代理人: | 何家富 |
| 地址: | 361000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相似 事件 信息 進行 分析 聚合 處理 方法 系統 | ||
技術領域
本發明涉及城市公共安全事件管理領域,具體涉及一種對相似事件信息進行分析聚合的處理方法及系統。
背景技術
在城市公共安全管理中,可根據相似事件數量,判定事件的危害性,為領導決策提供數據支撐。而事件來源的多樣化,事件信息錄入的主客觀因素,對相似事件的比對判斷有較大影響,同一事件的描述可能是一句話,也可能是一篇長文,如何將不同來源的事件信息進行比對分析,尋找相似事件信息進行歸并聚合,分析事件趨勢,是個需要探討的問題。
當前對相似事件的比對判斷,常用的方法是通過對事件內容進行相似度的計算,達到一定相似度值即判斷為事件相似,但對于城市公共安全事件,由于所有事件信息主要反映某市內發生或發現的相關事件信息,事件的來源相對比較局限,事件數量較少,采用這種方式計算相似度存在很大誤差。而且地址信息不夠規范化,相同地址信息采用不同的地址描述方式則計算出來的相似度存在很大誤差。
發明內容
本發明在于為解決上述問題而提供一種對相似事件信息進行分析聚合的處理方法及系統,本方法及系統主要針對城市公共安全事件信息,通過地址知識庫提取事件地址信息,根據事件標簽知識庫對事件信息進行打簽,通過比對模型知識庫,計算事件信息的相似度。
本發明一種對相似事件信息進行分析聚合的處理方法,包括如下步驟:
S1:建立事件信息的知識庫的步驟:建立一個包括有地址知識庫、事件標簽知識庫、比對模型庫的知識庫;
S2:對事件信息的地址信息進行提取的步驟:根據步驟S1所建立的地址知識庫,對輸入的事件信息進行地址信息提取,將提取的地址信息標準化;
S3:對事件信息的進行事件分類的步驟:根據步驟S1所建立的事件標簽知識庫,對輸入的事件信息進行分類打簽,且同一事件信息至少標注一個事件標簽;
S4:對事件信息的進行相似比對的步驟:根據步驟S1所建立的比對模型庫,以及根據步驟S2提取的地址信息和步驟S3標注的事件標簽,對輸入的事件信息進行粗篩選,再對粗篩選的事件信息進行逐一比對相似度,最終將該事件信息進行歸類聚合。
進一步的,方法還包括更新事件信息的知識庫的步驟:對知識庫中的地址知識庫、事件標簽知識庫、比對模型庫的更新。
進一步的,S1步驟中,事件標簽知識庫中的事件標簽為多級標簽。
進一步的,S1步驟中,比對模型庫中比對模型根據不同的事件分類有不同的地址匹配規則。
進一步的,若同一事件信息涉及多個地址信息,則將事件信息按多個事件信息分別處理,這多個事件信息都分別進行S2的對事件信息的地址信息進行提取的步驟、S3的對事件信息的進行事件分類的步驟和S4的對事件信息的進行相似比對的步驟。
進一步的,S4步驟包括:
S41:相似事件粗篩選步驟:從比對模型庫中選擇已定義的比對模型,根據提取的事件地址信息、事件標簽信息和事件發生時間區間對輸入事件進行粗篩選,形成相似事件集合;
S42:事件相似比對步驟:對S41步驟中的相似事件集合根據標準化的地址信息和事件標簽逐一比對相似度;
S43:歸類聚合步驟:根據S42步驟的比對結果,進行歸類聚合。
本發明還包括一種對相似事件信息進行分析聚合的處理系統,包括:
建立事件信息的知識庫的模塊:用于建立一個包括有地址知識庫、事件標簽知識庫、比對模型庫的知識庫;
對事件信息的地址信息進行提取的模塊:用于根據建立的地址知識庫,對輸入的事件信息進行地址信息提取,將提取的地址信息標準化;
對事件信息的進行事件分類的模塊:用于根據建立的事件標簽知識庫,對輸入的事件信息進行分類打簽,且同一事件信息至少標注一個事件標簽;
對事件信息的進行相似比對的模塊:用于根據建立的比對模型庫,以及根據提取的地址信息和標注的事件標簽,對輸入的事件信息進行粗篩選,再對粗篩選的事件信息進行逐一比對相似度,最終將該事件信息進行歸類聚合。
本發明的有益效果是:
1.通過抽取出的地址信息和分析事件標簽屬性判斷事件相似性,減少事件其他描述信息對事件相似度判斷產生影響。
2.對抽取地址進行規范化,盡量做到相同地址信息不同的地址描述方式通過地址抽取規范化后的地址是一致的。
附圖說明
圖1為本發明的主要功能模塊圖;
圖2為本發明的主要實現流程圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門市美亞柏科信息股份有限公司,未經廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611092213.7/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





