[發明專利]基于聚類的城市基礎設施突發事件的檢測方法有效
| 申請號: | 201410525969.0 | 申請日: | 2014-10-08 |
| 公開(公告)號: | CN104299182B | 公開(公告)日: | 2017-12-19 |
| 發明(設計)人: | 張加萬;許冰晗;鄂艷麗;趙雅慧;孫麗婷;馬婧 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/26 |
| 代理公司: | 天津市北洋有限責任專利代理事務所12201 | 代理人: | 李麗萍 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 城市基礎設施 突發事件 檢測 方法 | ||
1.一種基于聚類的城市基礎設施突發事件的檢測方法,其特征在于:
步驟一、利用城市管理服務熱線系統接收市民反映城市基礎設施問題的電話,然后,將該電話內容記錄到一工單數據庫中,所述工單數據庫至少包括以下內容:
工單編號、接收工單的時間、工單反映的問題所涉及到的城市基礎設施的類別、描述該電話所反映的城市基礎設施問題的文本和該電話所反映的城市基礎設施問題的地址;其中,所述工單反映的問題所涉及到的城市基礎設施的類別包括供熱、自來水、燃氣和排水,城市基礎設施問題的地址是層級的;
步驟二、根據接收工單的時間和工單反映的問題所涉及到的城市基礎設施的類別對工單數據庫進行篩選;
使用中文分詞技術對所篩選出的工單提取工單描述的電話所反映的城市基礎設施問題的文本中的語義關鍵詞,所述語義關鍵詞是城市基礎設施問題的原因或結果的詞語;整理對應的語義關鍵詞間的因果關系,用于定義城市基礎設施突發事件在語義內容這一維度上的種類;
使用中文分詞技術對所篩選出的工單提取工單所反映的城市基礎設施問題的地址中的地址關鍵詞,從而提取出工單所反映的城市基礎設施問題的地址的每個層級的地址單元;
步驟三、對步驟二處理后的工單進行語義聚類:
根據工單的語義關鍵詞的提取統計信息和整理的語義關鍵詞間的因果關系把工單歸到匹配的城市基礎設施突發事件語義種類中,從而得到在語義層面上的聚類,包括:
如果工單反映的城市基礎設施問題的文本中包括步驟二確定的某種反映城市基礎設施突發事件的原因的語義關鍵詞,則將該工單歸到這種城市基礎設施突發事件中;
如果工單反映的城市基礎設施問題的文本中同時出現了多個反映不同類別的城市基礎設施突發事件的原因的語義關鍵詞,則將該工單歸到這些城市基礎設施突發事件中含有反映城市基礎設施突發事件的結果的語義關鍵詞最多的城市基礎設施突發事件中;
如果工單反映的城市基礎設施問題的文本中只出現了反映城市基礎設施突發事件的結果的語義關鍵詞X,則在該工單的接收時間的前后2天內找在語義上出現了和上述結果的語義關鍵詞有因果關系的原因的語義關鍵詞的工單,
如果找到的符合條件的工單已經歸到相應的城市基礎設施突發事件中,則把該工單也歸到這種城市基礎設施突發事件中;
如果沒有找到符合條件的工單,則把該工單歸到包含結果的語義關鍵詞X的城市基礎設施突發事件,且該城市基礎設施突發事件是所有包含結果的語義關鍵詞X的城市基礎設施突發事件中優先級最高的城市基礎設施突發事件;城市基礎設施突發事件的優先級是規定城市基礎設施突發事件發生后需要做出反應并解決的緊急程度;
如果工單反映的城市基礎設施問題的文本中沒有任何反映城市基礎設施突發事件的原因或結果的語義關鍵詞,則該條工單在語義上不屬于任何城市基礎設施突發事件;
步驟四、對步驟三中得到的語義層面上的每個聚類進行空間聚類,從而得到在空間層面上的聚類:
遍歷每個聚類中的工單,判斷聚類中有相同的地址關鍵詞的工單的個數是否大于等于3,
當聚類中有相同的地址關鍵詞的工單的個數大于等于3時,則初步認定這些工單的集合成為一個城市基礎設施突發事件;
當聚類中有相同的地址關鍵詞的工單的個數小于3時,定義一個最大經緯度距離D,遍歷該聚類中的所有工單,如果兩條工單的經緯度距離d大于0而小于等于D,則把它們歸為一個空間層面上的聚類;
遍歷后,要求空間層面上的聚類包含的工單的個數大于等于3;否則,舍棄這樣的空間層面上的聚類;
步驟五、對步驟四中得到的空間層面上的每個聚類進行時間聚類,從而得到在時間層面上的聚類:
設定時間聚類中最大的時間尺度為5天,空間層面上的每個聚類中的工單可能在同一天或者相鄰的天數內被接收,統計空間層面上的每個聚類中的所有工單的被接收的時間,得到所有的日期、每個日期對應的出現的次數和接收時間是該日期的所有工單的集合;按照日期出現的次數從大到小對日期排序后得到日期的集合F,遍歷日期的集合F的每個日期Y,
如果日期的集合F中,存在與日期Y相差前后2天內的日期Z,則將空間層面上的聚類中接收時間在日期Y和Z的工單聚在一起,并從日期的集合F將日期Y和日期Z刪除;
如果日期的集合F中,不存在與日期Y相差前后2天內的日期,則遍歷日期的集合F中的下一個日期;
遍歷后,得到在時間層面上的聚類,要求它們包含的工單的個數大于等于3;否則,舍棄這樣的時間層面上的聚類;
步驟六、認定步驟五中得到的時間層面上的聚類是城市基礎設施突發事件,用城市基礎設施突發事件的根節點的可視設計方案在地圖上展示這些城市基礎設施突發事件的分布,即以突發事件根節點為圓心畫一個圓,突發事件根節點的圓圈的不透明度和突發事件中的工單的個數成正比,突發事件根節點的圓圈的灰度反映了突發事件的語義種類,突發事件根節點的圓圈的半徑和突發事件的影響范圍成正比,從而檢測出城市基礎設施突發事件;所述的城市基礎設施突發事件的根節點,是指城市基礎設施突發事件中的第一個所反映的城市基礎設施問題的文本包含反映城市基礎設施突發事件原因或結果的語義關鍵詞的工單。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410525969.0/1.html,轉載請聲明來源鉆瓜專利網。





