日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]面向短文本的群體性事件預警方法和系統有效

專利信息
申請號: 201410299114.0 申請日: 2014-06-26
公開(公告)號: CN104091054B 公開(公告)日: 2017-12-05
發明(設計)人: 孫正雅;王桂香;梁倩;郝紅衛 申請(專利權)人: 中國科學院自動化研究所
主分類號: G06F19/00 分類號: G06F19/00;G06F17/27
代理公司: 中科專利商標代理有限責任公司11021 代理人: 宋焰琴
地址: 100190 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 面向 文本 群體性 事件 預警 方法 系統
【說明書】:

技術領域

發明涉及信息安全領域,更具體而言,涉及一種面向短文本的群體性事件的預警方法和系統。

背景技術

我國社會正走向群體性事件多發階段,如相繼發生在西藏拉薩、新疆烏魯木齊、新疆巴楚、云南昆明等地的群體性事件,不僅造成慘痛的人員傷亡,而且帶來巨大的經濟損失和惡劣的社會影響。為了避免或最大限度地化解群體性事件的發生,建立合理有效的預警監測機制開始受到關注和重視,這就需要收集反映輿情動向的相關信息和數據,及時識別出潛在的群體性矛盾并排除警情,而獲取信息是危機預警的前提和源頭。

伴隨互聯網和通信網的日益普及,網絡通信和短消息已經成為人們進行信息發布和交流的重要工具,也成為了解輿情的直接渠道。此狀況下,利用網絡交流平臺自身的特點(即信息長度短、結構復雜以及變形詞多等特點),建立起完善的短文本信息反饋網絡,提前發現潛在的危險因素,為群體性安全事件的應急管理提供及時、準確、全面的信息就顯得迫在眉睫,有著非常重要的現實意義。這其中的關鍵技術就是如何從海量數據中自動甄別有用信息并進行實時跟蹤和預警。

目前有些研究工作根據數據是否包含所關心的敏感詞進行預警,敏感詞庫的制備往往需要人工參與和定時更新,而且這種方法忽視了上下文語境的影響,事實上特定詞匯在不同語境下的語義不盡相同,例如“散步”可以是召集群體性事件的敏感詞,但是在很多語境下,“散步”僅代表人們休閑或鍛煉的一種形式而已。也有研究工作提出自動從數據中提取上下文特征并訓練“詞袋模型”進行描述和預測,該模型假設特征詞之間相互獨立,并不考慮詞序和句法特征,于是嚴重影響預警結果的準確性,例如“民眾鬧事影響社會穩定”,盡管該句中包含敏感詞“民眾”和“鬧事”,但并非蓄意召集非法集會;而且由于一詞多義和多詞一義現象的存在,使得單純將詞匹配得到的類別信息作為判定敏感事件或者同一事件的做法可能導致信息不一致、冗余等問題。從實際的測試效果也容易看出,其信息甄別、跟蹤和預警的準確性、全面性等方面尚存在進一步提升的空間。

發明內容

鑒于以上提出的問題,本發明提出一種面向短文本的結合知識庫的群體性事件預警方法和系統,旨在克服現有技術中存在的上述問題。

具體地,根據本發明的一個方面,提供一種面向短文本的群體性事件預警方法,包括以下步驟:

步驟S3:對短文本進行全局結構化處理和在線聚類,并根據每個“聚類簇”內所包含的短文本數目是否超過給定閾值來決定是否進行及時預警。

優選地,在所述步驟S3之前還包括以下步驟:

步驟S1:基于互聯網和通信網獲取的領域相關語料資源,自動構建面向群體性安全事件的領域知識庫,包括領域本體庫、事實庫、事件庫和規則庫,并實現其半自動化的知識維護和更新;以及

基于步驟S1構建的領域知識庫執行步驟S3。

優選地,所述步驟S1包括以下步驟:

步驟S11:構建領域本體庫,庫中存放了領域概念的層次化組織形式,而且概念之間具有等價關系以及可能的領域關系約束;

步驟S12:構建領域事實庫,庫中存放了經過語義消歧以及實體唯一性標識而得到的結構化元組集合;

步驟S13:構建領域事件庫,包括領域相關詞匯,這些詞匯由行為、施事、受事、修飾、結果、時間和地點等類型組成;

步驟S14:構建領域規則庫,存放了概念元組之間的等價關系及其成立的概率。

進一步優選地,所述步驟S13包括以下步驟:

步驟S131:根據領域特定關鍵詞,依據“共現關系”自動收集領域相關詞匯,并進行手工歸類;

步驟S132:構建時間庫,庫中存放了各類時間詞及其數值編碼,通過識別時間詞并在短文本的發布時間基礎上識別出確切的時間;另外,該庫還包括時區表,表中存放了世界上各個國家的時區;

步驟S133:構建地點庫,庫中按照洲、國家、省、市、縣的上下位層次關系存放了世界各國的著名地區名稱,另外庫中還包括地點結尾詞表,表中存放了常用的地點結尾詞及它們的上下位關系。

優選地,在所述步驟S1和S3之間還包括以下步驟:

步驟S2:結合領域知識庫,對短文本進行局部結構化抽取和在線分類,實現從海量短文本中識別出具有潛在安全隱患的群體性事件相關文本;以及

在步驟S2識別出來的短文本的范圍內執行步驟S3。

優選地,所述步驟S2進一步包括以下步驟:

步驟S21:對待分析的短文本逐句進行預處理,即將漢語進行分詞和詞性標注,并對特殊的詞語序列進行合并與修正;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410299114.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 黄色香港三级三级三级| 国产麻豆91视频| 日韩av在线网| 欧美三级午夜理伦三级中视频| 精品免费久久久久久久苍| 91精品福利在线| 国产欧美一区二区精品性色超碰| 久久一二区| 精品国产免费久久| 一区二区中文字幕在线| 日本伦精品一区二区三区免费| 国产精品一区二区av麻豆| 国产精品国产三级国产播12软件| 性色av香蕉一区二区| 国产亚洲精品久久久456| 精品国产一区二区三区国产馆杂枝| 国产一区二区精华| 国产一区二区在线91| 久久99视频免费| 国产视频一区二区三区四区| 国产午夜一级一片免费播放| av中文字幕一区二区| 日本中文字幕一区| 国内自拍偷拍一区| 午夜伦全在线观看| 亚洲1区在线观看| 精品少妇一区二区三区| 国产一区二区三区小说| 自偷自拍亚洲| 欧美极品少妇xx高潮| 亚洲精品日韩在线| 国偷自产中文字幕亚洲手机在线| 日韩av在线网| 97精品国产97久久久久久免费| 日韩一级精品视频在线观看| 91精品一二区| 国产偷国产偷亚洲清高| 国产精品99久久久久久宅男| 欧美一区二区三区激情| 日韩欧美中文字幕一区| 欧美日韩一区二区三区四区五区六区| 欧美日韩综合一区二区| 国内少妇偷人精品视频免费| 免费超级乱淫视频播放| 国产精品一区不卡| 精品国产仑片一区二区三区| 5g影院天天爽入口入口| 国产免费一区二区三区四区五区| 亚洲精品少妇一区二区| 国产一区二区视频免费在线观看 | 精品在线观看一区二区| 狠狠色噜噜狠狠狠狠2021免费| 国产二区不卡| 国语对白一区二区三区| 久久国产精彩视频| 日韩av三区| 国产一区二区三级| 91社区国产高清| 国产欧美精品一区二区在线播放| 亚洲国产精品综合| 国产午夜精品一区| 国产精品亚洲精品一区二区三区| 国产欧美三区| 日韩av在线影视| 国产69精品久久99不卡免费版| 国产69精品久久久久777| 99精品欧美一区二区三区美图| 欧美在线播放一区| 亚洲1区在线观看| 国产91丝袜在线熟| 日韩精品午夜视频| 日本精品在线一区| 一区二区不卡在线| 欧美二区精品| 精品国产伦一区二区三区| 国产伦精品一区二区三区无广告 | 国产日产精品一区二区| 精品国产乱码久久久久久a丨| 国产一区欧美一区| 综合欧美一区二区三区| 欧美一区二区三区激情视频| 激情久久一区|