[發(fā)明專(zhuān)利]面向短文本的群體性事件預(yù)警方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201410299114.0 | 申請(qǐng)日: | 2014-06-26 |
| 公開(kāi)(公告)號(hào): | CN104091054B | 公開(kāi)(公告)日: | 2017-12-05 |
| 發(fā)明(設(shè)計(jì))人: | 孫正雅;王桂香;梁倩;郝紅衛(wèi) | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)科學(xué)院自動(dòng)化研究所 |
| 主分類(lèi)號(hào): | G06F19/00 | 分類(lèi)號(hào): | G06F19/00;G06F17/27 |
| 代理公司: | 中科專(zhuān)利商標(biāo)代理有限責(zé)任公司11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 文本 群體性 事件 預(yù)警 方法 系統(tǒng) | ||
1.一種面向短文本的群體性事件預(yù)警方法,包括以下步驟:
步驟S1:基于互聯(lián)網(wǎng)和通信網(wǎng)獲取的領(lǐng)域相關(guān)語(yǔ)料資源,自動(dòng)構(gòu)建面向群體性安全事件的領(lǐng)域知識(shí)庫(kù),包括領(lǐng)域本體庫(kù)、事實(shí)庫(kù)、事件庫(kù)和規(guī)則庫(kù),并實(shí)現(xiàn)其半自動(dòng)化的知識(shí)維護(hù)和更新;
步驟S2:結(jié)合領(lǐng)域知識(shí)庫(kù),對(duì)短文本進(jìn)行局部結(jié)構(gòu)化抽取和在線分類(lèi),實(shí)現(xiàn)從海量短文本中識(shí)別出具有潛在安全隱患的群體性事件相關(guān)文本;其中所述步驟S2進(jìn)一步包括以下步驟:
步驟S21:對(duì)待分析的短文本逐句進(jìn)行預(yù)處理,即將漢語(yǔ)進(jìn)行分詞和詞性標(biāo)注,并對(duì)特殊的詞語(yǔ)序列進(jìn)行合并與修正;
步驟S22:基于步驟S21得到的詞語(yǔ)序列,將實(shí)體基于領(lǐng)域本體庫(kù)中的層次化概念空間進(jìn)行概念映射,并同時(shí)對(duì)多義實(shí)體進(jìn)行概念消歧;
步驟S23:基于步驟S22得到的消歧后的詞語(yǔ)序列,根據(jù)漢語(yǔ)基本句式將消歧后的詞語(yǔ)序列進(jìn)行信息抽取,將短文本句子轉(zhuǎn)化為結(jié)構(gòu)化元組表達(dá)形式;
步驟S24:基于步驟S23得到的元組集合,結(jié)合領(lǐng)域知識(shí)庫(kù)獲取當(dāng)前句子的深層語(yǔ)義表示,并用于在線分類(lèi),如分類(lèi)結(jié)果與群體性事件無(wú)關(guān)且未掃描至該短文本的末句,則返回步驟S21,否則分析下一條短文本;其中所述步驟S24進(jìn)一步包括以下步驟:
步驟S241:根據(jù)步驟S23信息抽取得到的結(jié)果,針對(duì)群體性事件文本的特點(diǎn),結(jié)合群體性事件領(lǐng)域知識(shí)庫(kù),對(duì)短文本進(jìn)行知識(shí)泛化、特征提取和特征值計(jì)算;
步驟S242:根據(jù)步驟S241獲取的深層語(yǔ)義特征表示,離線階段利用有標(biāo)注訓(xùn)練集訓(xùn)練二分類(lèi)模型,在線階段根據(jù)分類(lèi)模型進(jìn)行實(shí)時(shí)分類(lèi),最終輸出識(shí)別結(jié)果;
步驟S3:基于步驟S1構(gòu)建的領(lǐng)域知識(shí)庫(kù)對(duì)步驟S2識(shí)別出來(lái)的短文本進(jìn)行全局結(jié)構(gòu)化處理和在線聚類(lèi),并根據(jù)每個(gè)“聚類(lèi)簇”內(nèi)所包含的短文本數(shù)目是否超過(guò)給定閾值來(lái)決定是否進(jìn)行及時(shí)預(yù)警。
2.根據(jù)權(quán)利要求1所述的面向短文本的群體性事件預(yù)警方法,其中所述步驟S1進(jìn)一步包括以下步驟:
步驟S11:構(gòu)建領(lǐng)域本體庫(kù),庫(kù)中存放了領(lǐng)域概念的層次化組織形式,而且概念之間具有等價(jià)關(guān)系以及可能的領(lǐng)域關(guān)系約束;
步驟S12:構(gòu)建領(lǐng)域事實(shí)庫(kù),庫(kù)中存放了經(jīng)過(guò)語(yǔ)義消歧以及實(shí)體唯一性標(biāo)識(shí)而得到的結(jié)構(gòu)化元組集合;
步驟S13:構(gòu)建領(lǐng)域事件庫(kù),包括領(lǐng)域相關(guān)詞匯,這些詞匯由行為、施事、受事、修飾、結(jié)果、時(shí)間和地點(diǎn)組成;
步驟S14:構(gòu)建領(lǐng)域規(guī)則庫(kù),存放了概念元組之間的等價(jià)關(guān)系及其成立的概率。
3.根據(jù)權(quán)利要求2所述的面向短文本的群體性事件預(yù)警方法,其中,所述步驟S13進(jìn)一步包括以下步驟:
步驟S131:根據(jù)領(lǐng)域特定關(guān)鍵詞,依據(jù)“共現(xiàn)關(guān)系”自動(dòng)收集領(lǐng)域相關(guān)詞匯,并進(jìn)行手工歸類(lèi);
步驟S132:構(gòu)建時(shí)間庫(kù),庫(kù)中存放了各類(lèi)時(shí)間詞及其數(shù)值編碼,通過(guò)識(shí)別時(shí)間詞并在短文本的發(fā)布時(shí)間基礎(chǔ)上識(shí)別出確切的時(shí)間;另外,該庫(kù)還包括時(shí)區(qū)表,表中存放了世界上各個(gè)國(guó)家的時(shí)區(qū);
步驟S133:構(gòu)建地點(diǎn)庫(kù),庫(kù)中按照洲、國(guó)家、省、市、縣的上下位層次關(guān)系存放了世界各國(guó)的著名地區(qū)名稱(chēng),另外庫(kù)中還包括地點(diǎn)結(jié)尾詞表,表中存放了常用的地點(diǎn)結(jié)尾詞及它們的上下位關(guān)系。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)科學(xué)院自動(dòng)化研究所,未經(jīng)中國(guó)科學(xué)院自動(dòng)化研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410299114.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專(zhuān)門(mén)適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹(shù)結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋?zhuān)鞍踪|(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 基于視覺(jué)大數(shù)據(jù)驅(qū)動(dòng)的群體性行為分析的視頻監(jiān)控方法
- 面向短文本的群體性事件預(yù)警方法和系統(tǒng)
- 群體性飲水設(shè)備
- 群體性飲水設(shè)備
- 基于多維和參數(shù)動(dòng)態(tài)變動(dòng)的群體極化分析方法
- 社會(huì)群體性事件同步行為的演化方法
- 一種大面積航班延誤情景中旅客群體性事件處置方法
- 一種用于群體性體育活動(dòng)實(shí)時(shí)監(jiān)控分析的方法及系統(tǒng)
- 一種用于群體性風(fēng)險(xiǎn)監(jiān)測(cè)的早期預(yù)警系統(tǒng)及方法
- 一種適用于群體性體育活動(dòng)的實(shí)時(shí)監(jiān)控系統(tǒng)
- 一種事件通訊裝置及方法
- 動(dòng)態(tài)權(quán)重事件處理系統(tǒng)和方法
- 攻擊檢測(cè)裝置和攻擊檢測(cè)方法
- 基于Unity的事件管理方法及系統(tǒng)
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 熱點(diǎn)事件確定方法及裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種樹(shù)狀模型中節(jié)點(diǎn)的連接方法及其模型、計(jì)算機(jī)裝置和可讀存儲(chǔ)介質(zhì)
- 一種事件處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





