[發(fā)明專利]實時流式文本分級監(jiān)控方法和裝置有效
| 申請?zhí)枺?/td> | 201710058647.3 | 申請日: | 2017-01-23 |
| 公開(公告)號: | CN106886579B | 公開(公告)日: | 2020-01-14 |
| 發(fā)明(設(shè)計)人: | 張日崇;李晨;蘭天;李建欣;彭浩 | 申請(專利權(quán))人: | 北京航空航天大學(xué) |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06Q50/00 |
| 代理公司: | 11205 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 | 代理人: | 宋揚;劉芳 |
| 地址: | 100191 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 實時 文本 分級 監(jiān)控 方法 裝置 | ||
1.一種實時流式文本分級監(jiān)控方法,其特征在于,包括:
實時獲取流式的短文本;
對所述短文本進行數(shù)據(jù)清洗、數(shù)據(jù)補齊和數(shù)據(jù)過濾處理,生成結(jié)構(gòu)化數(shù)據(jù);
對所述結(jié)構(gòu)化數(shù)據(jù)進行文本分詞處理,獲得K個詞;所述K為大于0的整數(shù);
根據(jù)敏感詞數(shù)據(jù)庫,對所述K個詞進行敏感分析,獲得所述短文本的敏感值;
根據(jù)情感詞數(shù)據(jù)庫,對所述K個詞進行情感分析,獲得所述短文本的情感值;
根據(jù)所述敏感值與所述情感值,獲得所述短文本所屬的用戶的監(jiān)控等級;
其中,所述根據(jù)所述敏感值與所述情感值,獲得所述短文本對應(yīng)的用戶的監(jiān)控等級,包括:
根據(jù)所述敏感值和所述情感值,獲得所述用戶的初始監(jiān)控等級;
根據(jù)所述用戶的歷史短文本,獲得所述用戶的歷史監(jiān)控等級;
根據(jù)所述用戶的初始監(jiān)控等級和所述歷史監(jiān)控等級,獲得所述用戶的監(jiān)控等級。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述用戶的歷史短文本,獲得所述用戶的歷史監(jiān)控等級之前,還包括:
確定所述用戶的初始監(jiān)控等級大于第一預(yù)設(shè)監(jiān)控等級。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
標注所述K個詞的詞性;
根據(jù)所述K個詞的詞性,對所述K個詞進行語義分析;
所述根據(jù)敏感詞數(shù)據(jù)庫,對所述K個詞進行敏感分析,獲得所述短文本的敏感值,包括:根據(jù)敏感詞數(shù)據(jù)庫,對語義分析后的所述K個詞進行敏感分析,獲得所述短文本的敏感值;
所述根據(jù)情感詞數(shù)據(jù)庫,對所述K個詞進行情感分析,獲得所述短文本的情感值,包括:根據(jù)情感詞數(shù)據(jù)庫,對語義分析后的所述K個詞進行情感分析,獲得所述短文本的情感值。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述敏感詞數(shù)據(jù)庫包括以下至少一種:網(wǎng)絡(luò)統(tǒng)計的敏感詞、預(yù)設(shè)的敏感詞;
所述情感詞數(shù)據(jù)庫包括以下至少一種:網(wǎng)絡(luò)統(tǒng)計的情感詞、預(yù)設(shè)的情感詞。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括:
當所述用戶的監(jiān)控等級大于第二預(yù)設(shè)監(jiān)控等級時,獲取所述短文本的M個關(guān)鍵詞;所述M為大于0的整數(shù);
將所述M個關(guān)鍵詞分別添加至所述敏感詞數(shù)據(jù)庫和所述情感詞數(shù)據(jù)庫中。
6.一種實時流式文本分級監(jiān)控裝置,其特征在于,包括:
第一獲取模塊,用于實時獲取流式的短文本;
生成模塊,用于對所述短文本進行數(shù)據(jù)清洗、數(shù)據(jù)補齊和數(shù)據(jù)過濾處理,生成結(jié)構(gòu)化數(shù)據(jù);
分詞模塊,用于對所述結(jié)構(gòu)化數(shù)據(jù)進行文本分詞處理,獲得K個詞;所述K為大于0的整數(shù);
敏感分析模塊,用于根據(jù)敏感詞數(shù)據(jù)庫,對所述K個詞進行敏感分析,獲得所述短文本的敏感值;
情感分析模塊,用于根據(jù)情感詞數(shù)據(jù)庫,對所述K個詞進行情感分析,獲得所述短文本的情感值;
第二獲取模塊,用于根據(jù)所述敏感值與所述情感值,獲得所述短文本所屬的用戶的監(jiān)控等級;
其中,所述第二獲取模塊,包括:
第一獲取子模塊,用于根據(jù)所述敏感值和所述情感值,獲得所述用戶的初始監(jiān)控等級;
第二獲取子模塊,用于根據(jù)所述用戶的歷史短文本,獲得所述用戶的歷史監(jiān)控等級;
第三獲取子模塊,用于根據(jù)所述用戶的初始監(jiān)控等級和所述歷史監(jiān)控等級,獲得所述用戶的監(jiān)控等級。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第二獲取模塊,還包括:
確定子模塊,用于在所述第二獲取子模塊根據(jù)所述用戶的歷史短文本,獲得所述用戶的歷史監(jiān)控等級之前,確定所述用戶的初始監(jiān)控等級大于第一預(yù)設(shè)監(jiān)控等級。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:標注模塊和語義分析模塊;
所述標注模塊,用于標注所述K個詞的詞性;
所述語義分析模塊,用于根據(jù)所述K個詞的詞性,對所述K個詞進行語義分析;
所述敏感分析模塊,具體用于根據(jù)敏感詞數(shù)據(jù)庫,對語義分析后的所述K個詞進行敏感分析,獲得所述短文本的敏感值;
所述情感分析模塊,具體用于根據(jù)情感詞數(shù)據(jù)庫,對語義分析后的所述K個詞進行情感分析,獲得所述短文本的情感值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710058647.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 一種范圍廣、力度大的校內(nèi)監(jiān)控系統(tǒng)
- 一種監(jiān)控的方法及系統(tǒng)
- 設(shè)備的監(jiān)控方法、裝置、系統(tǒng)和空調(diào)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 設(shè)備監(jiān)控方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 風險雷達預(yù)警的監(jiān)控方法及系統(tǒng)
- 區(qū)塊鏈網(wǎng)絡(luò)監(jiān)控系統(tǒng)、裝置及方法
- 基于機器視覺的車站客流安全智能監(jiān)控系統(tǒng)





