[發明專利]一種網絡輿情監測方法在審
| 申請號: | 202110600429.4 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113190762A | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 劉強;曹娟;謝添;戴宇 | 申請(專利權)人: | 南京報業集團有限責任公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35;G06F40/289 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 田凌濤 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 輿情 監測 方法 | ||
1.一種網絡輿情監測方法,用于針對目標監控集中的各個網絡賬號實現監控,其特征在于,包括分別針對目標監控集中的各個網絡賬號,按網絡賬號所對應的監測周期時長,周期執行如下步驟:
步驟A.統計當前時刻向歷史時間方向、網絡賬號所對應監測周期時長內,該網絡賬號所發布的所有文檔,并判斷其中是否存在包含敏感分詞的文檔,是則定義該包含敏感分詞的文檔為待處理敏感文檔,待處理敏感文檔中的敏感分詞為待處理敏感分詞,即獲得各待處理敏感文檔分別所對應的各個待處理敏感分詞,并獲得待處理敏感文檔的數量,作為該網絡賬號所對應的敏感發布次數,然后進入步驟B;否則結束本次針對該網絡賬號的監測;
步驟B.基于各待處理敏感文檔所對應的各個待處理敏感分詞,統計其中彼此不同的各個待處理敏感分詞,作為各個非重復待處理敏感分詞,然后進入步驟C;
步驟C.分別針對各非重復待處理敏感分詞,首先獲得非重復待處理敏感分詞所在各待處理敏感文檔中最早發布時間,作為該非重復待處理敏感分詞所對應發布時間,然后查找全網中除目標監控集中各網絡賬號以外范圍內是否存在包含非重復待處理敏感分詞、且發布時間晚于該非重復待處理敏感分詞所對應發布時間的文檔,是則定義滿足該要求的各文檔為傳播文檔,即獲得該非重復待處理敏感分詞所對應的各個傳播文檔;否則該非重復待處理敏感分詞不存在傳播文檔;待完成此步驟關于各非重復待處理敏感分詞的操作后,然后進入步驟D;
步驟D.判斷是否存在對應傳播文檔的非重復待處理敏感分詞,是則針對該各個存在對應傳播文檔的非重復待處理敏感分詞分別所對應的各篇傳播文檔,統計其中彼此不同的各篇傳播文檔,作為各篇非重復傳播文檔,統計非重復傳播文檔的數量,作為該網絡賬號所對應的全網傳播次數;否則定義該網絡賬號所對應的全網傳播次數為0;待完成此步驟的判斷后,進入步驟E;
步驟E.針對該網絡賬號所對應敏感發布次數與全網傳播次數,按分別所對應的預設敏感發布權重、全網傳播權重,執行加權操作,所獲加權結果作為該網絡賬號所對應的傳播指標值,并判斷該傳播指標值是否超過預設傳播指標下限,是則按預設步長比例,減小該網路賬號所對應的監測周期時長;否則結束本次針對該網絡賬號的監測。
2.根據權利要求1所述一種網絡輿情監測方法,其特征在于:所述步驟A包括如下步驟A1至步驟A7;
步驟A1.統計當前時刻向歷史時間方向、網絡賬號所對應監測周期時長內,該網絡賬號所發布的所有文檔,作為各篇待處理文檔,并分別針對各篇待處理文檔進行分詞處理,獲得各篇待處理文檔分別所對應的各個分詞,然后進入步驟A2;
步驟A2.分別針對各篇待處理文檔,統計待處理文檔中彼此不同的各個分詞,作為該待處理文檔所對應的各個非重復分詞,進而獲得各篇待處理文檔分別所對應的各個非重復分詞,然后進入步驟A3;
步驟A3.判斷各篇待處理文檔分別所對應各個非重復分詞中是否存在通用敏感分詞,是則將該各個非重復分詞作為各個待處理通用敏感分詞,并進入步驟A4;否則進入步驟A5;
步驟A4.分別針對各個待處理通用敏感分詞,將待處理通用敏感分詞所在的各篇待處理文檔作為各篇待處理敏感文檔,并進一步分別針對該各篇待處理敏感文檔,計算獲得該待處理通用敏感分詞分別與待處理敏感文檔中其他各個非重復分詞之間的相似度,并選擇其中相似度大于預設相似度閾值的各個非重復分詞,同樣作為待處理通用敏感分詞,即更新該篇待處理敏感文檔所對應的各個待處理通用敏感分詞,并將新增待處理通用敏感分詞加入預設通用敏感詞匯集,更新預設通用敏感詞匯集;進而獲得各篇待處理敏感文檔、以及待處理敏感文檔所對應的各待處理通用敏感分詞,然后進入步驟A5;
步驟A5.判斷各篇待處理文檔分別所對應各個非重復分詞中是否存在領域敏感分詞,是則將該各個非重復分詞作為各個待處理領域敏感分詞,并進入步驟A6;否則進入步驟A7;
步驟A6.分別針對各個待處理領域敏感分詞,將待處理領域敏感分詞所在的各篇待處理文檔作為各篇待處理敏感文檔,并進一步分別針對該各篇待處理敏感文檔,計算獲得該待處理領域敏感分詞分別與待處理敏感文檔中其他各個非重復分詞之間的相似度,并選擇其中相似度大于預設相似度閾值的各個非重復分詞,同樣作為待處理領域敏感分詞,即更新該篇待處理敏感文檔所對應的各個待處理領域敏感分詞,并將新增待處理領域敏感分詞加入預設領域敏感詞匯集,更新預設領域敏感詞匯集;進而獲得各篇待處理敏感文檔、以及待處理敏感文檔所對應的各待處理領域敏感分詞,然后進入步驟A7;
步驟A7.判斷是否存在待處理敏感文檔,是則分別針對各待處理敏感文檔,將待處理敏感文檔所對應的各個待處理領域敏感分詞、各待處理領域敏感分詞,構成該待處理敏感文檔所對應的各個待處理敏感分詞,進而獲得各待處理敏感文檔分別所對應的各個待處理敏感分詞,并獲得待處理敏感文檔的數量,作為該網絡賬號所對應的敏感發布次數,然后進入步驟B;否則結束本次針對該網絡賬號的監測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京報業集團有限責任公司,未經南京報業集團有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110600429.4/1.html,轉載請聲明來源鉆瓜專利網。





