[發(fā)明專利]消息數(shù)據(jù)處理方法、裝置、計算機設備和存儲介質有效
| 申請?zhí)枺?/td> | 201810124547.0 | 申請日: | 2018-02-07 |
| 公開(公告)號: | CN108287823B | 公開(公告)日: | 2021-06-29 |
| 發(fā)明(設計)人: | 張澍滋 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F16/335 |
| 代理公司: | 廣州華進聯(lián)合專利商標代理有限公司 44224 | 代理人: | 易皎鶴 |
| 地址: | 518052 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 消息 數(shù)據(jù)處理 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種消息數(shù)據(jù)處理方法、裝置、計算機設備和存儲介質。所述方法包括:在主線程中接收服務器發(fā)送的消息數(shù)據(jù),消息數(shù)據(jù)上攜帶有來源數(shù)據(jù)。將消息數(shù)據(jù)按照分詞邏輯進行拆分得到目標分詞數(shù)據(jù)。將目標分詞數(shù)據(jù)與目標分詞數(shù)據(jù)對應的來源數(shù)據(jù)進行關聯(lián)存儲,目標分詞數(shù)據(jù)對應的來源數(shù)據(jù)與目標分詞數(shù)據(jù)對應消息數(shù)據(jù)上攜帶的來源數(shù)據(jù)相同。在識別線程中查詢目標分詞數(shù)據(jù)中是否存在風險等級大于預設等級的目標分詞數(shù)據(jù)。獲取查詢到的風險等級大于預設等級的目標分詞數(shù)據(jù)對應的來源數(shù)據(jù),并對所獲取到的來源數(shù)據(jù)添加風險標簽。采用本方法能夠無需人工進行監(jiān)控分析,即可在不同線程中處理大量的消息數(shù)據(jù),提高處理效率,提高準確率。
技術領域
本申請涉及計算機技術領域,特別是涉及一種消息數(shù)據(jù)處理方法、裝置、計算機設備和存儲介質。
背景技術
隨著互聯(lián)網(wǎng)科技的發(fā)展,在生活中,用戶可以從網(wǎng)絡上獲取到越來越多的信息,而一些高危信息是由群聊等的方式進行傳播的,例如對某網(wǎng)站舉行的活動,一些不法分子會以群聊等的方式進行交流,從而以低額的付出獲取高額的活動獎勵等,因此,對群聊的消息監(jiān)控是非常重要的。
傳統(tǒng)地,需要人工實時監(jiān)控聊天軟件中的群聊等消息,進而人工分析接收到的群聊消息中是否存在有風險等級大于預設等級的聊天消息,當有大量群聊消息時,則人工分析效率低且可能不準確。
發(fā)明內(nèi)容
基于此,有必要針對上述技術問題,提供一種能夠分析效率高且準確的消息數(shù)據(jù)處理方法、裝置、計算機設備和存儲介質。
一種消息數(shù)據(jù)處理方法,所述方法包括:
在主線程中接收服務器發(fā)送的消息數(shù)據(jù),所述消息數(shù)據(jù)上攜帶有來源數(shù)據(jù);
將所述消息數(shù)據(jù)按照分詞邏輯進行拆分得到目標分詞數(shù)據(jù);
將所述目標分詞數(shù)據(jù)與所述目標分詞數(shù)據(jù)對應的來源數(shù)據(jù)進行關聯(lián)存儲,所述目標分詞數(shù)據(jù)對應的來源數(shù)據(jù)與所述目標分詞數(shù)據(jù)對應消息數(shù)據(jù)上攜帶的來源數(shù)據(jù)相同;
在識別線程中查詢所述目標分詞數(shù)據(jù)中是否存在風險等級大于預設等級的目標分詞數(shù)據(jù);
獲取查詢到的所述風險等級大于預設等級的目標分詞數(shù)據(jù)對應的來源數(shù)據(jù),并對所獲取到的所述來源數(shù)據(jù)添加風險標簽。
在其中一個實施例中,所述將所述消息數(shù)據(jù)按照預設分詞邏輯進行拆分得到目標分詞數(shù)據(jù)的步驟,包括:
獲取預設的多個分詞邏輯,根據(jù)所述預設的多個分詞邏輯對所述消息數(shù)據(jù)進行拆分得到分詞序列;
計算每一個所述分詞序列對應的拆分正確率;
獲取與最大的所述拆分正確率對應的所述分詞序列作為所述目標分詞數(shù)據(jù)。
在其中一個實施例中,所述將所述消息數(shù)據(jù)按照分詞邏輯進行拆分得到目標分詞數(shù)據(jù)的步驟,還包括:
將所述消息數(shù)據(jù)按照分詞邏輯進行拆分得到初始分詞數(shù)據(jù);
將所述初始分詞數(shù)據(jù)與基礎濾鏡庫中的過濾數(shù)據(jù)進行匹配;
當所述初始分詞數(shù)據(jù)與所述過濾數(shù)據(jù)匹配成功時,則提取所述匹配成功的所述初始分詞數(shù)據(jù)對應的所述來源數(shù)據(jù)中的時間數(shù)據(jù);
當所述初始分詞數(shù)據(jù)對應的來源數(shù)據(jù)中的時間數(shù)據(jù)相同時,則獲取所述時間數(shù)據(jù)對應的消息數(shù)據(jù);
接收針對所述消息數(shù)據(jù)的分詞邏輯的添加指令,并根據(jù)所述添加指令添加新的分詞邏輯;
采用所述新的分詞邏輯將所述消息數(shù)據(jù)進行拆分得到目標分詞數(shù)據(jù)。
在其中一個實施例中,所述在識別線程中從所述目標分詞數(shù)據(jù)中查詢風險等級大于預設等級的目標分詞數(shù)據(jù)的步驟,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810124547.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





