[發明專利]即時通訊消息識別方法及系統有效
| 申請號: | 202010082692.4 | 申請日: | 2020-02-07 |
| 公開(公告)號: | CN111431791B | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 張鑫 | 申請(專利權)人: | 貝殼找房(北京)科技有限公司 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58;G06N3/04;G06N3/08 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 苗曉靜 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 即時通訊 消息 識別 方法 系統 | ||
本發明實施例提供了一種即時通訊消息識別方法及系統,所述方法首先獲取IM消息;然后將IM消息輸入至神經網絡模型,基于所述神經網絡模型,確定所述IM消息的所屬類別;最后基于所述IM消息的所屬類別,確定是否對所述IM消息進行封禁。本發明實施例中引入神經網絡模型對IM消息的所屬類別進行識別,通過具有多尺度卷積核的卷積層組和Bi?GRU神經網絡層,可以分別提取IM消息的全局特征信息以及局部特征信息,使得基于神經網絡模型確定的IM消息的所屬類別更加準確。
技術領域
本發明涉及信息識別技術領域,更具體地,涉及即時通訊消息識別方法及系統。
背景技術
目前,信息已經滲透到日常生活中的各個角落,用戶接收到的信息也越來越多,例如QQ、短信、微信等常用即時通訊軟件以及商用即時通訊軟件接收到的各種即時通訊信息。
有部分異常用戶(例如微商用戶、黑產用戶、惡意報復他人用戶)通過即時通訊(Instant Messaging,IM)軟件發送廣告或者騷擾信息等垃圾消息,這將給接收用戶造成極大的干擾,例如對于房屋委托中的房產經紀人來說,經常收到垃圾消息將會影響房產經紀人的正常工作,而且房產經紀人極有可能根據接收到的垃圾消息作出作弊、違規、泄漏內部數據等行為。另外,由于房產經紀人在接收到垃圾消息時,一般直接忽略,不會對接收到的垃圾消息進行回復或相應的處理,這將導致房產經紀人的績效指標(如一分鐘響應率,商機轉化率)難以進行考核。因此,識別即時通訊消息是否屬于垃圾消息并對屬于垃圾消息的即時通訊消息進行攔截至關重要。
現有技術中對于即時通訊消息的識別,通常采用如下三種方法實現:1)基于樣本庫中存儲的垃圾消息樣本,采用距離計算公式或simhash算法確定即時通訊消息與樣本庫中存儲的垃圾消息樣本之間的差異程度,根據確定的差異程度識別即時通訊消息是否為垃圾消息;2)采用簡單的敏感詞模糊匹配的方法確定即時通訊消息是否為垃圾消息;3)采用線上行為特征分析等方法直接將頻繁觸發發送消息動作的用戶發送的即時通訊消息判定為垃圾消息并進行攔截。
現有技術中提供的各種即時通訊消息識別方法,均具有識別不準確的缺陷,例如對于方法1),完全依賴于樣本庫中存儲的垃圾消息樣本,而垃圾消息樣本無法窮舉出所有的垃圾消息,所以對于樣本庫中沒有存儲的垃圾消息無法識別;對于方法2),簡單的敏感詞模糊匹配時也會出現由于無法所有的敏感詞而導致無法對未列舉的敏感詞進行識別;對于方法3),頻繁觸發發送消息動作并不意味著就是在發送垃圾消息,因此直接將頻繁觸發發送消息動作的用戶發送的即時通訊消息判定為垃圾消息的方法會有識別錯誤的風險,例如房屋委托中的業主來說,業主在線主動推廣自己房子的行為很容易與微商用戶、黑產用戶刷廣告的行為產生一致性,進而會被攔截造成誤傷。
為此,現急需提供一種即時通訊消息識別方法及系統。
發明內容
為克服上述問題或者至少部分地解決上述問題,本發明實施例提供了一種即時通訊消息識別方法及系統。
第一方面,本發明實施例提供了一種即時通訊消息識別方法,包括:
獲取即時通訊IM消息;
將所述IM消息輸入至神經網絡模型,基于所述神經網絡模型,確定所述IM消息的所屬類別;
基于所述IM消息的所屬類別,確定是否對所述IM消息進行封禁;
其中,所述神經網絡模型基于嵌入層、具有多尺度卷積核的卷積層組和雙向門控循環Bi-GRU神經網絡層構建,所述卷積層組中具有不同尺度的卷積核的每個卷積層以及所述Bi-GRU神經網絡層均分別與所述嵌入層連接;所述神經網絡模型基于樣本庫中的IM消息樣本以及所述IM消息樣本的所屬類別訓練得到。
優選地,所述卷積層組中具有不同尺度的卷積核的卷積層中存在目標卷積層,所述目標卷積層所處的支路上還包括所述卷積層組中與所述目標卷積層的卷積核尺度不同的第一卷積層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貝殼找房(北京)科技有限公司,未經貝殼找房(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010082692.4/2.html,轉載請聲明來源鉆瓜專利網。





