[發明專利]聊天數據的審核方法、裝置及計算機設備有效
| 申請號: | 202110390278.4 | 申請日: | 2021-04-12 |
| 公開(公告)號: | CN113132368B | 公開(公告)日: | 2022-11-04 |
| 發明(設計)人: | 王健 | 申請(專利權)人: | 海南晨風科技有限公司 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;H04L51/04;G10L15/22;G06F40/35;G06F40/289 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 570206 海南省??谑旋埲A區*** | 國省代碼: | 海南;46 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聊天 數據 審核 方法 裝置 計算機 設備 | ||
1.一種聊天數據的審核方法,其特征在于,包括:
獲取待審核的聊天數據,并提取所述聊天數據的數據類型;
依據與所述數據類型匹配的信息審核規則審核所述聊天數據,確定第一審核結果,具體包括:
若所述數據類型為文本類型和/或語音類型,則利用第一審核規則審核所述聊天數據,獲取得到第一審核結果;
利用第一審核規則審核所述聊天數據,獲取得到第一審核結果,具體包括:
將所述聊天數據轉換為標準文本;
基于分詞技術將所述標準文本切分為包含各個第一字符的第一字符序列;
在所述第一字符序列中剔除與預設字符匹配的第一字符,得到包含各個第二字符的第二字符序列;
按照所述第二字符序列中的字符順序,依次對預設數量個相鄰的第二字符進行排列組合處理,獲取得到各個待識別文本段;
基于正則表達式對所述待識別文本段進行違禁數據查詢,以得到第一審核結果;
若所述第一審核結果為所述聊天數據中包含違禁數據,則依據所述違禁數據的違禁類別計算所述違禁數據的違禁分值,并基于所述違禁分值確定所述聊天數據的第二審核結果。
2.根據權利要求1所述的方法,其特征在于,所述基于正則表達式對所述待識別文本段進行違禁數據查詢,以得到第一審核結果,具體包括:
將所述待識別文本段與預設違禁詞分別進行音碼匹配和形碼匹配,確定音碼匹配下的第一相似度以及形碼匹配下的第二相似度;
根據所述音碼匹配對應的第一預設權重和所述形碼匹配對應的第二預設權重,計算所述第一相似度和所述第二相似度的加權求和結果;
若判定所述加權求和結果大于第一預設閾值,則將與所述加權求和結果匹配的待識別文本段標記為違禁數據,并輸出所述聊天數據中包含所述違禁數據的第一審核結果。
3.根據權利要求1所述的方法,其特征在于,所述依據所述違禁數據的違禁類別計算所述違禁數據的違禁分值,并基于所述違禁分值確定所述聊天數據的第二審核結果,具體包括:
根據各個違禁類別對應的預設分值、配置權重,以及所述違禁數據在所述聊天數據中的出現頻率,計算所述聊天數據的違禁分值;
基于所述違禁分值劃分所述聊天數據的違禁等級;
輸出所述聊天數據對應所述違禁等級的第二審核結果。
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
根據所述第一審核結果和所述第二審核結果,對所述聊天數據以及發布所述聊天數據的賬號進行風險評估處理。
5.一種聊天數據的審核裝置,其特征在于,包括:
獲取模塊,用于獲取待審核的聊天數據,并提取所述聊天數據的數據類型;
第一確定模塊,用于依據與所述數據類型匹配的信息審核規則審核所述聊天數據,確定第一審核結果,具體包括:
若所述數據類型為文本類型和/或語音類型,則利用第一審核規則審核所述聊天數據,獲取得到第一審核結果;
利用第一審核規則審核所述聊天數據,獲取得到第一審核結果,具體包括:
將所述聊天數據轉換為標準文本;
基于分詞技術將所述標準文本切分為包含各個第一字符的第一字符序列;
在所述第一字符序列中剔除與預設字符匹配的第一字符,得到包含各個第二字符的第二字符序列;
按照所述第二字符序列中的字符順序,依次對預設數量個相鄰的第二字符進行排列組合處理,獲取得到各個待識別文本段;
基于正則表達式對所述待識別文本段進行違禁數據查詢,以得到第一審核結果;
第二確定模塊,用于若所述第一審核結果為所述聊天數據中包含違禁數據,則依據所述違禁數據的違禁類別計算所述違禁數據的違禁分值,并基于所述違禁分值確定所述聊天數據的第二審核結果。
6.一種非易失性可讀存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行時實現權利要求1至4中任一項所述的聊天數據的審核方法。
7.一種計算機設備,包括非易失性可讀存儲介質、處理器及存儲在非易失性可讀存儲介質上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現權利要求1至4中任一項所述的聊天數據的審核方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海南晨風科技有限公司,未經海南晨風科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110390278.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:復合式服裝物品
- 下一篇:基于單張手繪草圖的三維模型生成方法、裝置和電子設備
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





