[發明專利]數據處理方法、裝置及設備在審
| 申請號: | 202210582554.1 | 申請日: | 2022-05-26 |
| 公開(公告)號: | CN114880489A | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 祝慧佳 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/289;G06F40/30 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 朱文杰 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 設備 | ||
本說明書實施例提供了一種數據處理方法、裝置及設備,其中,該方法包括:獲取待識別的目標對象;若所述目標對象中包含與第一暗語匹配的詞語,則從預先構建的語料庫包含的語料中,獲取與所述目標對象對應的目標語料,所述預先構建的語料庫包括第一語料,所述第一語料為基于第二暗語和目標風險語料構建的風險語料,所述目標風險語料包含與所述第二暗語具有預設關聯關系的風險詞語;基于所述目標對象和所述目標語料的相似度,以及所述目標語料的風險標簽,確定所述目標對象是否為存在風險。
技術領域
本文件涉及數據處理技術領域,尤其涉及一種數據處理方法、裝置及設備。
背景技術
隨著計算機技術的快速發展,網絡服務市場的規模日趨龐大,但網絡服務的不斷發展,也為惡意第三方提供了新的平臺,惡意第三方可以通過具有隱蔽含義的暗語繞過風控防控系統進行違法活動,由于具有隱蔽含義的暗語通常與無風險的詞語的相似度較高,僅通過詞語匹配的方式無法準確的識別出暗語。
可以通過人工基于暗語的上下文,判斷當前場景是否存在風險,但待識別的對象的數據量較大,通過人工判斷的方式的數據處理效率低、數據處理準確性差,這就導致風險防控的效率和準確率低,因此,需要一種能夠在風控場景下,提高針對暗語的風險防控效率和準確率的解決方案。
發明內容
本說明書實施例的目的是提供一種能夠在風控場景下,提高針對暗語的風險防控效率和準確率的解決方案。
為了實現上述技術方案,本說明書實施例是這樣實現的:
第一方面,本說明書實施例提供了一種數據處理方法,包括:獲取待識別的目標對象;若所述目標對象中包含與第一暗語匹配的詞語,則從預先構建的語料庫包含的語料中,獲取與所述目標對象對應的目標語料,所述預先構建的語料庫包括第一語料,所述第一語料為基于第二暗語和目標風險語料構建的風險語料,所述目標風險語料包含與所述第二暗語具有預設關聯關系的風險詞語;基于所述目標對象和所述目標語料的相似度,以及所述目標語料的風險標簽,確定所述目標對象是否為存在風險。
第二方面,本說明書實施例提供了一種數據處理裝置,包括:對象獲取模塊,用于獲取待識別的目標對象;語料獲取模塊,用于若所述目標對象中包含與第一暗語匹配的詞語,則從預先構建的語料庫包含的語料中,獲取與所述目標對象對應的目標語料,所述預先構建的語料庫包括第一語料,所述第一語料為基于第二暗語和目標風險語料構建的風險語料,所述目標風險語料包含與所述第二暗語具有預設關聯關系的風險詞語;風險確定模塊,用于基于所述目標對象和所述目標語料的相似度,以及所述目標語料的風險標簽,確定所述目標對象是否為存在風險。
第三方面,本說明書實施例提供了一種數據處理設備,所述數據處理設備包括:處理器;以及被安排成存儲計算機可執行指令的存儲器,所述可執行指令在被執行時使所述處理器:獲取待識別的目標對象;若所述目標對象中包含與第一暗語匹配的詞語,則從預先構建的語料庫包含的語料中,獲取與所述目標對象對應的目標語料,所述預先構建的語料庫包括第一語料,所述第一語料為基于第二暗語和目標風險語料構建的風險語料,所述目標風險語料包含與所述第二暗語具有預設關聯關系的風險詞語;基于所述目標對象和所述目標語料的相似度,以及所述目標語料的風險標簽,確定所述目標對象是否為存在風險。
第四方面,本說明書實施例提供了一種存儲介質,所述存儲介質用于存儲計算機可執行指令,所述可執行指令在被執行時實現以下流程:獲取待識別的目標對象;若所述目標對象中包含與第一暗語匹配的詞語,則從預先構建的語料庫包含的語料中,獲取與所述目標對象對應的目標語料,所述預先構建的語料庫包括第一語料,所述第一語料為基于第二暗語和目標風險語料構建的風險語料,所述目標風險語料包含與所述第二暗語具有預設關聯關系的風險詞語;基于所述目標對象和所述目標語料的相似度,以及所述目標語料的風險標簽,確定所述目標對象是否為存在風險。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210582554.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全自動化學發光免疫分析儀器
- 下一篇:一種鋰離子電池溫熵系數測量方法





