[發明專利]一種文本審核方法、裝置、計算機設備及可讀存儲介質有效
| 申請號: | 202010116229.7 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111274782B | 公開(公告)日: | 2023-10-20 |
| 發明(設計)人: | 張晶瑩;羅先賢 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/186 | 分類號: | G06F40/186;G06F40/226;G06F40/258;G06F16/35 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 程超 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 審核 方法 裝置 計算機 設備 可讀 存儲 介質 | ||
1.一種文本審核方法,其特征在于,所述方法包括:
接收用戶終端發送來的待審核文本,并將所述待審核文本與多個文本類型的文本模板進行文本結構的匹配,以確定出所述待審核文本的文本類型;
從預設的分類模型庫中獲取與所述文本類型對應的分類模型,利用所述分類模型將所述待審核文本拆分為多個審核片段,并為每個審核片段添加對應的主題標簽;
根據每個審核片段的主題標簽,從與所述文本類型對應的規則庫中分別獲取與各個主題標簽對應的審核規則;
根據所述審核規則,判斷在對應的審核片段中是否存在風險要素內容,若是,則將所述風險要素內容發送至所述用戶終端,以進行風險提示。
2.根據權利要求1所述的文本審核方法,其特征在于,在所述從預設的分類模型庫中獲取與所述文本類型對應的分類模型,利用所述分類模型將所述待審核文本拆分為多個審核片段,并為每個審核片段添加對應的主題標簽之前,所述方法還包括:
針對一種文本類型,獲取與所述文本類型對應的訓練樣本集;其中,所述訓練樣本集包括:設定數量的歷史文本、每個歷史文本的片段信息以及每個片段的主題標簽;
根據所述訓練樣本集中的各個歷史文本所包含的主題標簽,將包含在所有歷史文本中的主題標簽確定為所述文本類型的必要主題標簽;
根據所述訓練樣本集對預設模型進行訓練學習,以得到與所述文本類型對應的分類模型。
3.根據權利要求2所述的文本審核方法,其特征在于,所述根據所述訓練樣本集對預設模型進行訓練學習,以得到與所述文本類型對應的分類模型,具體包括:
針對所述訓練樣本集中的一個主題標簽,獲取各個歷史文本中的與所述主題標簽對應的片段;對獲取到的每個片段進行分詞處理,并提取出每個片段的名詞;從所有片段的名詞中確定出用于代表所述主題標簽的設定數量的顯著名詞,并計算出每個顯著名詞的顯著系數,以形成與所述主題標簽對應的顯著詞集合;
匯聚所述訓練樣本集中的各個主題標簽的顯著詞集合,作為與所述文本類型對應的分類模型。
4.根據權利要求3所述的文本審核方法,其特征在于,所述利用所述分類模型將所述待審核文本拆分為多個審核片段,并為每個審核片段添加對應的主題標簽,具體包括:
確定出包含在所述待審核文本中的各個標題,并根據確定出的各個標題將所述待審核文本拆分為多個審核片段;其中,每個審核片段包括:標題部分和正文部分;
分別對每個審核片段進行分詞處理,并提取出每個審核片段的名詞;
針對一個審核片段,分別從每個顯著詞集合中確定出目標顯著詞,其中,所述目標顯著詞為同時出現在顯著詞集合和所述審核片段中的名詞;根據每個顯著詞集合中的目標顯著詞的顯著系數,計算出每個顯著詞集合的顯著系數總和;并將顯著系數總和最大的顯著詞集合所對應的主題標簽添加到所述審核片段上。
5.根據權利要求2所述的文本審核方法,其特征在于,所述根據每個審核片段的主題標簽,從與所述文本類型對應的規則庫中分別獲取與各個主題標簽對應的審核規則,具體包括:
判斷在所述待審核文本的所有主題標簽中是否包含所述文本類型的所有必要主題標簽;若是,則根據每個審核片段的主題標簽,從與所述文本類型對應的規則庫中分別獲取與各個主題標簽對應的審核規則;若否,則將包含缺少的必要主題標簽的信息發送至所述用戶終端。
6.根據權利要求1所述的文本審核方法,其特征在于,所述審核規則包括:審核要素和審核子規則,且一個審核要素對應一個審核子規則;
所述根據所述審核規則,判斷在對應的審核片段中是否存在風險要素內容,若是,則將所述風險要素內容發送至所述用戶終端,以進行風險提示,具體包括:
根據所述審核規則中的各個審核要素,從所述審核片段中分別提取出與每個審核要素對應的要素內容;
針對一個審核要素的要素內容,判斷所述要素內容是否滿足與所述審核要素對應的審核子規則;若否,則將所述要素內容作為風險要素內容發送至所述用戶終端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010116229.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種工程勘察數據處理系統
- 下一篇:一種基于拋物線的區域對流層濕延遲計算方法





