[發明專利]文本的審核方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202011247736.0 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112163585A | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 宋曉薇 | 申請(專利權)人: | 平安普惠企業管理有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06F16/33;G06F16/35 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝;熊成龍 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 審核 方法 裝置 計算機 設備 存儲 介質 | ||
本發明提供了一種文本的審核方法、裝置、計算機設備及存儲介質,其中,方法包括:獲取待審核文本;從文本數據庫中獲取多個預存文本,以及對應的滿意度;對所述預存文本進行數據預處理,得到各所述預存文本對應的暫時文本;對每個所述暫時文本進行分詞;根據所述暫時文本各自對應的所述滿意度計算每個詞語的權重;根據每個詞語對應的所述權重,計算所述待審核文本的預測滿意度;根據所述預測滿意度判斷所述待審核文本是否滿足推送要求。本發明的有益效果:通過本發明的文本的審核方法,能夠基于該類別其他預存文本的滿意度,計算出待審核文本的預測滿意度,實現了對待審核文本的自動化審核,節省了公司的人力資源。
技術領域
本發明涉及數據處理領域,特別涉及一種文本的審核方法、裝置、計算機設備及存儲介質。
背景技術
在編輯好群發文本后,需要業務方去對應的平臺上申請對應的群發批準,目前,主要是通過人力進行審核,有的文本甚至需要多方面審核,例如現有的OPR(Optical PatternRecognition,光學識別)系統都需要先從業務處導出對應的文本,獲取文本中的文本信息,待審核人員確認后再將這些文本維護到OPR的數據庫中,若OPR的數據庫中沒有該文本信息,則不能對文本群發,審核過程繁瑣復雜,極大的降低了公司的效率,以及浪費了公司的人力資源。
發明內容
本發明的主要目的為提供一種文本的審核方法、裝置、計算機設備及存儲介質,旨在解決傳統的審核過程繁瑣復雜的問題。
本發明提供了一種文本的審核方法,包括:
獲取待審核文本,并檢測所述待審核文本所屬的類別;
從文本數據庫中獲取對應所述類別的多個預存文本,以及所述預存文本對應的滿意度;
基于專業詞庫以及特殊字符標識庫對所述預存文本進行數據預處理,從而得到各所述預存文本對應的暫時文本;
通過文本分類器對每個所述暫時文本進行分詞;
根據所述暫時文本各自對應的所述滿意度計算每個詞語的權重,得到詞語權重數據庫;
根據所述詞語權重數據庫中每個詞語對應的所述權重,計算所述待審核文本的預測滿意度;
根據所述預測滿意度判斷所述待審核文本是否滿足推送要求。
進一步地,所述根據所述詞語權重數據庫中每個詞語對應的所述權重,計算所述待審核文本的預測滿意度的步驟,包括:
通過所述文本分類器對所述待審核文本進行分詞,得到各初始詞語;
刪除所述初始詞語中所述詞語權重數據庫不存在的詞語,得到各目標詞語,獲取分詞后各所述目標詞語對應的個數;
根據所述目標詞語的個數,以及各目標詞語對應的數量、權重,通過預設的預測滿意度計算公式計算所述預測滿意度。
進一步地,所述根據所述暫時文本各自對應的所述滿意度計算每個詞語的權重,得到詞語權重數據庫的步驟,包括:
獲取各個詞語的文本分值;
根據各個詞語的所述文本分值,以及各個所述暫時文本的滿意度;通過預設的匹配值計算公式計算各個詞語在各所述暫時文本中的匹配值;
統計各所述暫時文本中各個詞語的個數,并根據各個詞語在各所述暫時文本中的匹配值,通過預設的權重計算公式計算各個詞語的權重;
根據各個詞語的所述權重構建所述詞語權重數據庫。
進一步地,所述檢測所述待審核文本所屬的類別的步驟,包括:
獲取所述待審核文本的文本信息,并將所述文本信息進行向量化,得到對應所述待審核文本的第一向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安普惠企業管理有限公司,未經平安普惠企業管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011247736.0/2.html,轉載請聲明來源鉆瓜專利網。





