[發明專利]文本的審核方法、裝置、計算機設備及存儲介質在審

申請號：	202011247736.0	申請日：	2020-11-10
公開（公告）號：	CN112163585A	公開（公告）日：	2021-01-01
發明（設計）人：	宋曉薇	申請（專利權）人：	平安普惠企業管理有限公司
主分類號：	G06K9/34	分類號：	G06K9/34;G06F16/33;G06F16/35
代理公司：	深圳市明日今典知識產權代理事務所(普通合伙) 44343	代理人：	王杰輝;熊成龍
地址：	518000 廣東省深圳市前海深港合作區前***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	文本審核方法裝置計算機設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供了一種文本的審核方法、裝置、計算機設備及存儲介質，其中，方法包括：獲取待審核文本；從文本數據庫中獲取多個預存文本，以及對應的滿意度；對所述預存文本進行數據預處理，得到各所述預存文本對應的暫時文本；對每個所述暫時文本進行分詞；根據所述暫時文本各自對應的所述滿意度計算每個詞語的權重；根據每個詞語對應的所述權重，計算所述待審核文本的預測滿意度；根據所述預測滿意度判斷所述待審核文本是否滿足推送要求。本發明的有益效果：通過本發明的文本的審核方法，能夠基于該類別其他預存文本的滿意度，計算出待審核文本的預測滿意度，實現了對待審核文本的自動化審核，節省了公司的人力資源。

技術領域

本發明涉及數據處理領域，特別涉及一種文本的審核方法、裝置、計算機設備及存儲介質。

背景技術

在編輯好群發文本后，需要業務方去對應的平臺上申請對應的群發批準，目前，主要是通過人力進行審核，有的文本甚至需要多方面審核，例如現有的OPR(Optical PatternRecognition，光學識別)系統都需要先從業務處導出對應的文本，獲取文本中的文本信息，待審核人員確認后再將這些文本維護到OPR的數據庫中，若OPR的數據庫中沒有該文本信息，則不能對文本群發，審核過程繁瑣復雜，極大的降低了公司的效率，以及浪費了公司的人力資源。

發明內容

本發明的主要目的為提供一種文本的審核方法、裝置、計算機設備及存儲介質，旨在解決傳統的審核過程繁瑣復雜的問題。

本發明提供了一種文本的審核方法，包括：

獲取待審核文本，并檢測所述待審核文本所屬的類別；

從文本數據庫中獲取對應所述類別的多個預存文本，以及所述預存文本對應的滿意度；

基于專業詞庫以及特殊字符標識庫對所述預存文本進行數據預處理，從而得到各所述預存文本對應的暫時文本；

通過文本分類器對每個所述暫時文本進行分詞；

根據所述暫時文本各自對應的所述滿意度計算每個詞語的權重，得到詞語權重數據庫；

根據所述詞語權重數據庫中每個詞語對應的所述權重，計算所述待審核文本的預測滿意度；

根據所述預測滿意度判斷所述待審核文本是否滿足推送要求。

進一步地，所述根據所述詞語權重數據庫中每個詞語對應的所述權重，計算所述待審核文本的預測滿意度的步驟，包括：

通過所述文本分類器對所述待審核文本進行分詞，得到各初始詞語；