[發(fā)明專利]文本審核方法以及裝置有效
| 申請?zhí)枺?/td> | 201910760752.0 | 申請日: | 2019-08-16 |
| 公開(公告)號: | CN110675269B | 公開(公告)日: | 2023-01-10 |
| 發(fā)明(設(shè)計)人: | 陳永環(huán);鄒泊滔;孫清清;王鑫云;王淑鈺;趙云;梅樹起 | 申請(專利權(quán))人: | 創(chuàng)新先進技術(shù)有限公司 |
| 主分類號: | G06Q40/08 | 分類號: | G06Q40/08;G06F16/33;G06F16/35 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 李曉慶 |
| 地址: | 開曼群島大開曼島喬治鎮(zhèn)醫(yī)院*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 審核 方法 以及 裝置 | ||
本說明書提供文本審核方法以及裝置,其中所述文本審核方法包括:獲取待審核文本,確定待審核文本的業(yè)務(wù)維度;基于業(yè)務(wù)維度對待審核文本中包含的關(guān)鍵詞進行標注,獲得與業(yè)務(wù)維度相關(guān)聯(lián)的業(yè)務(wù)關(guān)鍵詞集合;計算業(yè)務(wù)關(guān)鍵詞集合中包含的業(yè)務(wù)關(guān)鍵詞在待審核文本中的詞優(yōu)化參數(shù);根據(jù)詞優(yōu)化參數(shù)對業(yè)務(wù)關(guān)鍵詞集合中包含的業(yè)務(wù)關(guān)鍵詞進行篩選,獲得優(yōu)選關(guān)鍵詞集合;將優(yōu)選關(guān)鍵詞集合中包含的每個業(yè)務(wù)關(guān)鍵詞進行向量化處理,根據(jù)向量化處理結(jié)果獲得向量特征;將向量特征輸入至審核模型,對待審核文本進行審核,獲得審核模型輸出的待審核文本的審核結(jié)果。通過文本審核方法,提高了對業(yè)務(wù)維度對應(yīng)的待審核文本審核的準確性,并且提高了審核效率。
技術(shù)領(lǐng)域
本說明書涉及文本處理技術(shù)領(lǐng)域,特別涉及一種文本審核方法。本說明書同時涉及一種文本審核裝置,一種計算設(shè)備,以及一種計算機可讀存儲介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,信息的安全性對于很多人來說變得越來越重要,無論在何種業(yè)務(wù)當(dāng)中,都存在對于業(yè)務(wù)本身很重要的信息,例如在醫(yī)療保險審核業(yè)務(wù)中,參保人的信息相對于提供醫(yī)療保險業(yè)務(wù)的一方就是重要的信息,需要進行風(fēng)險防控,避免出現(xiàn)泄漏。
現(xiàn)有技術(shù)中,在對重要的文本信息進行風(fēng)險防控的過程中,通常需要通過人工審核的方式來判斷文本信息中存在的重要信息的重要程度,并且在對文本信通過人工進行審核的過程中,還能夠?qū)ξ谋拘畔⒌闹写嬖诘姆钦P畔⑦M行排查,進而可以通過人工方式確定文本信息是否為重要信息,還可以避免文本信息中出現(xiàn)非正常信息的現(xiàn)象。
然而,在通過人工方式對文本信息進行審核的過程中,需要根據(jù)不同的業(yè)務(wù)場景培養(yǎng)不同的人工對該業(yè)務(wù)維度的文本信息進行審核,這無疑是一筆很大的開銷,并且人工審核的方式準確性不是很高,對人工審核人員的專業(yè)素養(yǎng)也是有一定要求的,因此,在傳統(tǒng)業(yè)務(wù)維度的文本信息審核過程中,人工審核準確性低,效率不高,而且對于后續(xù)的二次審核過程工作量也是巨大的。
發(fā)明內(nèi)容
有鑒于此,本說明書實施例提供了一種文本審核方法。本說明書同時涉及一種文本審核裝置,一種計算設(shè)備,以及一種計算機可讀存儲介質(zhì),以解決現(xiàn)有技術(shù)中存在的技術(shù)缺陷。
根據(jù)本說明書實施例的第一方面,提供了一種文本審核方法,包括:
獲取待審核文本,并確定所述待審核文本所屬的業(yè)務(wù)維度;
基于所述業(yè)務(wù)維度對所述待審核文本中包含的關(guān)鍵詞進行標注,獲得與所述業(yè)務(wù)維度相關(guān)聯(lián)的業(yè)務(wù)關(guān)鍵詞組成的業(yè)務(wù)關(guān)鍵詞集合;
計算所述業(yè)務(wù)關(guān)鍵詞集合中包含的每個業(yè)務(wù)關(guān)鍵詞在所述待審核文本中的詞優(yōu)化參數(shù);
根據(jù)所述詞優(yōu)化參數(shù)對所述業(yè)務(wù)關(guān)鍵詞集合中包含的業(yè)務(wù)關(guān)鍵詞進行篩選,獲得所述待審核文本的優(yōu)選關(guān)鍵詞集合;
將所述優(yōu)選關(guān)鍵詞集合中包含的每個業(yè)務(wù)關(guān)鍵詞進行向量化處理,根據(jù)向量化處理結(jié)果獲得所述每個業(yè)務(wù)關(guān)鍵詞的向量特征;
將所述向量特征輸入至審核模型,對所述待審核文本進行審核,獲得所述審核模型輸出的所述待審核文本的審核結(jié)果。
可選的,所述基于所述業(yè)務(wù)維度對所述待審核文本中包含的關(guān)鍵詞進行標注,獲得與所述業(yè)務(wù)維度相關(guān)聯(lián)的業(yè)務(wù)關(guān)鍵詞組成的業(yè)務(wù)關(guān)鍵詞集合,包括:
通過對所述待審核文本進行分詞處理,根據(jù)分詞處理結(jié)果獲得所述待審核文本的關(guān)鍵詞;
通過對所述關(guān)鍵詞進行詞性分析,獲得與所述業(yè)務(wù)維度相關(guān)聯(lián)的所述業(yè)務(wù)關(guān)鍵詞;
提取所述業(yè)務(wù)關(guān)鍵詞創(chuàng)建所述業(yè)務(wù)關(guān)鍵詞集合。
可選的,所述計算所述業(yè)務(wù)關(guān)鍵詞集合中包含的每個業(yè)務(wù)關(guān)鍵詞在所述待審核文本中的詞優(yōu)化參數(shù),包括:
確定所述關(guān)鍵詞集合中包含的每個業(yè)務(wù)關(guān)鍵詞在所述待審核文本中的業(yè)務(wù)關(guān)鍵詞頻次,以及所述業(yè)務(wù)關(guān)鍵詞集合中包含的業(yè)務(wù)關(guān)鍵詞的關(guān)鍵詞數(shù)目;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于創(chuàng)新先進技術(shù)有限公司,未經(jīng)創(chuàng)新先進技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910760752.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風(fēng)險分析或養(yǎng)老金





