[發明專利]內容校驗方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 201810351094.5 | 申請日: | 2018-04-18 |
| 公開(公告)號: | CN108536859A | 公開(公告)日: | 2018-09-14 |
| 發明(設計)人: | 萬旭 | 申請(專利權)人: | 北京小度信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京智信四方知識產權代理有限公司 11519 | 代理人: | 鐘文芳 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預設 校驗 內容校驗 計算機可讀存儲介質 電子設備 違規 誤傷 用戶體驗 | ||
本公開實施例公開了一種內容校驗方法、裝置、電子設備及計算機可讀存儲介質。所述方法包括:接收待校驗內容;在所述待校驗內容中存在第一預設詞時,確定所述待校驗內容中是否存在第二預設詞;其中,所述第一預設詞和第二預設詞具有預設的對應關系;在所述待校驗內容中存在所述第二預設詞時,確定所述待校驗內容通過校驗。本公開實施例通過設置與可能違規的第一預設詞具有預設對應關系的第二預設詞,能夠更加準確的判斷出第一預設詞是否真的違規,減少內容校驗系統的誤傷情況,提高了用戶體驗。
技術領域
本公開涉及計算機技術領域,具體涉及一種內容校驗方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
隨著信息化時代的發展,人們越來越習慣于通過網絡共享信息。然而,為了管理方便,大部分論壇、網站等,都進行了關于敏感詞的設定。
敏感詞是指帶有敏感政治傾向(或反執政黨傾向)、暴力傾向、不健康色彩的詞或不文明語,也有一些網站根據自身實際情況,設定一些只適用于本網站的特殊敏感詞。例如,在O2O領域,基本所有的線上系統展示的文案,都需要一套敏感詞校驗系統。當公司各個系統對文案進行新增、修改的時候,敏感詞校驗系統主要作為基礎服務,提供文案校驗服務。
發明內容
本公開實施例提供一種內容校驗方法、裝置、電子設備及計算機可讀存儲介質。
第一方面,本公開實施例中提供了一種內容校驗方法。
具體的,所述內容校驗方法,包括:
接收待校驗內容;
在所述待校驗內容中存在第一預設詞時,確定所述待校驗內容中是否存在第二預設詞;其中,所述第一預設詞和第二預設詞具有預設的對應關系;
在所述待校驗內容中存在所述第二預設詞時,確定所述待校驗內容通過校驗。
結合第一方面,本公開在第一方面的第一種實現方式中,所述第一預設詞為預設的敏感詞。
結合第一方面或第一方面的第一種實現方式,本公開在第一方面的第二種實現方式中,所述接收待校驗內容之后,還包括:
對所述待檢驗內容進行切詞;
將切詞得到的多個詞分別與第一預設詞庫進行匹配;其中,所述第一預設詞庫包括多個第一預設詞。
結合第一方面或第一方面的第一種實現方式,本公開在第一方面的第三種實現方式中,確定所述待校驗內容中是否存在第二預設詞,包括:
將構成所述待校驗內容的多個詞分別與第二預設詞庫進行匹配;其中,所述第二預設詞庫包括多個第二預設詞;
確定所述第一預設詞與匹配成功的詞之間是否具有所述預設的對應關系。
結合第一方面或第一方面的第一種實現方式,本公開在第一方面的第四種實現方式中,還包括:
預先建立包括多個第一預設詞的第一預設詞庫;
確定與所述第一預設詞庫中的多個預設詞具有對應關系的多個第二預設詞,并建立包括多個第二預設詞的第二預設詞庫。
結合第一方面的第四種實現方式,本公開在第一方面的第五種實現方式中,還包括:
在接收到新的第一預設詞時,根據所述新的第一預設詞更新所述第一預設詞庫,并根據與所述新的第一預設詞具有對應關系的第二預設詞更新所述第二預設詞庫;和/或,
在接收到新的第二預設詞時,根據所述第二預設詞更新所述第二預設詞庫。
結合第一方面、第一方面的第一種實現方式或第一方面的第五種實現方式,本公開在第一方面的第六種實現方式中,所述預設的對應關系使得所述第一預設詞和第二預設詞所構成的組合為非敏感詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小度信息科技有限公司,未經北京小度信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810351094.5/2.html,轉載請聲明來源鉆瓜專利網。





