[發(fā)明專利]一種敏感詞的處理方法及處理裝置在審
| 申請?zhí)枺?/td> | 202210023915.9 | 申請日: | 2022-01-11 |
| 公開(公告)號: | CN114398873A | 公開(公告)日: | 2022-04-26 |
| 發(fā)明(設(shè)計(jì))人: | 杜敏強(qiáng);陳威龍;陳金涂 | 申請(專利權(quán))人: | 山東東葳電子科技有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289;G06F16/33 |
| 代理公司: | 山東諾誠智匯知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 37309 | 代理人: | 佘莉芳 |
| 地址: | 276100 山東省臨*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 敏感 處理 方法 裝置 | ||
本申請公開了一種敏感詞的處理方法及處理裝置,所述處理方法包括:建立敏感詞數(shù)據(jù)庫;對待發(fā)布文章進(jìn)行識別,判斷識別目標(biāo)敏感詞,獲取待發(fā)布文章所包含的目標(biāo)敏感詞以及所述目標(biāo)敏感詞的出現(xiàn)頻次;查詢所述敏感詞數(shù)據(jù)庫,獲取所述目標(biāo)敏感詞的敏感等級;根據(jù)所述目標(biāo)敏感詞的敏感等級和出現(xiàn)頻次按照相應(yīng)的處理策略對所述目標(biāo)敏感詞進(jìn)行處理。在本申請中,首先建立敏感詞數(shù)據(jù)庫,然后對待發(fā)布文章進(jìn)行識別確定文章中出現(xiàn)的目標(biāo)敏感詞以及出現(xiàn)頻次,根據(jù)敏感詞數(shù)據(jù)庫確定目標(biāo)敏感詞的敏感等級,最后根據(jù)敏感等級和出現(xiàn)頻次按照相應(yīng)的處理策略對所述目標(biāo)敏感詞進(jìn)行處理,可以提高敏感詞排查的效率,避免發(fā)生漏查、錯查等現(xiàn)象,提高檢查的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請屬于新一代信息數(shù)據(jù)處理技術(shù)領(lǐng)域,更具體地,涉及一種敏感詞的處理方法及處理裝置。
背景技術(shù)
目前對于敏感詞的后臺處理,只是對敏感詞進(jìn)行過濾,沒有進(jìn)行等級劃分,也就是把文章內(nèi)容中的敏感詞標(biāo)記后提供給審核員人工審查,但由于敏感詞庫不斷的增加或減少,而且頻率很快,對于篇幅較長的文章,章節(jié)中會出現(xiàn)許多敏感詞,審核員基本需要做到通篇閱讀才能完成對該篇文章的敏感詞審核,這樣消耗的時間非常大。而且由于字?jǐn)?shù)多,容易發(fā)生漏查、錯查等現(xiàn)象,導(dǎo)致即便將敏感詞高亮顯示也容易出現(xiàn)審查失誤。
鑒于此,克服該現(xiàn)有技術(shù)產(chǎn)品所存在的不足是本技術(shù)領(lǐng)域亟待解決的問題。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的以上缺陷或改進(jìn)需求,本申請?zhí)峁┝艘环N敏感詞的處理方法及處理裝置,可以提高敏感詞排查的效率,避免發(fā)生漏查、錯查等現(xiàn)象,提高檢查的準(zhǔn)確性。
為實(shí)現(xiàn)上述目的,按照本申請的一個方面,提供了一種敏感詞的處理方法,所述處理方法包括:
建立敏感詞數(shù)據(jù)庫;
對待發(fā)布文章進(jìn)行識別,獲取所述待發(fā)布文章所包含的目標(biāo)敏感詞以及所述目標(biāo)敏感詞的出現(xiàn)頻次;
查詢所述敏感詞數(shù)據(jù)庫,獲取所述目標(biāo)敏感詞的敏感等級;
根據(jù)所述目標(biāo)敏感詞的敏感等級和出現(xiàn)頻次按照相應(yīng)的處理策略對所述目標(biāo)敏感詞進(jìn)行處理。
優(yōu)選地,所述處理策略包括:當(dāng)所述目標(biāo)敏感詞的敏感等級小于設(shè)定的等級閾值,則采用設(shè)定的字符對所述目標(biāo)敏感詞進(jìn)行覆蓋。
優(yōu)選地,所述處理策略包括:當(dāng)所述目標(biāo)敏感詞的敏感等級不小于設(shè)定的等級閾值,則結(jié)合上下文判斷攜帶該目標(biāo)敏感詞的上下文是否具有正面意義,若具有正面意義,則不進(jìn)行處理,若不具有正面意義,則采用設(shè)定的字符對所述敏感詞進(jìn)行覆蓋。
優(yōu)選地,所述處理策略包括:當(dāng)所述目標(biāo)敏感詞的敏感等級不小于設(shè)定的等級閾值,且所述目標(biāo)敏感詞的出現(xiàn)頻次不小于設(shè)定的頻次閾值,則對所述目標(biāo)敏感詞進(jìn)行人工審核。
優(yōu)選地,所述建立敏感詞數(shù)據(jù)庫包括:
獲取敏感詞,為每個敏感詞設(shè)置第一標(biāo)識ID1,并為每個敏感詞設(shè)置敏感等級,將所述敏感詞、第一標(biāo)識ID1和所述敏感等級建立映射關(guān)系,建立敏感詞數(shù)據(jù)庫。
優(yōu)選地,所述處理方法還包括:
查詢所述敏感詞數(shù)據(jù)庫,獲取所述目標(biāo)敏感詞的第一標(biāo)識ID1;
并基于所述目標(biāo)敏感詞的出現(xiàn)順序和所述待發(fā)布文章的源位置生成第二標(biāo)識ID2,獲取所述目標(biāo)敏感詞的出現(xiàn)頻次;
設(shè)置所述目標(biāo)敏感詞對應(yīng)的替換字符;
將所述目標(biāo)敏感詞、所述第一標(biāo)識ID1、所述敏感等級、所述出現(xiàn)頻次、所述第二標(biāo)識ID2和替換字符建立處理表,并輸出所述處理表。
優(yōu)選地,所述處理方法還包括:
當(dāng)所述目標(biāo)敏感詞的敏感等級大于設(shè)定的等級閾值時,根據(jù)所述第二標(biāo)識ID2判斷所述目標(biāo)敏感詞的出現(xiàn)順序是否符合設(shè)定的要求,若不符合,則調(diào)整所述目標(biāo)敏感詞的出現(xiàn)順序。
優(yōu)選地,所述處理方法包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東東葳電子科技有限公司,未經(jīng)山東東葳電子科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210023915.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 可測量片外橫向偏導(dǎo)的橫向偏差三敏感柵叉指金屬應(yīng)變片
- 可測量偏置位置軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測量偏置敏感柵中心軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測量偏置敏感柵外側(cè)軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測量偏置敏感柵中心橫向偏導(dǎo)的橫向偏差三敏感柵叉指金屬應(yīng)變片
- 三軸硅微加速度計(jì)
- 三軸硅微加速度計(jì)
- 一種用于大噸位傳感器的自定位應(yīng)變計(jì)
- 用于簡化懸臂梁傳感器的全橋箔式電阻應(yīng)變計(jì)
- 一種敏感文件管理方法





