[發(fā)明專利]維吾爾語(yǔ)敏感詞過濾系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201410830265.4 | 申請(qǐng)日: | 2014-12-26 |
| 公開(公告)號(hào): | CN104504091A | 公開(公告)日: | 2015-04-08 |
| 發(fā)明(設(shè)計(jì))人: | 帕哈爾丁·西日甫 | 申請(qǐng)(專利權(quán))人: | 新疆卡爾羅媒體科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京市盛峰律師事務(wù)所11337 | 代理人: | 席小東 |
| 地址: | 830049新疆維吾爾自治區(qū)烏魯*** | 國(guó)省代碼: | 新疆;65 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 維吾爾 敏感 過濾 系統(tǒng) | ||
1.一種維吾爾語(yǔ)敏感詞過濾系統(tǒng),其特征在于,包括:
維吾爾語(yǔ)敏感詞數(shù)據(jù)庫(kù),用于收集和匯編維吾爾語(yǔ)敏感詞,同時(shí),對(duì)于存儲(chǔ)的每個(gè)所述維吾爾語(yǔ)敏感詞,均綁定存儲(chǔ)所述維吾爾語(yǔ)敏感詞的維吾爾語(yǔ)替換詞以及中文譯詞;
維吾爾語(yǔ)文本動(dòng)態(tài)采集系統(tǒng),用于實(shí)時(shí)動(dòng)態(tài)采集監(jiān)測(cè)對(duì)象的維吾爾語(yǔ)文本;
維吾爾語(yǔ)敏感詞校對(duì)系統(tǒng),用于對(duì)所述維吾爾語(yǔ)文本動(dòng)態(tài)采集系統(tǒng)采集到的所述維吾爾語(yǔ)文本進(jìn)行內(nèi)容校對(duì),基于匹配算法判斷所述維吾爾語(yǔ)文本是否包含與所述維吾爾語(yǔ)敏感詞數(shù)據(jù)庫(kù)中所存儲(chǔ)的維吾爾語(yǔ)敏感詞相同或相似的維吾爾語(yǔ)敏感詞;如果包含,則直接獲取所述維吾爾語(yǔ)文本中包含的維吾爾語(yǔ)敏感詞,同時(shí)獲取與所述維吾爾語(yǔ)文本中包含的維吾爾語(yǔ)敏感詞對(duì)應(yīng)的維吾爾語(yǔ)替換詞與中文譯詞;
閾值判斷模塊,用于對(duì)所述維吾爾語(yǔ)敏感詞校對(duì)系統(tǒng)所得到的所述維吾爾語(yǔ)敏感詞數(shù)量進(jìn)行統(tǒng)計(jì),得到所述維吾爾語(yǔ)敏感詞的數(shù)量,記為N;以及,對(duì)當(dāng)前被處理的所述維吾爾語(yǔ)文本的文本大小進(jìn)行計(jì)算,得到當(dāng)前被處理的所述維吾爾語(yǔ)文本的文本信息容量值,記為M;然后,判斷N/M是否大于設(shè)定閾值,如果大于,則執(zhí)行維吾爾語(yǔ)敏感詞過濾系統(tǒng);如果小于,則執(zhí)行維吾爾語(yǔ)敏感詞替換系統(tǒng);
維吾爾語(yǔ)敏感詞過濾系統(tǒng),用于直接屏蔽過濾掉所述維吾爾語(yǔ)文本;
維吾爾語(yǔ)敏感詞替換系統(tǒng),用于在所述維吾爾語(yǔ)文本中,對(duì)所述維吾爾語(yǔ)敏感詞校對(duì)系統(tǒng)所得到的每個(gè)所述維吾爾語(yǔ)敏感詞進(jìn)行替換操作,替換為與所述維吾爾語(yǔ)敏感詞對(duì)應(yīng)的維吾爾語(yǔ)替換詞,同時(shí),以替換框的方式突出顯示每個(gè)所述維吾爾語(yǔ)替換詞對(duì)應(yīng)的維吾爾語(yǔ)敏感詞以及中文譯詞,得到第一次處理后的維吾爾語(yǔ)文本;
后臺(tái)顯示模塊,用于在后臺(tái)顯示所述第一次處理后的維吾爾語(yǔ)文本;
人工審核模塊,用于對(duì)所述后臺(tái)顯示模塊顯示的所述第一次處理后的維吾爾語(yǔ)文本進(jìn)行人工審核,進(jìn)一步確認(rèn)所替換的是否為敏感詞,如果是,則接受所述維吾爾語(yǔ)敏感詞替換系統(tǒng)對(duì)該維吾爾語(yǔ)敏感詞的替換操作,同時(shí),從所述第一次處理后的維吾爾語(yǔ)文本中取消對(duì)應(yīng)的替換框;如果不是,則拒絕所述維吾爾語(yǔ)敏感詞替換系統(tǒng)對(duì)該維吾爾語(yǔ)敏感詞的替換操作,依據(jù)對(duì)應(yīng)的替換框,還原顯示原來的維吾爾語(yǔ)詞,同時(shí),從所述第一次處理后的維吾爾語(yǔ)文本中取消對(duì)應(yīng)的替換框;由此得到第二次處理后的維吾爾語(yǔ)文本;
推送顯示模塊,用于將所述人工審核模塊審核后的所述第二次處理后的維吾爾語(yǔ)文本顯示到監(jiān)測(cè)對(duì)象的對(duì)應(yīng)位置。
2.根據(jù)權(quán)利要求1所述的維吾爾語(yǔ)敏感詞過濾系統(tǒng),其特征在于,所述維吾爾語(yǔ)敏感詞校對(duì)系統(tǒng)具體用于:
根據(jù)所述維吾爾語(yǔ)文本動(dòng)態(tài)采集系統(tǒng)采集到的所述維吾爾語(yǔ)文本的信息容量的大小,所述維吾爾語(yǔ)敏感詞校對(duì)系統(tǒng)將所述維吾爾語(yǔ)文本劃分為n個(gè)單元;
然后,所述維吾爾語(yǔ)敏感詞校對(duì)系統(tǒng)并行啟動(dòng)n個(gè)內(nèi)容校對(duì)器,所述n個(gè)內(nèi)容校對(duì)器并行對(duì)所述維吾爾語(yǔ)文本的n個(gè)單元進(jìn)行內(nèi)容校對(duì)。
3.根據(jù)權(quán)利要求1所述的維吾爾語(yǔ)敏感詞過濾系統(tǒng),其特征在于,所述維吾爾語(yǔ)敏感詞校對(duì)系統(tǒng)所采用的所述匹配算法包括:核算法、棧算法或?qū)φ掌磳懶?duì)算法;
對(duì)于僅支持漢語(yǔ)的匹配算法,在所述僅支持漢語(yǔ)的匹配算法的算法代碼中加載維吾爾文字符Unicode編碼組件并聲明維吾爾文字符U?nicode編碼規(guī)范;然后,將所述維吾爾文字符U?nicode編碼組件與所述維吾爾語(yǔ)敏感詞數(shù)據(jù)庫(kù)進(jìn)行對(duì)接,實(shí)現(xiàn)將所述僅支持漢語(yǔ)的匹配算法轉(zhuǎn)化為支持維吾爾文的匹配算法。
4.根據(jù)權(quán)利要求1所述的維吾爾語(yǔ)敏感詞過濾系統(tǒng),其特征在于,還包括:
數(shù)據(jù)庫(kù)管理模塊,用于對(duì)所述維吾爾語(yǔ)敏感詞數(shù)據(jù)庫(kù)進(jìn)行管理維護(hù),包括:
備份管理單元,用于對(duì)所述維吾爾語(yǔ)敏感詞數(shù)據(jù)庫(kù)進(jìn)行定期或非定期備份管理,包括自動(dòng)備份和手動(dòng)備份模式;
恢復(fù)管理單元,用于當(dāng)所述維吾爾語(yǔ)敏感詞數(shù)據(jù)庫(kù)出現(xiàn)故障時(shí),對(duì)所述維吾爾語(yǔ)敏感詞數(shù)據(jù)庫(kù)進(jìn)行故障恢復(fù)管理操作;
版本管理單元,用于對(duì)所述維吾爾語(yǔ)敏感詞數(shù)據(jù)庫(kù)進(jìn)行版本升級(jí)操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新疆卡爾羅媒體科技有限公司;,未經(jīng)新疆卡爾羅媒體科技有限公司;許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410830265.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 可測(cè)量片外橫向偏導(dǎo)的橫向偏差三敏感柵叉指金屬應(yīng)變片
- 可測(cè)量偏置位置軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測(cè)量偏置敏感柵中心軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測(cè)量偏置敏感柵外側(cè)軸向偏導(dǎo)的軸向偏差三敏感柵叉指金屬應(yīng)變片
- 可測(cè)量偏置敏感柵中心橫向偏導(dǎo)的橫向偏差三敏感柵叉指金屬應(yīng)變片
- 三軸硅微加速度計(jì)
- 三軸硅微加速度計(jì)
- 一種用于大噸位傳感器的自定位應(yīng)變計(jì)
- 用于簡(jiǎn)化懸臂梁傳感器的全橋箔式電阻應(yīng)變計(jì)
- 一種敏感文件管理方法





