[發(fā)明專(zhuān)利]避免中文自然語(yǔ)言信息隱藏嵌密前后分詞不一致的方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201110122787.5 | 申請(qǐng)日: | 2011-05-12 |
| 公開(kāi)(公告)號(hào): | CN102201046A | 公開(kāi)(公告)日: | 2011-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 何路;陳長(zhǎng)安;吳建濤;房鼎益 | 申請(qǐng)(專(zhuān)利權(quán))人: | 西北大學(xué) |
| 主分類(lèi)號(hào): | G06F21/00 | 分類(lèi)號(hào): | G06F21/00 |
| 代理公司: | 西安恒泰知識(shí)產(chǎn)權(quán)代理事務(wù)所 61216 | 代理人: | 李婷 |
| 地址: | 710069 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 避免 中文 自然語(yǔ)言 信息 隱藏 前后 分詞 不一致 方法 | ||
1.一種避免中文自然語(yǔ)言信息隱藏嵌密前后分詞不一致的方法,該方法涉及的字母n是自然數(shù),表示對(duì)一個(gè)句子的處理過(guò)程中,未被舍棄的可嵌密詞個(gè)數(shù);字母k是不小于1的正整數(shù),表示驗(yàn)證個(gè)數(shù):其特征在于:具體包括以下步驟:
步驟1:根據(jù)文本中的標(biāo)點(diǎn)符號(hào)將文本切分成多個(gè)小句,其中,所述的小句由切分出的內(nèi)容與對(duì)應(yīng)的標(biāo)點(diǎn)符號(hào)組成;初始化一個(gè)空的理想可嵌密詞集合,它由由詞、同義詞、所在句子、句內(nèi)序號(hào)等內(nèi)容組成;
步驟2:從還沒(méi)被處理過(guò)的小句中選出第一個(gè),對(duì)其進(jìn)行分詞;找出所有可嵌密詞,并且根據(jù)可嵌密詞在句中依次出現(xiàn)的順序進(jìn)行編號(hào);
步驟3:n為小句中全部可嵌密詞個(gè)數(shù);令該小句的驗(yàn)證個(gè)數(shù)k為1;如果,n=0,表示小句沒(méi)有可嵌密詞,或者小句所有可嵌密詞都已經(jīng)被舍棄,跳到步驟8.?否則進(jìn)行步驟4;
步驟4:根據(jù)小句中未被舍棄的n個(gè)可嵌密詞的序號(hào),得到???????????????????????????????????????????????個(gè)可嵌密詞序號(hào)組合;創(chuàng)建一個(gè)空的出錯(cuò)序號(hào)組合列表;按照可嵌密詞序號(hào)組合對(duì)原句進(jìn)行同義詞預(yù)替換,得到全部滿(mǎn)足條件的在n個(gè)可嵌密詞中只預(yù)替換k個(gè)可嵌密詞的含密新句子;當(dāng)然,因?yàn)橐粋€(gè)可嵌密詞可能有多個(gè)同義詞,所以一種序號(hào)組合可能對(duì)應(yīng)多個(gè)新句子;
步驟5:根據(jù)可嵌密詞序號(hào)組合,判斷獲得的新句子與原句分詞是否一致,如果其中一種可嵌密詞序號(hào)組合的全部新句子與原句分詞一致,跳到下一種可嵌密詞序號(hào)組合;如果某一種組合出現(xiàn)與原句分詞不一致的新句子,把這種組合添加到出錯(cuò)序號(hào)組合列表,跳過(guò)本組合的其他句子,驗(yàn)證下一種組合;直到全部序號(hào)組合都被驗(yàn)證過(guò)為止;從而將分詞不一致的新句子對(duì)應(yīng)的序號(hào)組合都添加到了出錯(cuò)序號(hào)組合列表中;利用舍棄選擇算法,將出錯(cuò)序號(hào)組合列表中出現(xiàn)次數(shù)最多的可嵌密詞全部刪除;
步驟6:更新n的數(shù)值,如果,小句的可嵌密詞都被舍棄了,即n=0,則句子內(nèi)所有可嵌密詞全都不理想,跳到步驟8,否則繼續(xù)執(zhí)行步驟7;
步驟7:當(dāng)驗(yàn)證個(gè)數(shù)k不小于句中未被舍棄的可嵌密詞個(gè)數(shù)n,即k>=n時(shí),則句中未被舍棄的可嵌密詞都是理想可嵌密詞,將其添加到理想可嵌密詞集合,繼續(xù)執(zhí)行步驟8;否則,將該小句的驗(yàn)證個(gè)數(shù)k設(shè)置為k=k+1,重復(fù)步驟4至步驟7;
步驟8:對(duì)文本經(jīng)劃分得到的其他所有小句遵循上述步驟2至步驟7重復(fù)進(jìn)行操作,直到文本中的所有小句均完成上述步驟,得到整個(gè)文本的理想可嵌密詞集合,結(jié)束處理。
2.如權(quán)利要求1所述的避免中文自然語(yǔ)言信息隱藏嵌密前后分詞不一致的方法,其特征在于:所述的舍棄位置選擇算法包括以下步驟:
(1)?獲取小句出錯(cuò)序號(hào)組合列表;
(2)判斷該獲取小句出錯(cuò)序號(hào)組合列表是否為空,當(dāng)小句出錯(cuò)序號(hào)組合列表為空時(shí),則結(jié)束操作;當(dāng)小句出錯(cuò)序號(hào)組合列表不為空時(shí),舍棄列表中出現(xiàn)次數(shù)最多的可嵌密詞,如果有多個(gè)可嵌密詞出現(xiàn)的次數(shù)最多且相同,那么根據(jù)嵌入和提取時(shí)使用的密鑰,選擇一個(gè)可嵌密詞進(jìn)行舍棄;
(3)更新小句出錯(cuò)序號(hào)組合列表,刪除列表中有被舍棄的嵌密詞的序號(hào)的組合,跳到第(2)步循環(huán)進(jìn)行操作,直到第(2)步實(shí)現(xiàn)小句出錯(cuò)序號(hào)組合列表為空停止。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于西北大學(xué),未經(jīng)西北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110122787.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種平面板材裝飾上光工藝
- 下一篇:一種硫化橡膠的溶脹方法
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤(pán)或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 一種自然語(yǔ)言的搜索方法及系統(tǒng)
- 基于交互上下文處理自然語(yǔ)言方法
- 計(jì)算機(jī)化的自然語(yǔ)言查詢(xún)意圖分派
- 自然語(yǔ)言描述信息的生成方法及裝置
- 風(fēng)格可定制的文本生成
- 多輪預(yù)制對(duì)話
- 改變應(yīng)答以提供表現(xiàn)豐富的自然語(yǔ)言對(duì)話的方法、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言查詢(xún)的轉(zhuǎn)換
- 一種自然語(yǔ)言處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言理解模型訓(xùn)練方法、自然語(yǔ)言理解方法及裝置
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





