[發(fā)明專(zhuān)利]一種干擾詞生成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010188699.4 | 申請(qǐng)日: | 2020-03-17 |
| 公開(kāi)(公告)號(hào): | CN111401060B | 公開(kāi)(公告)日: | 2023-06-13 |
| 發(fā)明(設(shè)計(jì))人: | 張林箭;王怡;張聰;毛曉曦;范長(zhǎng)杰;胡志鵬 | 申請(qǐng)(專(zhuān)利權(quán))人: | 網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司 |
| 主分類(lèi)號(hào): | G06F40/289 | 分類(lèi)號(hào): | G06F40/289;G06F40/284;G06F40/205 |
| 代理公司: | 北京超成律師事務(wù)所 11646 | 代理人: | 吳迪 |
| 地址: | 310052 浙江省杭州*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 干擾 生成 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種干擾詞生成方法,其特征在于,包括:
獲取第一目標(biāo)語(yǔ)句,所述第一目標(biāo)語(yǔ)句中包含K個(gè)被掩藏的文字,其中,K為正整數(shù);
根據(jù)所述第一目標(biāo)語(yǔ)句,得到所述第一目標(biāo)語(yǔ)句中被掩藏的文字所在的各個(gè)位置上的第一候選文字列表,以及每個(gè)第一候選文字列表中的各第一候選文字的置信度;
根據(jù)預(yù)設(shè)干擾詞數(shù)量,從各第一候選文字列表構(gòu)成的文字集合中選擇對(duì)應(yīng)數(shù)量的第一目標(biāo)文字,所述第一目標(biāo)文字是從各第一候選文字列表構(gòu)成的文字集合所包含的第一候選文字中按照置信度由高到低的順序選擇出來(lái)的;
對(duì)于每個(gè)第一目標(biāo)文字,根據(jù)該第一目標(biāo)文字,得到所述第一目標(biāo)語(yǔ)句對(duì)應(yīng)的干擾詞,所述干擾詞是由所述第一目標(biāo)語(yǔ)句中不同位置上的被掩藏的文字所對(duì)應(yīng)的第一目標(biāo)文字組合而成的。
2.如權(quán)利要求1所述的干擾詞生成方法,其特征在于,所述根據(jù)該第一目標(biāo)文字,得到所述第一目標(biāo)語(yǔ)句對(duì)應(yīng)的干擾詞,包括:
當(dāng)K=1時(shí),將該第一目標(biāo)文字作為所述干擾詞;
當(dāng)K≥2時(shí),根據(jù)該第一目標(biāo)文字和所述第一目標(biāo)語(yǔ)句,得到所述第一目標(biāo)語(yǔ)句中除該第一目標(biāo)文字所在位置之外的其他位置上的目標(biāo)文字;按照該第一目標(biāo)文字和所述目標(biāo)文字在所述第一目標(biāo)語(yǔ)句中的位置生成所述干擾詞。
3.如權(quán)利要求2所述的干擾詞生成方法,其特征在于,所述根據(jù)該第一目標(biāo)文字和所述第一目標(biāo)語(yǔ)句,得到所述第一目標(biāo)語(yǔ)句中除該第一目標(biāo)文字所在位置之外的其他位置上的目標(biāo)文字,包括:
根據(jù)該第一目標(biāo)文字所在位置,將該第一目標(biāo)文字添加到所述第一目標(biāo)語(yǔ)句中,生成第二目標(biāo)語(yǔ)句,所述第二目標(biāo)語(yǔ)句包括K-1個(gè)被掩藏的文字;
將所述第二目標(biāo)語(yǔ)句作為輸入?yún)?shù)輸入到BERT模型中,得到所述第二目標(biāo)語(yǔ)句中被掩藏的文字所在的各個(gè)位置上的第二候選文字列表,以及每個(gè)第二候選文字列表中的各第二候選文字的置信度;
從各第二候選文字列表包括的第二候選文字中選擇第二目標(biāo)文字,其中,所述第二目標(biāo)文字是各第二候選文字列表構(gòu)成的文字集合所包含的第二候選文字中置信度最高的第二候選文字;
根據(jù)所述第二目標(biāo)文字所在位置,將所述第二目標(biāo)文字添加到所述第二目標(biāo)語(yǔ)句中,生成第三目標(biāo)語(yǔ)句,所述第二目標(biāo)語(yǔ)句包括K-2個(gè)被掩藏的文字;
將所述第三目標(biāo)語(yǔ)句作為輸入?yún)?shù)輸入到所述BERT模型中,得到所述第三目標(biāo)語(yǔ)句中被掩藏的文字所在的各個(gè)位置上的第三候選文字列表,以及每個(gè)第三候選文字列表中的各第三候選文字的置信度;
從各第三候選文字列表包括的第三候選文字中選擇第三目標(biāo)文字,其中,所述第三目標(biāo)文字是各第三候選文字列表構(gòu)成的文字集合所包含的第三候選文字中置信度最高的第三候選文字,直至得到所述第一目標(biāo)語(yǔ)句中除該第一目標(biāo)文字所在位置之外的其他位置上的目標(biāo)文字。
4.如權(quán)利要求1所述的干擾詞生成方法,其特征在于,所述根據(jù)所述第一目標(biāo)語(yǔ)句,得到所述第一目標(biāo)語(yǔ)句中被掩藏的文字所在的各個(gè)位置上的第一候選文字列表,以及每個(gè)第一候選文字列表中的各第一候選文字的置信度,包括:
將所述第一目標(biāo)語(yǔ)句作為輸入?yún)?shù)輸入到BERT模型中,得到所述第一目標(biāo)語(yǔ)句中被掩藏的文字所在的各個(gè)位置上的第一候選文字列表,以及每個(gè)第一候選文字列表中的各第一候選文字的置信度。
5.如權(quán)利要求1所述的干擾詞生成方法,其特征在于,所述方法還包括:
獲取待掩藏語(yǔ)句;
按照指定掩藏位置,對(duì)所述待掩藏語(yǔ)句中的文字進(jìn)行掩藏,得到所述第一目標(biāo)語(yǔ)句。
6.如權(quán)利要求1所述的干擾詞生成方法,其特征在于,所述方法還包括:
獲取第一待掩藏語(yǔ)句;
對(duì)所述第一待掩藏語(yǔ)句進(jìn)行分詞處理,得到所述第一待掩藏語(yǔ)句包括的各個(gè)詞語(yǔ);
對(duì)于每個(gè)詞語(yǔ),對(duì)該詞語(yǔ)進(jìn)行詞性分析,得到該詞語(yǔ)的詞性;
根據(jù)該詞語(yǔ)的詞性和預(yù)設(shè)詞語(yǔ)掩藏?cái)?shù)量,對(duì)所述第一待掩藏語(yǔ)句中的指定詞性對(duì)應(yīng)的詞語(yǔ)進(jìn)行掩藏,得到所述第一目標(biāo)語(yǔ)句。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司,未經(jīng)網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010188699.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





