[發(fā)明專利]脫敏處理方法及裝置、存儲介質(zhì)和電子裝置在審
| 申請?zhí)枺?/td> | 202011091998.2 | 申請日: | 2020-10-13 |
| 公開(公告)號: | CN112231748A | 公開(公告)日: | 2021-01-15 |
| 發(fā)明(設(shè)計)人: | 劉暢奕航;梁志婷;徐世超;徐浩 | 申請(專利權(quán))人: | 上海明略人工智能(集團(tuán))有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G10L25/03;G10L25/48 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 趙靜 |
| 地址: | 200232 上海市徐*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 處理 方法 裝置 存儲 介質(zhì) 電子 | ||
本發(fā)明提供了一種脫敏處理方法及裝置、存儲介質(zhì)和電子裝置,包括:獲取由語音采集設(shè)備采集得到的語音數(shù)據(jù);根據(jù)語音采集設(shè)備的身份信息,在預(yù)先建立的數(shù)據(jù)庫中查找與身份信息相匹配的脫敏實(shí)體集;將語音數(shù)據(jù)中與脫敏實(shí)體集中的脫敏實(shí)體相匹配的詞語進(jìn)行脫敏處理。通過本發(fā)明,解決了由于現(xiàn)有技術(shù)中的語音脫敏不能結(jié)合語境,導(dǎo)致的語音脫敏準(zhǔn)確率低的問題,進(jìn)而達(dá)到了可以結(jié)合語境對語音進(jìn)行脫敏處理,提高語音脫敏準(zhǔn)確率的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及通信領(lǐng)域,具體而言,涉及一種脫敏處理方法及裝置、存儲介質(zhì)和電子裝置。
背景技術(shù)
在語音識別領(lǐng)域中,用戶的賬號、密碼、地址等敏感信息如果直接暴露出來,會極大的影響用戶的財產(chǎn)和人身安全。
目前的語音脫敏處理僅針對個別詞語進(jìn)行脫敏處理,例如,涉及反動、暴力、色情、辱罵等詞語。用戶講話在場景中是存在一定的目的性,傳統(tǒng)方案不能根據(jù)語境變化動態(tài)選擇脫敏方案,脫敏效果差并且配置不靈活。
針對相關(guān)技術(shù)中,由于現(xiàn)有技術(shù)中的語音脫敏不能結(jié)合語境,導(dǎo)致的語音脫敏準(zhǔn)確率低的問題,目前尚未存在有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種脫敏處理方法及裝置、存儲介質(zhì)和電子裝置,以至少解決相關(guān)技術(shù)中由于現(xiàn)有技術(shù)中的語音脫敏不能結(jié)合語境,導(dǎo)致的語音脫敏準(zhǔn)確率低的問題。
根據(jù)本發(fā)明的一個實(shí)施例,提供了一種脫敏處理方法,包括:獲取由語音采集設(shè)備采集得到的語音數(shù)據(jù);根據(jù)所述語音采集設(shè)備的身份信息,在預(yù)先建立的數(shù)據(jù)庫中查找與所述身份信息相匹配的脫敏實(shí)體集;將所述語音數(shù)據(jù)中與所述脫敏實(shí)體集中的脫敏實(shí)體相匹配的詞語進(jìn)行脫敏處理。
可選地,將所述語音數(shù)據(jù)中與所述脫敏實(shí)體集中的脫敏實(shí)體相匹配的詞語進(jìn)行脫敏處理,包括:將所述語音數(shù)據(jù)拆分為N組語音數(shù)據(jù)集,其中,所述N組語音數(shù)據(jù)集分別是由N對象發(fā)出的語音數(shù)據(jù),一組語音數(shù)據(jù)集對應(yīng)于一個對象,N是大于或等于1的整數(shù);根據(jù)每組語音數(shù)據(jù)集相對應(yīng)的對象的身份標(biāo)識,在所述脫敏實(shí)體集中確定與所述身份標(biāo)識相對應(yīng)的脫敏實(shí)體子集;將所述每組語音數(shù)據(jù)集中與對應(yīng)的所述脫敏實(shí)體子集中的脫敏實(shí)體相匹配的詞語進(jìn)行脫敏處理。
可選地,在所述根據(jù)所述語音采集設(shè)備的身份信息,在預(yù)先建立的數(shù)據(jù)庫中查找與所述身份信息相匹配的脫敏實(shí)體集之前,所述方法包括:建立所述語音采集設(shè)備的身份信息、所述對象的身份標(biāo)識,和所述脫敏實(shí)體子集之間的映射關(guān)系;將所述映射關(guān)系存儲在所述數(shù)據(jù)庫中。
可選地,將所述語音數(shù)據(jù)中與所述脫敏實(shí)體集中的脫敏實(shí)體相匹配的詞語進(jìn)行脫敏處理,包括:將所述每組語音數(shù)據(jù)集中的詞語與所述脫敏實(shí)體子集中的脫敏實(shí)體進(jìn)行匹配;將與所述每組語音數(shù)據(jù)集中與所述脫敏實(shí)體相匹配的詞語替換為預(yù)設(shè)字符。
可選地,將所述語音數(shù)據(jù)中與所述脫敏實(shí)體集中的脫敏實(shí)體相匹配的詞語進(jìn)行脫敏處理,還包括:將所述每組語音數(shù)據(jù)集中的詞語與所述脫敏實(shí)體子集中的脫敏實(shí)體進(jìn)行匹配;刪除與所述每組語音數(shù)據(jù)集中與所述脫敏實(shí)體相匹配的詞語。
根據(jù)本發(fā)明的另一個實(shí)施例,提供了一種脫敏處理裝置,包括:獲取模塊,用于獲取由語音采集設(shè)備采集得到的語音數(shù)據(jù);查找模塊,用于根據(jù)所述語音采集設(shè)備的身份信息,在預(yù)先建立的數(shù)據(jù)庫中查找與所述身份信息相匹配的脫敏實(shí)體集;處理模塊,用于將所述語音數(shù)據(jù)中與所述脫敏實(shí)體集中的脫敏實(shí)體相匹配的詞語進(jìn)行脫敏處理。
可選地,所述處理模塊包括:拆分單元,用于將所述語音數(shù)據(jù)拆分為N組語音數(shù)據(jù)集,其中,所述N組語音數(shù)據(jù)集分別是由N對象發(fā)出的語音數(shù)據(jù),一組語音數(shù)據(jù)集對應(yīng)于一個對象,N是大于或等于1的整數(shù);確定單元,用于根據(jù)每組語音數(shù)據(jù)集相對應(yīng)的對象的身份標(biāo)識,在所述脫敏實(shí)體集中確定與所述身份標(biāo)識相對應(yīng)的脫敏實(shí)體子集;處理單元,用于將所述每組語音數(shù)據(jù)集中與對應(yīng)的所述脫敏實(shí)體子集中的脫敏實(shí)體相匹配的詞語進(jìn)行脫敏處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海明略人工智能(集團(tuán))有限公司,未經(jīng)上海明略人工智能(集團(tuán))有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011091998.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計算機(jī)或計算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計算機(jī)系統(tǒng)或計算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程





