[發明專利]音頻關鍵詞加密方法、裝置、存儲介質及電子裝置在審
| 申請號: | 202010784876.5 | 申請日: | 2020-08-06 |
| 公開(公告)號: | CN111899741A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 劉志龍;梁志婷;徐世超;徐浩 | 申請(專利權)人: | 上海明略人工智能(集團)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;H04L29/08;H04L29/06;G06F40/284;G06F21/62 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 劉旺貴 |
| 地址: | 200232 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 關鍵詞 加密 方法 裝置 存儲 介質 電子 | ||
本發明實施例提供了一種音頻關鍵詞加密方法、裝置、存儲介質及電子裝置,該方法包括:對第一音頻數據進行語音識別得到對應的文本數據,并將所述文本數據中的關鍵詞進行提取;獲取與所述關鍵詞對應的混淆音頻片段;將所述第一音頻數據中與所述關鍵詞對應的音頻片段替換成所述混淆音頻片段,以形成第二音頻數據。通過本發明,由于將音頻數據進行語音識別得到對應的文本數據,并根據文本數據加密方法將該音頻數據對應的片段替換成混淆音頻得到加密的音頻數據,因此,可以解決相關技術中難以具體地針對音頻數據中的關鍵詞進行加密解密的問題,提高了音頻數據的安全性、降低了隱私音頻信息泄密的可能性。
技術領域
本發明實施例涉及音頻加密領域,具體而言,涉及一種音頻關鍵詞加密方法、裝置、存儲介質及電子裝置。
背景技術
近年來隨著互聯網技術的發展,人們獲得多媒體文件,如CD、VCD/DVD格式的數字音視頻片等的途徑和方式也發生了根本性的變化。從以往購買以CD、VCD、DVD為載體的實物商品,轉變為通過各種電子智能終端,如PC機、平板電腦、移動智能終端(即手機)從互聯網在線播放或下載后進行播放的方式獲取。
由于發布在互聯網上的多媒體文件,多以原始文件的形式存在,也有將原始文件進行簡單分割后以幾個文件片段的形式存儲在網絡的;稍復雜點的,對分發的多媒體文件或多媒體流文件,采用基于超文本傳輸協議(HyperText Transfer Protocol,HTTP)進行文件傳輸,容易被嗅探得到資源下載路徑得到原始多媒體文件。因而,網絡用戶能夠輕而易舉地直接通過在線播放或下載的方式就能免費獲得和使用這樣的原始多媒體文件,這對包含在該多媒體文件中的作品享有著作權的權利人而言,是一種權益侵害,同時,這種行為還涉嫌違反著作權法。
并且,隨著人工智能AI技術的不斷普及和發展,通過語音來進行數據的交流和處理已不再是奢望。然而,目前研究人員很少涉及語音隱私信息的檢測。并且,目前的語音檢測方法并不足以精確地判斷含有語音隱私信息的音頻數據中哪些內容屬于語音隱私信息,也不能精確地表示出語音隱私信息在音頻數據中的位置。
當大量的音頻數據在云服務端之間儲存讀取時,如果對這些音頻數據不進行加密處理,其中的隱私信息很容易被竊取。針對前述的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種音頻關鍵詞加密方法、裝置、存儲介質及電子裝置,以至少解決相關技術中難以具體地針對音頻數據中的關鍵詞進行加密解密的問題。
根據本發明的一個實施例,提供了一種音頻關鍵詞加密方法,包括:對第一音頻數據進行語音識別得到對應的文本數據,并將所述文本數據中的關鍵詞進行提取;獲取與所述關鍵詞對應的混淆音頻片段;將所述第一音頻數據中與所述關鍵詞對應的音頻片段替換成所述混淆音頻片段,以形成第二音頻數據。
在一個示例性實施例中,所述獲取與所述關鍵詞對應的混淆音頻片段,還包括:從預設的密碼數據庫中查詢并獲取所述混淆音頻片段;或者當所述密碼數據庫中沒有與所述關鍵詞對應的混淆音頻片段時,隨機生成所述混淆音頻片段,并將所述關鍵詞及其對應的所述混淆音頻片段存入所述密碼數據庫中。
在一個示例性實施例中,在形成第二音頻數據之后,還包括:當對所述第二音頻數據進行解密時,獲取與所述關鍵詞對應的所述第一音頻數據的音頻片段,將所述第二音頻數據中的所述混淆音頻片段替換成與所述關鍵詞對應的所述第一音頻數據的音頻片段,以形成所述第一音頻數據。
在一個示例性實施例中,所述混淆音頻片段包括無聲音頻片段。
根據本發明的另一個實施例,提供了一種音頻關鍵詞加密裝置,包括:識別提取模塊,用于對第一音頻數據進行語音識別得到對應的文本數據,并將所述文本數據中的關鍵詞進行提取;獲取模塊,用于獲取與所述關鍵詞對應的混淆音頻片段;替換模塊,用于將所述第一音頻數據中與所述關鍵詞對應的音頻片段替換成所述混淆音頻片段,以形成第二音頻數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010784876.5/2.html,轉載請聲明來源鉆瓜專利網。





