[發明專利]面向語音通信的身份信息隱藏方法有效
| 申請號: | 201810120029.1 | 申請日: | 2018-02-06 |
| 公開(公告)號: | CN108510995B | 公開(公告)日: | 2021-06-08 |
| 發明(設計)人: | 簡志華;張石磊 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G10L21/003 | 分類號: | G10L21/003;G10L21/013;G10L25/24 |
| 代理公司: | 浙江千克知識產權代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 語音 通信 身份 信息 隱藏 方法 | ||
本發明公開了一種面向語音通信的身份信息隱藏方法,其按如下步驟進行:一、語音源建模;二、生成語音字典;三、采用身份信息隱藏算法將用戶的語音轉換成了與該用戶差異最大的語音源的聲音。通過建立N個說話人的語音庫,并提取特征參數儲存的方式,解決傳統語音轉換方法中需要對不同說話人建立不同轉換函數的弊端。在本發明中,對于不同的用戶,只需要少量語音數據就可以根據相似度選擇轉換函數,而不再需要重新訓練轉換函數即可實現身份信息隱藏,方便用戶使用。
技術領域
本發明屬于信息安全技術領域,具體涉及一種面向語音通信的身份信息隱藏方法。
背景技術
說話人身份隱藏技術是指保持語言語義信息不變的情況下,改變說話人的個性特征,達到隱藏說話人身份的目的,在保密通信領域具有非常重要的應用。目前,在說話人身份隱藏技術中,常用的方法是通過改變語音的基頻,達到變聲的效果,但是這種方法語音的聽覺質量較差。此外還有一種是通過語音轉換技術,實現基頻和聲道譜同時轉換,合成具有更高質量的語音,但是這種方式,需要獲取大量源、目標說話人的對稱語音數據(即語義內容相同的語音),建立語音的轉換函數,不同的說話人需要建立不同的轉換函數。在使用過程中,用戶需要錄制較多的語音數據,費時費力,在實際應用中使用不方便。
發明內容
針對現有技術存在的上述問題,本發明提出了一種面向語音通信的身份信息隱藏方法,其通過建立預訓練的語音轉換函數庫,可以便捷、實時地進行說話人身份隱藏。
為達到上述技術目的,本發明采取如下技術方案:
一種面向語音通信的身份信息隱藏方法,其按如下步驟進行:
一、說話人即語音源建模
具體的,利用GMM對每個說話人即語音源的語音特征參數空間進行建模,它是用多個高斯分布的概率密度的組合來描述特征矢量在概率空間的分布狀況,每個人對應一個GMM,即
其中,x為d維特征矢量;ωm為混合權重,且滿足為d維高斯函數,表示GMM模型的第m個高斯分量;μm表示該高斯分量的均值矢量;∑m表示協方差矩陣。整個高斯混合模型(GMM)由各混合分量的均值矢量、協方差矩陣以及混合權重來描述,用λ來表示該模型,有:
λ={ωm,μm,∑m},m=1,2,...,M (3)
模型參數λ是通過期望最大(Expectation Maximization,EM)算法求得,假設語音特征參數空間是長度為T的矢量序列X={xt,t=1,2,...,T},則有:
通過上述EM算法求解GMM模型參數,為每個說話人分別構建一個GMM模型。
二、生成語音字典
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810120029.1/2.html,轉載請聲明來源鉆瓜專利網。





