[發明專利]一種基于卷積神經網絡的偽裝語音識別方法在審
| 申請號: | 201810214631.1 | 申請日: | 2018-03-15 |
| 公開(公告)號: | CN108806698A | 公開(公告)日: | 2018-11-13 |
| 發明(設計)人: | 康顯桂;梁惠欣 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G10L17/18 | 分類號: | G10L17/18;G10L17/02;G10L17/04 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 偽裝 語音識別 準確率 預處理操作 測試數據 訓練數據 原始語音 語音 分類 檢測 | ||
本發明公開了一種基于卷積神經網絡的偽裝語音識別方法,包括以下步驟:對偽裝語音和原始語音進行預處理操作;用訓練數據對原始卷積神經網絡進行訓練,訓練出一個模型;用測試數據對模型進行檢測,同時確定分類的準確率。本發明的識別方法的準確率較傳統方法有1個多百分點的提升,并且設計簡單。
技術領域
本發明涉及音頻取證領域,更具體地,涉及一種基于卷積神經網絡的偽裝語音識別方法。
背景技術
由于人們普遍的使用偽裝語音來進行社交活動的現象越來越多,對于語音識別系統性能的挑戰就越艱巨,因為語音識別系統的性能好壞與輸入系統中的語音是否是偽裝有密切聯系。據了解,語音編輯軟件中如Audacity,Cool Edit,PRAAT以及基于MATLAB工具的實時迭代頻譜算法得到的偽裝語音越來越簡單易行。使用人員不需要知道具體的偽裝過程就可以輕而易舉的改變語音的音調,這種方法廣泛地使用在音頻取證,娛樂,隱私的保護等方面。科技都是一把雙刃劍。除了上述的方便之外,還會衍生很多違法犯罪的行為。如使用偽裝后的語音進行電話詐騙,語音支付,以及在線聊天等方面。由于這些高質量的語音編輯軟件的產生,偽裝語音可以很容易被創造出來并且欺騙自動說話人識別系統,即自動說話人識別系統無法判斷出這個嫌疑人的身份,增加了司法人員破案的難度。因此,對于一個給定的語音,十分有必要判斷出該語音是否是偽裝語音。截至目前為止,對于偽裝語音的研究汗牛充棟。大部分是基于偽裝語音中的語音轉換(voice conversion)方面的研究,但是極少數是針對偽裝語音中的語音轉化(voice transformation)方面的研究。據最新的一項研究,傳統方法在基于語音轉化的偽裝語音方面的研究,其準確率在低偽裝因子(±4)時普遍偏低的缺點,本發明提出了一種基于卷積神經網絡的偽裝語音識別方法,結合深度學習的網絡架構,使其應用在偽裝語音識別方面進行取證研究,實現了較高的音頻檢測率,并且克服了傳統方法中的缺點。
發明內容
本發明的目的是解決上述一個或多個缺陷,提出一種基于卷積神經網絡的偽裝語音識別方法。
為實現以上發明目的,采用的技術方案是:
一種基于卷積神經網絡的偽裝語音識別方法,包括以下步驟:
S1:選定語音庫并對語音庫進行平均律變調,包括原始語音和偽裝語音,并將語音庫中的數據劃分為訓練數據和測試數據;
S2:對訓練數據和測試數據進行切割,同時對切割后的音頻片段進行預加重;
S3:利用短時傅里葉變換(STFT)對預加重后的音頻進行預處理,把一維數據變換為二維矩陣的形式;
S4:將訓練數據輸入到卷積神經網絡中進行訓練,得到訓練好的卷積神經網絡模型;
S5:將經過預處理后的測試數據輸入到訓練好的卷積神經網絡中進行二分類,得到分類的準確率。
優選的是,步驟S1中所述語音庫包括TIMIT,NIST,UME這三個語音庫。
優選的是,步驟S1中所述平均律變調包括對語音庫進行f=2α/12·fo 12平均律變調,其中,f是指變調后語音的音高,fo是指原始語音的音高,α表示偽裝因子,其取值范圍為[-11,11]。當α取正數時,音調升高,頻譜延長;當α取負數時,音調降低,頻譜壓縮。
優選的是,步驟S2所述對訓練數據和測試數據進行切割包括將訓練數據和測試數據切割為長度為1秒的語音片段。
優選的是,步驟S2所述預加重包括對所有語音進行加重因子為0.98的加重操作。
優選的是,步驟S3中所述短時傅里葉變換中窗口長度為256,重復點數為96,FFT長度1024。
優選的是,步驟S3所述短時傅里葉變換通過spectrogram函數進行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810214631.1/2.html,轉載請聲明來源鉆瓜專利網。





