[發明專利]用于識別合成語音的方法、裝置、設備和介質在審
| 申請號: | 202010747937.0 | 申請日: | 2020-07-30 |
| 公開(公告)號: | CN111899718A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 殷翔 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/033;G10L25/27 |
| 代理公司: | 北京海智友知識產權代理事務所(普通合伙) 11455 | 代理人: | 吳京順 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 合成 語音 方法 裝置 設備 介質 | ||
本公開的實施例公開了用于識別合成語音的方法、裝置、設備和介質。該方法的一具體實施方式包括:獲取待識別語音;對待識別語音進行識別,以生成用于指示待識別語音是否屬于合成語音的預指示信息;基于預指示信息對待識別語音進行后處理,以生成用于指示待識別語音是否屬于合成語音的指示信息。該實施方式可以兼顧識別的準確率和效率,從而提升了對合成語音進行識別的效果。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及用于識別合成語音的方法、裝置、設備和介質。
背景技術
語音合成,又稱文語轉換(Text to Speech,TTS)技術,是利用電子計算機和一些專門裝置模擬人,制造語音的技術。
隨著合成語音與真實語音越來越接近,如何鑒別哪些聲音是真實的,哪些是偽造的是當前研究的一項重要課題,關系著諸如聲紋識別、語音解鎖等識別技術的安全性。
發明內容
本公開提出了用于識別合成語音的方法和裝置。
第一方面,本公開的實施例提供了一種用于識別合成語音的方法,該方法包括:獲取待識別語音;對待識別語音進行識別,以生成用于指示待識別語音是否屬于合成語音的預指示信息;基于預指示信息對待識別語音進行后處理,以生成用于指示待識別語音是否屬于合成語音的指示信息。
在一些實施例中,上述對待識別語音進行識別,以生成用于指示待識別語音是否屬于合成語音的預指示信息,包括:將待識別語音輸入至預先訓練的合成語音識別模型,得到用于指示待識別語音是否屬于合成語音的預指示信息,其中,合成語音識別模型用于表征預指示信息與待識別語音之間的對應關系。
在一些實施例中,上述基于預指示信息對待識別語音進行后處理,以生成用于指示識別語音是否屬于合成語音的指示信息,包括:響應于確定所生成的預指示信息用于指示待識別語音屬于合成語音,對待識別語音進行后處理,以生成用于指示待識別語音是否屬于合成語音的指示信息。
在一些實施例中,上述對待識別語音進行后處理,以生成用于指示待識別語音是否屬于合成語音的指示信息,包括:從待識別語音中提取音素匹配的目標數目個語音切片;確定所提取的目標數目個語音切片之間的相似度;響應于確定所得到的相似度滿足預設條件,生成用于指示待識別語音屬于合成語音的指示信息。
在一些實施例中,上述合成語音識別模型通過以下步驟訓練得到:獲取訓練樣本集合,其中,訓練樣本集合中的訓練樣本包括樣本語音和樣本標注信息,樣本語音包括真實語音和與真實語音對應的合成語音,樣本標注信息用于指示語音是否屬于合成語音;將訓練樣本集合中的訓練樣本的樣本語音作為輸入,將與輸入的樣本語音對應的樣本標注信息作為期望輸出,訓練得到合成語音識別模型。
在一些實施例中,上述合成語音識別模型包括基于雙向門控循環單元(Bidirectional Gate Recurrent Unit,BGRU)的密集連接卷積網絡(DenseNet)。
在一些實施例中,該方法還包括:響應于確定所生成的指示信息用于指示待識別語音不屬于合成語音,對待識別語音進行語音識別,以生成識別文本;根據識別文本與預設驗證信息的匹配,確定是否執行解鎖操作。
第二方面,本公開的實施例提供了一種用于識別合成語音的裝置,該裝置包括:獲取單元,被配置成獲取待識別語音;預識別單元,被配置成對待識別語音進行識別,以生成用于指示待識別語音是否屬于合成語音的預指示信息;后處理單元,被配置成基于預指示信息對待識別語音進行后處理,以生成用于指示待識別語音是否屬于合成語音的指示信息。
第三方面,本公開的實施例提供了一種用于識別合成語音的電子設備,包括:一個或多個處理器;存儲裝置,其上存儲有一個或多個程序,當上述一個或多個程序被上述一個或多個處理器執行,使得該一個或多個處理器實現如上述用于識別合成語音的方法中任一實施例的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010747937.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可鎖定的多接口隔離開關
- 下一篇:注塑成型模具的鎖模方法





