[發(fā)明專利]用于識別合成語音的方法、裝置、設備和介質在審
| 申請?zhí)枺?/td> | 202010747937.0 | 申請日: | 2020-07-30 |
| 公開(公告)號: | CN111899718A | 公開(公告)日: | 2020-11-06 |
| 發(fā)明(設計)人: | 殷翔 | 申請(專利權)人: | 北京字節(jié)跳動網絡技術有限公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/033;G10L25/27 |
| 代理公司: | 北京海智友知識產權代理事務所(普通合伙) 11455 | 代理人: | 吳京順 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 合成 語音 方法 裝置 設備 介質 | ||
1.一種用于識別合成語音的方法,包括:
獲取待識別語音;
對所述待識別語音進行識別,以生成用于指示所述待識別語音是否屬于合成語音的預指示信息;
基于所述預指示信息對所述待識別語音進行后處理,以生成用于指示所述待識別語音是否屬于合成語音的指示信息。
2.根據權利要求1所述的方法,其中,所述對所述待識別語音進行識別,以生成用于指示所述待識別語音是否屬于合成語音的預指示信息,包括:
將所述待識別語音輸入至預先訓練的合成語音識別模型,得到用于指示待識別語音是否屬于合成語音的預指示信息,其中,所述合成語音識別模型用于表征預指示信息與待識別語音之間的對應關系。
3.根據權利要求1所述的方法,其中,所述基于所述預指示信息對所述待識別語音進行后處理,以生成用于指示所述識別語音是否屬于合成語音的指示信息,包括:
響應于確定所生成的預指示信息用于指示所述待識別語音屬于合成語音,對所述待識別語音進行后處理,以生成用于指示所述待識別語音是否屬于合成語音的指示信息。
4.根據權利要求3所述的方法,其中,所述對所述待識別語音進行后處理,以生成用于指示所述待識別語音是否屬于合成語音的指示信息,包括:
從所述待識別語音中提取音素匹配的目標數(shù)目個語音切片;
確定所提取的目標數(shù)目個語音切片之間的相似度;
響應于確定所得到的相似度滿足預設條件,生成用于指示所述待識別語音屬于合成語音的指示信息。
5.根據權利要求2所述的方法,其中,所述合成語音識別模型通過以下步驟訓練得到:
獲取訓練樣本集合,其中,所述訓練樣本集合中的訓練樣本包括樣本語音和樣本標注信息,樣本語音包括真實語音和與真實語音對應的合成語音,樣本標注信息用于指示語音是否屬于合成語音;
將所述訓練樣本集合中的訓練樣本的樣本語音作為輸入,將與輸入的樣本語音對應的樣本標注信息作為期望輸出,訓練得到所述合成語音識別模型。
6.根據權利要求5所述的方法,其中,所述合成語音識別模型包括基于雙向門控循環(huán)單元BGRU的密集連接卷積網絡。
7.根據權利要求1-6之一所述的方法,其中,所述方法還包括:
響應于確定所生成的指示信息用于指示所述待識別語音不屬于合成語音,對所述待識別語音進行語音識別,以生成識別文本;
根據所述識別文本與預設驗證信息的匹配,確定是否執(zhí)行解鎖操作。
8.一種用于識別合成語音的裝置,包括:
獲取單元,被配置成獲取待識別語音;
預識別單元,被配置成對所述待識別語音進行識別,以生成用于指示所述待識別語音是否屬于合成語音的預指示信息;
后處理單元,被配置成基于所述預指示信息對所述待識別語音進行后處理,以生成用于指示所述待識別語音是否屬于合成語音的指示信息。
9.一種電子設備,包括:
一個或多個處理器;
存儲裝置,其上存儲有一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如權利要求1-7中任一所述的方法。
10.一種計算機可讀介質,其上存儲有計算機程序,其中,所述程序被處理器執(zhí)行時實現(xiàn)如權利要求1-7中任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節(jié)跳動網絡技術有限公司,未經北京字節(jié)跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010747937.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可鎖定的多接口隔離開關
- 下一篇:注塑成型模具的鎖模方法





