[發明專利]一種音頻數據融合方法在審
| 申請號: | 201811356310.1 | 申請日: | 2018-11-15 |
| 公開(公告)號: | CN109616127A | 公開(公告)日: | 2019-04-12 |
| 發明(設計)人: | 張敏 | 申請(專利權)人: | 建湖云飛數據科技有限公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L13/02;G10L13/08 |
| 代理公司: | 南京常青藤知識產權代理有限公司 32286 | 代理人: | 龔建良 |
| 地址: | 224000 江蘇省鹽城市建湖縣高新*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻數據 向量 嵌入 編碼數據 語義特征 參考 融合 編碼數據處理 風格特征 目標融合 語音數據 語音特征 解碼 發音 轉換 | ||
1.一種音頻數據融合方法,包括:
獲取待處理的音頻數據;
對所述音頻數據編碼,得到第一編碼數據;
獲取參考音頻數據和相應的參考語音數據;
對所述參考音頻數據編碼,得到第二編碼數據;
解碼所述第二編碼數據,得到參考融合音頻數據;
確定所述參考語音數據和所述參考融合音頻數據間的殘差;
獲取所述殘差模型中前向門循環單元層針對所述殘差進行前向運算時在最后一個時間步輸出的第一向量;
獲取所述殘差模型中后向門循環單元層針對所述殘差進行后向運算時在第一個時間步輸出的第二向量;
將所述第一向量和所述第二向量做差,獲得用于語音特征轉換的嵌入向量;所述嵌入向量,根據對應相同參考音頻數據的參考融合音頻數據和參考語音數據之間的殘差生成;
根據所述嵌入向量對所述第一編碼數據進行解碼,獲得經過語音特征轉換的目標融合音頻數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于建湖云飛數據科技有限公司,未經建湖云飛數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811356310.1/1.html,轉載請聲明來源鉆瓜專利網。





