[發明專利]一種基于生成式對抗網絡的語音生成方法在審
| 申請號: | 201910200100.1 | 申請日: | 2019-03-15 |
| 公開(公告)號: | CN111768784A | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 王詩俊;吳粵 | 申請(專利權)人: | 上海火商智能科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06;G10L25/30 |
| 代理公司: | 深圳市創富知識產權代理有限公司 44367 | 代理人: | 曾敬 |
| 地址: | 201318 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生成 對抗 網絡 語音 方法 | ||
1.一種基于生成式對抗網絡的語音生成方法,其特征在于,包括:
接收語音數據,識別所述語音數據獲得識別文本;
將所述識別文本輸入預置的跟問模型得到跟問文本;
輸出所述跟問文本。
2.根據權利要求1所述的方法,其特征在于,所述跟問模型為生成式對抗網絡中的生成模型。
3.根據權利要求2所述的方法,其特征在于,所述生成模型通過如下方式進行訓練:
從跟問語句庫中抽取訓練語句及所述訓練語句對應的跟問語句;
將所述訓練語句輸入所述生成模型得到模擬語句;
通過判別模型對比所述跟問語句與所述模擬語句,得到所述跟問語句與所述模擬語句的對比值,將所述對比值反饋至所述生成模型,以使所述生成模型和所述判別模型基于互相對抗過程循環更新;
當所述對比值不大于預設的判別閾值時,通過所述生成模型生成所述識別文本的所述跟問文本。
4.根據權利要求3所述的方法,其特征在于,循環更新所述生成模型包括:
采用第一目標函數和隨機梯度下降法循環更新所述生成模型,所述第一目標函數為:其中,θ表示所述生成模型的參數,D表示所述判別模型,Z表示所述模擬語句,m表示采樣容量,i表示采樣點。
5.根據權利要求3所述的方法,其特征在于,循環更新所述判別模型包括:
采用第二目標函數和隨機梯度上升法循環更新所述判別模型,所述第二目標函數為:其中,θ表示所述生成模型的參數,D表示所述判別模型,Z表示所述模擬語句,m表示采樣容量,i表示采樣點。
6.根據權利要求4或5所述的方法,其特征在于,θ的計算公式為:
其中,c為所述生成模型的輸入,x為所述生成模型的輸出,P為所述生成模型的概率分布函數,R為所述判別模型的輸出。
7.根據權利要求4所述的方法,其特征在于,采用第一損失函數訓練所述生成模型,所述第一損失函數為:其中,c為所述生成模型的輸入,x為所述生成模型的輸出,P為所述生成模型的概率分布函數,R為所述判別模型的輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海火商智能科技有限公司,未經上海火商智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910200100.1/1.html,轉載請聲明來源鉆瓜專利網。





