[發(fā)明專利]語音合成的方法及裝置有效
| 申請?zhí)枺?/td> | 202010563888.5 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111883103B | 公開(公告)日: | 2021-12-24 |
| 發(fā)明(設計)人: | 黃磊;蔣寧;楊春勇;靳丁南;權圣 | 申請(專利權)人: | 馬上消費金融股份有限公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/04;G10L13/02 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;張博 |
| 地址: | 404100 重慶市渝北區(qū)*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 合成 方法 裝置 | ||
1.一種語音合成的方法,其特征在于,包括:
獲取交互式問答結果的文本,所述文本包括:常量文本和變量文本;
從常量錄音庫獲取與所述常量文本對應的常量語音;
根據所述變量文本,通過端到端模型獲取變量語音;
根據所述文本中的內容,對所述常量語音和變量語音中端點語音信號前后一個字進行拼接,并調整經過拼接的所述常量語音和變量語音的語音合成自然度;
其中,所述調整經過拼接的所述常量語音和變量語音的語音合成自然度,包括:
對變量語音進行語音信號衰減處理;
對與所述變量語音進行拼接的常量語音進行語音信號衰減處理;
其中,所述對變量語音進行語音信號衰減處理,包括:
根據所述變量語音中的每個語音信號的能量值,確定所述變量語音的語音信號的平均能量值;
根據所述平均能量值和預設的語音信號衰減度,確定語音信號衰減的位置;
根據所述語音信號衰減的位置和預設衰減系數,進行語音信號衰減處理;
所述對與所述變量語音進行拼接的常量語音進行語音信號衰減處理,包括:
根據預設的語音信號衰減度,對與所述變量語音進行拼接的常量語音進行語音信號衰減處理;
所述根據所述平均能量值和預設的語音信號衰減度,確定語音信號衰減的位置,包括:
按照從前向后的順序遍歷數組,確定所述數組中第一個大于所述平均能量值的第一位置;
如果所述第一位置大于第二位置,則確定語音信號衰減的位置為第二位置;否則,確定語音信號衰減的位置為所述第一位置,所述第二位置是按照第一衰減比例和所述變量語音的時長確定的位置;
或者,
按照從后向前的順序遍歷數組,確定所述數組中第一個大于平均能量值的第三位置;
如果所述第三位置大于第四位置,則確定語音信號衰減的位置為第三位置;否則,確定語音信號衰減的位置為所述第四位置,所述第四位置是按照第二衰減比例和所述變量語音的時長確定的位置;
其中,所述數組的長度為所述變量語音的時長,所述數組是根據兩個相鄰步長的語音信號的能量值的最大值確定的,所述步長是根據所述變量語音的語音信號的能量值的長度和所述變量語音的時長確定的。
2.根據權利要求1所述的方法,其特征在于,所述根據所述變量文本,通過端到端模型獲取變量語音,包括:
判斷變量錄音庫中是否有與所述變量文本對應的變量語音;
如果有,則從變量錄音庫獲取與所述變量文本對應的變量語音,根據所述文本中的內容,對所述常量語音和變量語音進行拼接,并調整所述常量語音和變量語音的語音合成自然度;
如果沒有,則通過端到端模型獲取目標變量語音。
3.根據權利要求2所述的方法,其特征在于,所述調整所述常量語音和變量語音的語音合成自然度,包括:
對所述常量語音和變量語音的音量和/或語速進行調整;
和/或,
對所述常量語音和變量語音中信號能量值小于預設數值的語音信號進行切除;
和/或,
對所述常量語音和變量語音中信號能量值小于預設數值,但具有預設清輔音發(fā)音的語音信號進行保留。
4.根據權利要求1所述的方法,其特征在于,所述根據所述變量語音中的每個語音信號的能量值,確定所述變量語音的語音信號的平均能量值,包括:
根據所述變量語音的語音信號的能量值的長度和所述變量語音的時長,得到步長;
計算兩個相鄰步長的語音信號的能量值的最大值;
根據所述兩個相鄰步長的語音信號的能量值的最大值,得到數組,所述數組的長度為所述變量語音的時長;
對所述數組進行歸一化,得到所述變量語音的語音信號的平均能量值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于馬上消費金融股份有限公司,未經馬上消費金融股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010563888.5/1.html,轉載請聲明來源鉆瓜專利網。





