[發明專利]高保真的智能客服語音合成方法有效
| 申請號: | 201811584612.4 | 申請日: | 2018-12-24 |
| 公開(公告)號: | CN109686358B | 公開(公告)日: | 2021-11-09 |
| 發明(設計)人: | 劉嗣平;柯登峰;陳孟達;賈宇康 | 申請(專利權)人: | 廣州九四智能科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/08;G10L13/10 |
| 代理公司: | 深圳科灣知識產權代理事務所(普通合伙) 44585 | 代理人: | 李曉林 |
| 地址: | 510000 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 高保真 智能 客服 語音 合成 方法 | ||
1.一種高保真的智能客服語音合成方法,其特征在于,包括如下步驟:
A)錄音人員根據設置好的文本進行語音的錄制;
B)建立初始語料庫;所述初始語料庫為變量特征語料庫,所述變量特征語料庫中至少包含常用字、常用詞語、有關錢類的量詞以及一到十的語句;
C)利用設定算法對所述初始語料庫中錄制好的語音進行強制對齊;
D)對強制對齊后的語音進行切割,得到三音子模型;
E)利用所述三音子模型形成處理完好的目標語料庫;
F)對于所述目標語料庫中切割好的三音子基元計算似然;所述步驟F)進一步包括:
F1)對所述目標語料庫中切割好的三音子基元,采用三音子的中間音素將所有的三音子進行劃分;
F2)進行強制對齊之后,從左到右掃描所述三音子,得到對應的特征向量;
F3)利用所述三音子對應的所有的特征向量,根據其個數與平方和來計算似然,最終得到狀態集的似然;
G)建立三音子決策樹;所述步驟G)進一步包括:
G1)在建樹的過程中,葉結點的形成過程是根據分裂之后,左右結點的似然度和與分裂前的似然度差值,作為似然度的變化量;
G2)從問題集中選擇似然度變化最大的問題;
G3)當似然度變化量小于事先設定的閾值時或分裂后的似然度小于事先設定的閾值時,則停止分裂,認定其為葉子結點;
G4)完成所述目標語料庫中所有的三音子基元的聚類,得到最終的三音子決策樹;
H)根據所需合成文本,選擇合適的三音子基元;
I)對選擇好的三音子基元,針對原始語音波形做基音同步標注;
J)對所述原始語音波形的基音曲線與目標基音曲線建立映射,得到短時合成信號序列;
J1)將原始語音信號與一系列基音同步的窗函數相乘,得到相互重疊的短時分析信號;
J2)根據原始語音波形的基音曲線和超音段特征與目標基音曲線和超音段特征修正的要求,建立合成語音波形與原始語音波形之間的基音周期的映射關系,得到合成所需的短時合成信號序列;
K)將所述短時信號序列與目標基音周期同步排列,重疊相加得到拼接合成的語音;
L)將所述合成的語音插入到提前錄制好的語音中。
2.根據權利要求1所述的高保真的智能客服語音合成方法,其特征在于,所述設定算法為force-alignment算法。
3.根據權利要求1或2所述的高保真的智能客服語音合成方法,其特征在于,在所述步驟H)中,在向下尋找與目標三音子對應的葉子結點時,如果未找到與其對應的合適的葉子結點,則尋找到似然度提升最大的結點,將其作為同一類,得到與目標三音子最接近的三音子基元。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州九四智能科技有限公司,未經廣州九四智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811584612.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:防竊聽通話裝置
- 下一篇:語音輸出方法、終端及計算機可讀存儲介質





