[發明專利]用于文本轉語音性能評價的系統和方法有效
| 申請號: | 201380080087.1 | 申請日: | 2013-10-24 |
| 公開(公告)號: | CN105593936B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | C·伊澤特;賴勝;C·聚斯;H·胡 | 申請(專利權)人: | 寶馬股份公司 |
| 主分類號: | G10L25/69 | 分類號: | G10L25/69 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 李穎 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 文本 語音 性能 評價 系統 方法 | ||
1.一種用于自動評價不同文本轉語音引擎的文本轉語音性能的方法,包括:
提供多個語音樣本和與相應語音樣本關聯的得分;
預處理所述多個語音樣本,以便獲得經預處理的波形;
從每個所述經預處理的波形中提取特征;
基于從所述多個語音樣本獲得的、經預處理的波形而提取的特征和對應得分,建立語音模型;并且
通過語音模型評價文本轉語音引擎;
其中,所述提供步驟還包括:
記錄基于相同的一組訓練文本、來自多個語音源的多個語音樣本并且對所述多個語音樣本中的每個語音樣本分級,以向其分配得分;
其中,所述多個語音源包括多個文本轉語音引擎和方言不同以及發音的清晰度不同的人類;并且
其中,所述評價步驟還包括:
向被評價的文本轉語音引擎提供一組測試句子;
接收從所述一組測試句子由被評價的文本轉語音引擎所變換的語音;和
根據所建立的語音模型,計算每個語音的評價得分,其中,簡單的測試句子具有較低的權重,而復雜的測試句子具有較高的權重,并且每個評價得分被乘以相應的較低或較高的權重之后,被合計以用于確定最終評價得分。
2.按照權利要求1所述的方法,其中所述分級步驟通過選自由下列構成的組中的方法進行:平均意見得分、診斷接受度測量和理解測試。
3.按照權利要求1所述的方法,其中提取的特征包括時域特征和頻域特征中的一個或多個特征。
4.按照權利要求1所述的方法,其中所述建立步驟是通過利用隱式馬爾可夫模型、支持向量機、深度學習或神經網絡進行的。
5.一種用于自動評價不同文本轉語音引擎的文本轉語音性能的系統,包括:
包含多個語音樣本和與相應語音樣本關聯的得分的樣本庫;
被配置成根據所述多個語音樣本和對應得分建立語音模型的語音建模部分,所述語音建模部分還包括:
被配置成預處理所述多個語音樣本以便獲得經預處理的波形的預處理單元;
被配置成從每個經預處理的波形中提取特征的特征提取單元;和
被配置成通過提取的特征和對應得分建立語音模型的機器學習單元;
被配置成記錄基于相同的一組訓練文本、來自多個語音源的多個語音樣本的采樣部分,其中,所述多個語音源包括多個文本轉語音引擎和方言不同以及發音的清晰度不同的人類;
被配置成對所述多個語音樣本中的每個語音樣本分級以向其分配得分的分級部分,
被配置成通過語音模型評價文本轉語音引擎的評價部分,
所述評價部分還包括:
被配置成把保存于其中的一組測試句子提供給被評價的文本轉語音引擎的測試文本庫;
被配置成對從所述一組測試句子由文本轉語音引擎所變換的語音進行接收的語音庫;和
被配置成根據所建立的語音模型計算每個語音的評價得分的計算單元,
其中,所述語音模型用作進行文本轉語音引擎的自動評價的評價引擎,其中,簡單的測試句子具有較低的權重,而復雜的測試句子具有較高的權重,并且每個評價得分被乘以相應的較低或較高的權重之后,被合計以用于確定最終評價得分。
6.按照權利要求5所述的系統,其中所述分級部分被配置成通過選自由下列構成的組中的方法對每個語音樣本分級:平均意見得分、診斷接受度測量和理解測試。
7.按照權利要求5所述的系統,其中提取的特征包括時域特征和頻域特征中的一個或多個特征。
8.按照權利要求5所述的系統,其中所述機器學習單元被配置成通過利用隱式馬爾可夫模型、支持向量機、深度學習或神經網絡,進行語音模型的訓練。
9.一種計算機可讀介質,包括用于實現一種用于自動評價不同文本轉語音引擎的文本轉語音性能的方法的可執行指令,所述方法包括:
提供多個語音樣本和與相應語音樣本關聯的得分;
預處理所述多個語音樣本,以便獲得經預處理的波形;
從每個經預處理的波形中提取特征;
基于從所述多個語音樣本獲得的、經預處理的波形而提取的特征和對應得分,建立語音模型;
通過語音模型評價文本轉語音引擎,
所述提供步驟還包括:
記錄基于相同的一組訓練文本、來自多個語音源的多個語音樣本;并且對所述多個語音樣本中的每個語音樣本分級,以向其分配得分;
其中,所述多個語音源包括多個文本轉語音引擎和方言不同以及發音的清晰度不同的人類;并且
其中,所述評價步驟還包括:
向被評價的文本轉語音引擎提供一組測試句子;
接收從所述一組測試句子由被評價的文本轉語音引擎所變換的語音;和
根據所建立的語音模型,計算每個語音的評價得分,其中,簡單的測試句子具有較低的權重,而復雜的測試句子具有較高的權重,并且每個評價得分被乘以相應的較低或較高的權重之后,被合計以用于確定最終評價得分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寶馬股份公司,未經寶馬股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380080087.1/1.html,轉載請聲明來源鉆瓜專利網。





