[發明專利]自動化測試車機上TTS引擎發音人效果的系統及其方法在審
| 申請號: | 202210834355.5 | 申請日: | 2022-07-14 |
| 公開(公告)號: | CN115202611A | 公開(公告)日: | 2022-10-18 |
| 發明(設計)人: | 謝超 | 申請(專利權)人: | 安徽芯智科技有限公司 |
| 主分類號: | G06F3/16 | 分類號: | G06F3/16;G06Q10/06 |
| 代理公司: | 合肥正則元起專利代理事務所(普通合伙) 34160 | 代理人: | 周衛 |
| 地址: | 230000 安徽省合肥市高新區習友路3333*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動化 測試 車機上 tts 引擎 發音 效果 系統 及其 方法 | ||
1.自動化測試車機上TTS引擎發音人效果的系統,包括云端分析模塊,以及與之相連接的本地測試模塊,其特征在于:
本地測試模塊:在測試過程中,依次調用TTS引擎接口,并通過對應的發音人讀取若干類型測試文本,合成對應的測試音頻;以及
統計所述發音人讀取所述測試文本的平均耗時,并將所述測試音頻發送至所述云端分析模塊;
云端分析模塊:根據語音場景設置若干類型所述測試文本,并將若干類型所述測試文本發送至所述本地測試模塊;以及
將所述測試音頻與對應標準音頻比較,獲取相似度;同時聽音團隊對所述測試音頻進行試聽打分,獲取MOS得分。
2.根據權利要求1所述的自動化測試車機上TTS引擎發音人效果的系統,其特征在于,所述云端分析模塊根據智能汽車使用過程獲取若干語音場景,并為每個所述語音場景設置至少一個所述測試文本;其中,所述語音場景包括駕駛場景和娛樂場景。
3.根據權利要求1所述的自動化測試車機上TTS引擎發音人效果的系統,其特征在于,所述本地測試模塊接收到若干類型所述測試文本之后,調用TTS引擎接口,并以所述發音人為主導測試若干類型所述測試文本,獲取對應的所述測試音頻;或者
調用TTS引擎接口,以若干類型所述測試文本為主導,獲取對應的所述測試音頻;其中,TTS引擎接口與發音人一一對應。
4.根據權利要求1所述的自動化測試車機上TTS引擎發音人效果的系統,其特征在于,所述云端分析模塊將所述測試音頻和對應的標準音頻進行比較,包括:
接收到所述測試音頻之后,獲取對應的所述標準音頻;其中,所述標準音頻為所述測試音頻對應測試文本的期望輸出;
基于相似要素對比所述測試音頻和所述標準音頻,獲取所述相似度;其中,所述相似要素包括音色、響度和音調。
5.根據權利要求4所述的自動化測試車機上TTS引擎發音人效果的系統,其特征在于,所述云端分析模塊將所述測試音頻發送至相符合的所述聽音團隊,所述聽音團隊試聽所述測試音頻,獲取對應的所述MOS得分;
將相似度和MOS得分結合,獲取對應的所述測試音頻的音頻評分;以及基于若干所述測試音頻的音頻評分評估對應的所述發音人。
6.根據權利要求5所述的自動化測試車機上TTS引擎發音人效果的系統,其特征在于,所述云端分析模塊為若干類型所述語音場景設置關聯發音人,包括:
任意選擇一個所述語音場景;
獲取該語音場景對應的若干所述測試文本,計算各所述發音人測試若干所述測試文本的平均得分;
根據所述平均得分確定至少一個發音人作為目標發音人,將目標發音人與所述語音場景關聯。
7.根據權利要求1所述的自動化測試車機上TTS引擎發音人效果的系統,其特征在于,所述云端分析模塊與所述本地測試模塊通信和/或電氣連接;
所述本地測試模塊與車機系統通信和/或電氣連接。
8.自動化測試車機上TTS引擎發音人效果的方法,基于權利要求1至7任意一項所述的自動化測試車機上TTS引擎發音人效果的系統運行,其特征在于,根據語音場景設置若干類型測試文本,依次調用TTS引擎接口,并通過對應的發音人讀取若干類型測試文本,合成對應的測試音頻;
將所述測試音頻和對應標準音頻比較,獲取相似度;同時通過聽音團隊對所述測試音頻進行試聽打分,獲取MOS得分;
將所述相似度和所述MOS得分結合,獲取對應的所述測試音頻的音頻評分,基于若干所述測試音頻的音頻評分評估對應的所述發音人。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽芯智科技有限公司,未經安徽芯智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210834355.5/1.html,轉載請聲明來源鉆瓜專利網。





