[發明專利]語音合成系統評測方法、裝置、可讀存儲介質及終端設備在審
| 申請號: | 202110713810.1 | 申請日: | 2021-06-25 |
| 公開(公告)號: | CN113450768A | 公開(公告)日: | 2021-09-28 |
| 發明(設計)人: | 蘇雪琦;王健宗 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L15/01 | 分類號: | G10L15/01 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 劉永康 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 合成 系統 評測 方法 裝置 可讀 存儲 介質 終端設備 | ||
本發明屬于自然語言處理技術領域,尤其涉及一種語音合成系統評測方法、裝置、計算機可讀存儲介質及終端設備。所述方法包括:將預設的文本序列分別輸入至待評測的若干個語音合成系統中,并分別獲取各個語音合成系統的輸出語音序列;獲取與所述文本序列對應的基準語音序列;根據預設的若干個評測維度分別計算各個語音合成系統的輸出語音序列與所述基準語音序列之間的整體偏差距離;選取與所述基準語音序列之間的整體偏差距離最小的語音合成系統作為優選語音合成系統,并使用所述優選語音合成系統執行語音合成任務。通過本發明,可以在提高評測效率的同時也提高評測準確度。
技術領域
本發明屬于自然語言處理技術領域,尤其涉及一種語音合成系統評測方法、裝置、計算機可讀存儲介質及終端設備。
背景技術
隨著技術的發展,當前出現了很多種的語音合成系統,用于實現從文本到語音(Text To Speech,TTS)的轉換過程,不同的語音合成系統之間往往存在較大的性能差異,需要根據實際情況從中選取合適的語音合成系統來執行語音合成任務。但目前往往只能依靠用戶的主觀感受來對語音合成系統的優劣進行評測,效率低下且準確度較低。
發明內容
有鑒于此,本發明實施例提供了一種語音合成系統評測方法、裝置、計算機可讀存儲介質及終端設備,以解決現有的語音合成系統評測方法效率低下且準確度較低的問題。
本發明實施例的第一方面提供了一種語音合成系統評測方法,可以包括:
將預設的文本序列分別輸入至待評測的若干個不同的語音合成系統中,并分別獲取各個語音合成系統的輸出語音序列;
獲取與所述文本序列對應的基準語音序列;
根據預設的若干個評測維度分別計算各個語音合成系統的輸出語音序列與所述基準語音序列之間的整體偏差距離;
選取與所述基準語音序列之間的整體偏差距離最小的語音合成系統作為優選語音合成系統,并使用所述優選語音合成系統執行語音合成任務。
在第一方面的一種具體實現中,所述根據預設的若干個評測維度分別計算各個語音合成系統的輸出語音序列與所述基準語音序列之間的整體偏差距離,可以包括:
分別計算目標語音序列與所述基準語音序列在各個評測維度上的偏差距離,所述目標語音序列為任意一個語音合成系統的輸出語音序列;
根據所述目標語音序列與所述基準語音序列在各個評測維度上的偏差距離計算所述目標語音序列與所述基準語音序列之間的整體偏差距離。
在第一方面的一種具體實現中,所述評測維度可以包括特征向量、時長和音強;
所述分別計算目標語音序列與所述基準語音序列在各個評測維度上的偏差距離,可以包括:
計算所述目標語音序列與所述基準語音序列在特征向量這一評測維度上的偏差距離;
計算所述目標語音序列與所述基準語音序列在時長這一評測維度上的偏差距離;
計算所述目標語音序列與所述基準語音序列在音強這一評測維度上的偏差距離。
在第一方面的一種具體實現中,所述計算所述目標語音序列與所述基準語音序列在特征向量這一評測維度上的偏差距離,可以包括:
根據下式計算所述目標語音序列與所述基準語音序列在特征向量這一評測維度上的偏差距離:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110713810.1/2.html,轉載請聲明來源鉆瓜專利網。





