[發(fā)明專利]語音喚醒測試方法、裝置、設備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202310403853.9 | 申請日: | 2023-04-14 |
| 公開(公告)號: | CN116416971A | 公開(公告)日: | 2023-07-11 |
| 發(fā)明(設計)人: | 赫甲帥;左嘉琪 | 申請(專利權(quán))人: | 北京聲智科技有限公司 |
| 主分類號: | G10L15/01 | 分類號: | G10L15/01;G10L15/00;G10L15/22;G10L15/26;G10L15/30 |
| 代理公司: | 北京三高永信知識產(chǎn)權(quán)代理有限責任公司 11138 | 代理人: | 邢少真 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 喚醒 測試 方法 裝置 設備 介質(zhì) | ||
1.一種語音喚醒測試方法,其特征在于,所述方法包括:
獲取喚醒詞對應的語音數(shù)據(jù);
通過口音轉(zhuǎn)換、語速調(diào)節(jié)、噪聲調(diào)節(jié)和尾端點調(diào)節(jié)中的至少一項,對所述語音數(shù)據(jù)進行擴充,得到多條測試數(shù)據(jù);
基于所述多條測試數(shù)據(jù),對電子設備進行語音喚醒測試,得到所述多條測試數(shù)據(jù)對應的喚醒結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過口音轉(zhuǎn)換,對所述語音數(shù)據(jù)進行擴充,得到多條測試數(shù)據(jù),包括:
獲取多個聲調(diào)變化參數(shù),所述聲調(diào)變化參數(shù)用于指示所述喚醒詞的聲調(diào)變化;
基于獲取的多個聲調(diào)變化參數(shù),分別對所述語音數(shù)據(jù)進行聲調(diào)調(diào)整,得到多條測試數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述多個聲調(diào)變化參數(shù)包括多個方言分別對應的聲調(diào)變化參數(shù),所述聲調(diào)變化參數(shù)用于指示采用所述方言說出所述喚醒詞時,所述喚醒詞的聲調(diào)變化;或者,所述多個聲調(diào)變化參數(shù)包括隨機生成的聲調(diào)變化參數(shù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過口音轉(zhuǎn)換,對所述語音數(shù)據(jù)進行擴充,得到多條測試數(shù)據(jù),包括:
將所述喚醒詞轉(zhuǎn)換成對應的方言詞語;
合成所述方言詞語對應的語音數(shù)據(jù),將所述方言詞語對應的語音數(shù)據(jù)作為測試數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過語速調(diào)節(jié),對所述語音數(shù)據(jù)進行擴充,得到多條測試數(shù)據(jù),包括:
通過調(diào)節(jié)所述語音數(shù)據(jù)的波長,得到語速調(diào)節(jié)后的語音數(shù)據(jù);
將所述語速調(diào)節(jié)后的語音數(shù)據(jù),作為測試數(shù)據(jù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述通過調(diào)節(jié)所述語音數(shù)據(jù)的波長,得到語速調(diào)節(jié)后的語音數(shù)據(jù),包括以下至少一項:
增大所述語音數(shù)據(jù)的波長,以得到語速減慢的語音數(shù)據(jù);
減小所述語音數(shù)據(jù)的波長,以得到語速加快的語音數(shù)據(jù);
對所述語音數(shù)據(jù)的多個波長進行隨機增大或減小,以得到語速調(diào)節(jié)后的語音數(shù)據(jù)。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過噪聲調(diào)節(jié),對所述語音數(shù)據(jù)進行擴充,得到多條測試數(shù)據(jù),包括:
通過對所述語音數(shù)據(jù)進行加噪或者減噪處理,得到測試數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述通過對所述語音數(shù)據(jù)進行加噪或者減噪處理,得到測試數(shù)據(jù),包括以下至少一項:
獲取多條噪聲數(shù)據(jù),將所述語音數(shù)據(jù)與所述多條噪聲數(shù)據(jù)分別進行組合,得到多條測試數(shù)據(jù);
基于多條噪聲數(shù)據(jù),確定多個噪聲組合,每個噪聲組合包括至少兩條噪聲數(shù)據(jù);將所述語音數(shù)據(jù)與所述多個噪聲組合分別進行組合,得到多條測試數(shù)據(jù);
針對獲取的每條噪聲數(shù)據(jù),從所述語音數(shù)據(jù)的完整時間段中隨機確定第一時間段,將所述噪聲數(shù)據(jù)添加到所述語音數(shù)據(jù)的第一時間段中,得到測試數(shù)據(jù);
采用多種去噪方法,分別對所述語音數(shù)據(jù)進行去噪處理,得到多條測試數(shù)據(jù)。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過尾端點調(diào)節(jié),對所述語音數(shù)據(jù)進行擴充,得到多條測試數(shù)據(jù),包括:
確定第一時長,所述第一時長為小于所述語音數(shù)據(jù)的完整時長的任一時長;
從所述語音數(shù)據(jù)的尾部裁減掉所述第一時長的語音數(shù)據(jù),得到測試數(shù)據(jù)。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述多條測試數(shù)據(jù),對電子設備進行語音喚醒測試,得到所述多條測試數(shù)據(jù)對應的喚醒結(jié)果,包括:
基于所述多條測試數(shù)據(jù)生成匯總文檔,一條測試數(shù)據(jù)對應所述匯總文檔的一行,所述行中記錄有所述測試數(shù)據(jù)的調(diào)節(jié)參數(shù),所述調(diào)節(jié)參數(shù)用于指示對所述語音數(shù)據(jù)的調(diào)節(jié)方式;
在基于任一條測試數(shù)據(jù),對所述電子設備進行語音喚醒測試,得到所述測試數(shù)據(jù)對應的喚醒結(jié)果之后,在所述測試數(shù)據(jù)對應的行中添加所述喚醒結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京聲智科技有限公司,未經(jīng)北京聲智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310403853.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





