[發(fā)明專利]語音喚醒測試方法、裝置、設備及介質(zhì)在審

申請?zhí)枺?/td>	202310403853.9	申請日：	2023-04-14
公開（公告）號：	CN116416971A	公開（公告）日：	2023-07-11
發(fā)明（設計）人：	赫甲帥;左嘉琪	申請（專利權(quán)）人：	北京聲智科技有限公司
主分類號：	G10L15/01	分類號：	G10L15/01;G10L15/00;G10L15/22;G10L15/26;G10L15/30
代理公司：	北京三高永信知識產(chǎn)權(quán)代理有限責任公司 11138	代理人：	邢少真
地址：	100094 北京市海淀***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音喚醒測試方法裝置設備介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種語音喚醒測試方法，其特征在于，所述方法包括：

獲取喚醒詞對應的語音數(shù)據(jù)；

通過口音轉(zhuǎn)換、語速調(diào)節(jié)、噪聲調(diào)節(jié)和尾端點調(diào)節(jié)中的至少一項，對所述語音數(shù)據(jù)進行擴充，得到多條測試數(shù)據(jù)；

基于所述多條測試數(shù)據(jù)，對電子設備進行語音喚醒測試，得到所述多條測試數(shù)據(jù)對應的喚醒結(jié)果。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，通過口音轉(zhuǎn)換，對所述語音數(shù)據(jù)進行擴充，得到多條測試數(shù)據(jù)，包括：

獲取多個聲調(diào)變化參數(shù)，所述聲調(diào)變化參數(shù)用于指示所述喚醒詞的聲調(diào)變化；

基于獲取的多個聲調(diào)變化參數(shù)，分別對所述語音數(shù)據(jù)進行聲調(diào)調(diào)整，得到多條測試數(shù)據(jù)。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述多個聲調(diào)變化參數(shù)包括多個方言分別對應的聲調(diào)變化參數(shù)，所述聲調(diào)變化參數(shù)用于指示采用所述方言說出所述喚醒詞時，所述喚醒詞的聲調(diào)變化；或者，所述多個聲調(diào)變化參數(shù)包括隨機生成的聲調(diào)變化參數(shù)。

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，通過口音轉(zhuǎn)換，對所述語音數(shù)據(jù)進行擴充，得到多條測試數(shù)據(jù)，包括：

將所述喚醒詞轉(zhuǎn)換成對應的方言詞語；

合成所述方言詞語對應的語音數(shù)據(jù)，將所述方言詞語對應的語音數(shù)據(jù)作為測試數(shù)據(jù)。

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，通過語速調(diào)節(jié)，對所述語音數(shù)據(jù)進行擴充，得到多條測試數(shù)據(jù)，包括：

通過調(diào)節(jié)所述語音數(shù)據(jù)的波長，得到語速調(diào)節(jié)后的語音數(shù)據(jù)；

將所述語速調(diào)節(jié)后的語音數(shù)據(jù)，作為測試數(shù)據(jù)。

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述通過調(diào)節(jié)所述語音數(shù)據(jù)的波長，得到語速調(diào)節(jié)后的語音數(shù)據(jù)，包括以下至少一項：

增大所述語音數(shù)據(jù)的波長，以得到語速減慢的語音數(shù)據(jù)；

減小所述語音數(shù)據(jù)的波長，以得到語速加快的語音數(shù)據(jù)；

對所述語音數(shù)據(jù)的多個波長進行隨機增大或減小，以得到語速調(diào)節(jié)后的語音數(shù)據(jù)。

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，通過噪聲調(diào)節(jié)，對所述語音數(shù)據(jù)進行擴充，得到多條測試數(shù)據(jù)，包括：

通過對所述語音數(shù)據(jù)進行加噪或者減噪處理，得到測試數(shù)據(jù)。

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述通過對所述語音數(shù)據(jù)進行加噪或者減噪處理，得到測試數(shù)據(jù)，包括以下至少一項：

獲取多條噪聲數(shù)據(jù)，將所述語音數(shù)據(jù)與所述多條噪聲數(shù)據(jù)分別進行組合，得到多條測試數(shù)據(jù)；

基于多條噪聲數(shù)據(jù)，確定多個噪聲組合，每個噪聲組合包括至少兩條噪聲數(shù)據(jù)；將所述語音數(shù)據(jù)與所述多個噪聲組合分別進行組合，得到多條測試數(shù)據(jù)；

針對獲取的每條噪聲數(shù)據(jù)，從所述語音數(shù)據(jù)的完整時間段中隨機確定第一時間段，將所述噪聲數(shù)據(jù)添加到所述語音數(shù)據(jù)的第一時間段中，得到測試數(shù)據(jù)；

采用多種去噪方法，分別對所述語音數(shù)據(jù)進行去噪處理，得到多條測試數(shù)據(jù)。

9.根據(jù)權(quán)利要求1所述的方法，其特征在于，通過尾端點調(diào)節(jié)，對所述語音數(shù)據(jù)進行擴充，得到多條測試數(shù)據(jù)，包括：

確定第一時長，所述第一時長為小于所述語音數(shù)據(jù)的完整時長的任一時長；

從所述語音數(shù)據(jù)的尾部裁減掉所述第一時長的語音數(shù)據(jù)，得到測試數(shù)據(jù)。

10.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述基于所述多條測試數(shù)據(jù)，對電子設備進行語音喚醒測試，得到所述多條測試數(shù)據(jù)對應的喚醒結(jié)果，包括：

基于所述多條測試數(shù)據(jù)生成匯總文檔，一條測試數(shù)據(jù)對應所述匯總文檔的一行，所述行中記錄有所述測試數(shù)據(jù)的調(diào)節(jié)參數(shù)，所述調(diào)節(jié)參數(shù)用于指示對所述語音數(shù)據(jù)的調(diào)節(jié)方式；

在基于任一條測試數(shù)據(jù)，對所述電子設備進行語音喚醒測試，得到所述測試數(shù)據(jù)對應的喚醒結(jié)果之后，在所述測試數(shù)據(jù)對應的行中添加所述喚醒結(jié)果。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京聲智科技有限公司，未經(jīng)北京聲智科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202310403853.9/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：代碼掃描結(jié)果的分類方法、裝置和電子設備
下一篇：一種FPC的點膠方法及FPC

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓練語音識別系統(tǒng)，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】