[發明專利]一種智能語音開關的控制方法及系統在審
| 申請號: | 202110848347.1 | 申請日: | 2021-07-27 |
| 公開(公告)號: | CN113643700A | 公開(公告)日: | 2021-11-12 |
| 發明(設計)人: | 陳志雄;譚志勇 | 申請(專利權)人: | 廣州市威士丹利智能科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L17/02;G10L17/14;G10L17/24 |
| 代理公司: | 廣州博士科創知識產權代理有限公司 44663 | 代理人: | 宋佳 |
| 地址: | 510000 廣東省廣州市黃埔*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 語音 開關 控制 方法 系統 | ||
1.一種智能語音開關的控制方法,其特征在于,包括:
獲取待識別語音聲紋信息,對所述待識別語音聲紋信息進行聲紋特征識別,并基于聲紋特征識別結果統計所述待識別語音聲紋信息對應的聲紋描述內容;
根據所述聲紋描述內容搭建所述待識別語音聲紋信息對應的按照聲紋震動方式的語音關鍵詞集合;
基于所述語音關鍵詞集合和第一標準詞義在所述待識別語音聲紋信息中確定有效語音內容。
2.根據權利要求1所述智能語音開關的控制方法,其特征在于,所述獲取待識別語音聲紋信息之后,還包括:
對所述待識別語音聲紋信息進行降維處理。
3.根據權利要求1所述智能語音開關的控制方法,其特征在于,對所述待識別語音聲紋信息進行聲紋特征識別,包括:
對所述待識別語音聲紋信息進行分類和修正處理,并對處理結果進行聲紋特征識別。
4.根據權利要求1所述智能語音開關的控制方法,其特征在于,所述根據所述聲紋描述內容搭建所述待識別語音聲紋信息對應的按照聲紋震動方式的語音關鍵詞集合,包括:
根據所述聲紋描述內容確定所述待識別語音聲紋信息的聲波頻譜,基于所述聲紋描述內容和所述聲波頻譜構造權重語音參數,并利用所述權重語音參數對所述聲紋描述內容進行分析;
利用分析前的聲紋描述內容和分析后的聲紋描述內容搭建所述待識別語音聲紋信息對應的按照聲紋震動方式的語音關鍵詞集合。
5.根據權利要求4所述智能語音開關的控制方法,其特征在于,所述根據所述聲紋描述內容確定所述待識別語音聲紋信息的聲波頻譜,包括:
根據聲紋特征識別的節點和預設聲波頻譜震動區間確定聲波頻譜對應的聲波范圍震動區間;
利用數據訓練模型對所述聲紋描述內容進行評論處理;
在評論后的聲紋描述內容中確定所述聲波范圍震動區間內的第一個震動最大區間,并將所述震動最大區間對應的范圍確定為所述待識別語音聲紋信息的聲波頻譜。
6.根據權利要求4所述智能語音開關的控制方法,其特征在于,所述基于所述聲紋描述內容和所述聲波頻譜構造權重語音參數,包括:
基于所述聲波頻譜構造個體差異參數;
對所述聲紋描述內容進行優化識別的噪音過濾,以抽取語音字典信息作為語音字典標準模板;
根據所述個體差異參數和所述語音字典標準模板確定權重語音參數。
7.根據權利要求4所述智能語音開關的控制方法,其特征在于,所述利用分析前的聲紋描述內容和分析后的聲紋描述內容搭建所述待識別語音聲紋信息對應的按照聲紋震動方式的語音關鍵詞集合,包括:
基于分析后的聲紋描述內容統計每個電信號中每個聲波范圍對應的誤差許可范圍的和作為第一誤差統計值;
基于分析前的聲紋描述內容統計每個電信號中每個聲波范圍對應的誤差許可范圍的和作為第二誤差統計值;
將所述第一誤差統計值與所述第二誤差統計值的比值確定為每個電信號的語音關鍵詞;
對每個電信號的語音關鍵詞進行整合處理,并根據每個電信號的整合結果搭建所述待識別語音聲紋信息對應的按照聲紋震動方式的語音關鍵詞集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州市威士丹利智能科技有限公司,未經廣州市威士丹利智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110848347.1/1.html,轉載請聲明來源鉆瓜專利網。





