[發明專利]語音處理方法及裝置有效
| 申請號: | 201711312402.5 | 申請日: | 2017-12-08 |
| 公開(公告)號: | CN108010526B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 畢宇鵬 | 申請(專利權)人: | 北京奇虎科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/18;H04N5/232 |
| 代理公司: | 北京恒博知識產權代理有限公司 11528 | 代理人: | 范勝祥 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 裝置 | ||
1.一種語音處理方法,其特征在于,包括:
對獲取到的語音指令進行解析,得到所述語音指令對應的語音特征信息,包括:對所述語音指令進行語義特征提取,得到所述語音指令對應的語義特征,以及對所述語音指令進行聲學特征提取,得到所述語音指令對應的梅爾頻率倒譜系數MFCC特征信息;
根據預設的語義識別模塊對所述語音特征信息中包含的語義特征進行檢測,得到檢測結果,所述檢測結果中包含有語義匹配度最高的語義識別結果;
根據預設的語音喚醒模塊對所述語音特征信息中包含的梅爾頻率倒譜系數MFCC特征信息進行檢測,得到檢測結果,所述檢測結果中包含有所述梅爾頻率倒譜系數MFCC特征信息匹配的目標語音特征信息;
結合所述語義識別模塊的檢測結果對所述語音喚醒模塊的檢測結果進行驗證,當所述語義識別結果與所述目標語音特征信息一致時,確定所述語音指令對應的語義識別結果為所述語音指令的語音特征;
基于包含該語義識別結果的檢測結果進行對應的處理。
2.如權利要求1所述的方法,其特征在于,所述語音特征信息包括語義特征,所述根據預設的語義識別模塊對所述語音特征信息中包含的語義特征進行檢測,得到檢測結果,包括:
根據預設的語義識別模塊對所述語義特征進行識別,得到多個語義識別結果;
并在得到的多個語義識別結果中確認語義匹配度最高的語義識別結果。
3.如權利要求2所述的方法,其特征在于,所述基于包含該語義識別結果的檢測結果進行對應的處理,包括:
基于所述包含該語義識別結果的檢測結果按照所述語音指令進行對應的處理;或,
基于所述包含該語義識別結果的檢測結果不做任何處理。
4.如權利要求3所述的方法,其特征在于,所述基于所述包含該語義識別結果的檢測結果按照所述語音指令進行對應的處理,包括:
確定所述語音指令對應的指示信息;
根據所述指示信息做相應的處理。
5.如權利要求4所述的方法,其特征在于,所述指示信息包括如下任一項:
基于網絡直播平臺和/或多媒體采集設備中的特定指令;
基于多媒體設備中的播放和/或暫停指令。
6.如權利要求5所述的方法,其特征在于,所述特定指令包括如下任一項:
拍照;
攝像;
拍照中添加特效信息;
攝像中添加特效信息。
7.如權利要求1-6中任一項所述的方法,其特征在于,還包括:
獲取當前用戶觸發的動作和/或人臉;
對當前用戶觸發的動作和/或人臉進行識別檢測,得到識別結果;
其中,所述基于包含該語義識別結果的檢測結果進行對應的處理,包括:
基于包含該語義識別結果的檢測結果,并結合基于動作和/或人臉識別結果,進行對應的處理。
8.如權利要求1所述的方法,其特征在于,所述根據預設的語音喚醒模塊對所述語音特征信息進行檢測,包括:
根據所述語音喚醒模塊對語音特征信息進行匹配,確定所述語音喚醒模塊中是否存儲有與語音特征信息匹配的目標語音特征信息;
并在匹配成功時,得到該匹配的目標語音特征信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司,未經北京奇虎科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711312402.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種低密度輕質納米隔音材料的制備方法
- 下一篇:一種園林用旋轉升降式灑水設備





