[發明專利]語音方位識別方法和裝置及系統、家居控制器在審
| 申請號: | 201610803006.1 | 申請日: | 2016-09-05 |
| 公開(公告)號: | CN107799118A | 公開(公告)日: | 2018-03-13 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 深圳光啟合眾科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G01S5/18 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 韓建偉,張永明 |
| 地址: | 518000 廣東省深圳市南山區南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 方位 識別 方法 裝置 系統 家居 控制器 | ||
1.一種語音方位識別方法,其特征在于,包括:
對目標聲源發出的語音進行處理,得到音頻數據;
對所述音頻數據按照預設算法執行計算,得到語音位置信息,其中,所述語音位置信息為所述目標聲源所在位置的信息;
獲取所述音頻數據的特征數據,其中,所述特征數據為所述語音的口令信息對應的數據;
判斷所述特征數據是否與預設特征數據相匹配;
如果判斷出所述特征數據與所述預設特征數據相匹配,輸出所述語音位置信息;以及
如果判斷出所述特征數據與所述預設特征數據不匹配,則不輸出。
2.根據權利要求1所述的方法,其特征在于,判斷所述特征數據是否與所述預設特征數據相匹配包括:
判斷所述特征數據是否為口令庫中存儲的口令信息的數據并生成匹配結果;
如果所述匹配結果是所述特征數據為所述口令庫中存儲的口令信息的數據,確定所述特征數據與所述預設特征數據相匹配;以及
如果所述匹配結果是所述特征數據不為所述口令庫中存儲的口令信息的數據,確定所述特征數據與所述預設特征數據不匹配。
3.根據權利要求2所述的方法,其特征在于,獲取所述音頻數據的特征數據包括:對所述音頻數據執行預處理,得到預處理結果,并從所述預處理結果中提取所述特征數據。
4.根據權利要求1所述的方法,其特征在于,如果判斷出所述特征數據與所述預設特征數據相匹配,輸出所述語音位置信息和所述語音的口令信息。
5.根據權利要求1所述的方法,其特征在于,
對所述音頻數據按照所述預設算法執行計算,得到所述語音位置信息包括:對所述音頻數據按照聲源定位算法執行計算,得到所述目標聲源的距離和所述目標聲源的空間角度坐標,其中,所述聲源定位算法為通過所述目標聲源的信息計算所述目標聲源所在位置的信息的算法,
如果判斷出所述特征數據與所述預設特征數據相匹配,輸出所述語音位置信息包括:如果判斷出所述特征數據與所述預設特征數據相匹配,輸出所述目標聲源的距離和所述目標聲源的空間角度坐標。
6.根據權利要求1所述的方法,其特征在于,對所述目標聲源發出的語音進行處理得到音頻數據包括:采集所述目標聲源發出的語音對應的電壓信號,對所述電壓信號執行放大處理,得到放大電壓信號,對所述放大電壓信號執行濾波,得到所述音頻數據。
7.一種語音方位識別裝置,其特征在于,包括:
第一獲取單元,用于對目標聲源發出的語音進行處理得到的音頻數據;
計算單元,用于對所述音頻數據按照預設算法執行計算,得到語音位置信息,其中,所述語音位置信息為所述目標聲源所在位置的信息;
第二獲取單元,用于獲取所述音頻數據的特征數據,其中,所述特征數據為所述語音的口令信息對應的數據;
判斷單元,用于判斷所述特征數據是否與預設特征數據相匹配;以及
輸出單元,用于在判斷出所述特征數據與所述預設特征數據相匹配時,輸出所述語音位置信息,在判斷出所述特征數據與所述預設特征數據不匹配時,則不輸出。
8.根據權利要求7所述的裝置,其特征在于,所述判斷單元包括:
處理模塊,用于判斷所述特征數據是否為口令庫中存儲的口令信息的數據并生成匹配結果;
第一確定模塊,用于當所述匹配結果是所述特征數據為所述口令庫中存儲的口令信息的數據時,確定所述特征數據與所述預設特征數據相匹配;以及
第二確定模塊,用于當所述匹配結果是所述特征數據不為所述口令庫中存儲的口令信息的數據時,確定所述特征數據與所述預設特征數據不匹配。
9.一種語音方位識別系統,其特征在于,包括:
語音輸入設備,用于對目標聲源發出的語音執行處理,得到音頻數據;
音頻分析設備,用于提取所述音頻數據中的特征數據,其中,所述特征數據為所述語音的口令信息對應的數據;以及
中央處理設備,用于獲取所述音頻數據,對所述音頻數據按照預設算法執行計算,得到語音位置信息,其中,所述語音位置信息為所述目標聲源所在位置的信息,獲取所述特征數據,判斷所述特征數據是否與預設特征數據相匹配,如果判斷出所述特征數據與所述預設特征數據相匹配,輸出所述語音位置信息,如果判斷出所述特征數據與所述預設特征數據不匹配,則不輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳光啟合眾科技有限公司,未經深圳光啟合眾科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610803006.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多輪交互并行語義理解方法和裝置
- 下一篇:音頻制作方法、裝置及系統





