[發明專利]語音方位識別方法和裝置及系統、家居控制器在審
| 申請號: | 201610803006.1 | 申請日: | 2016-09-05 |
| 公開(公告)號: | CN107799118A | 公開(公告)日: | 2018-03-13 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 深圳光啟合眾科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G01S5/18 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 韓建偉,張永明 |
| 地址: | 518000 廣東省深圳市南山區南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 方位 識別 方法 裝置 系統 家居 控制器 | ||
技術領域
本發明涉及語音領域,具體而言,涉及一種語音方位識別方法和裝置及系統、家居控制器。
背景技術
目前,隨著社會的發展以及人們物質生活條件的逐漸提高,人們對設備的智能化提出了各種要求,需要設備對具有特定口令的語音進行識別。在設備對具有特定口令的語音進行識別的過程中,可以實現對該特定口令的口令信息進行識別。除此之外,人們也需要了解到具有特定口令的語音的方位,需要設備對該語音的方位進行定位。但是,現存的各種設備,比如,智能機器人、智能家居控制器在無法實現對具有特定口令的語音的方位進行判定,并不能像人一樣地對具有特定口令的語音的聲源進行追溯,并判斷聲源的具體空間位置。另外,在對語音識別的過程中,對無意義的聲音也一樣會響應,對外界的無效音頻無法區分。
針對相關技術中不能對語音的方位進行識別的問題,目前尚未提出有效的解決方案。
發明內容
本發明的主要目的在于提供一種語音方位識別方法和裝置及系統、家居控制器,以至少解決相關技術中不能對語音的方位進行識別的問題。
為了實現上述目的,根據本發明的一個方面,提供了一種語音方位識別方法。該語音方位識別方法包括:對目標聲源發出的語音進行處理,得到音頻數據;對音頻數據按照預設算法執行計算,得到語音位置信息,其中,語音位置信息為目標聲源所在位置的信息;獲取音頻數據的特征數據,其中,特征數據為語音的口令信息對應的數據;判斷特征數據是否與預設特征數據相匹配;如果判斷出特征數據與預設特征數據相匹配,輸出語音位置信息;如果判斷出特征數據與預設特征數據不匹配,則不輸出。
進一步地,判斷特征數據是否與預設特征數據相匹配包括:判斷特征數據是否為口令庫中存儲的口令信息的數據并生成匹配結果;如果匹配結果是特征數據為口令庫中存儲的口令信息的數據,確定特征數據與預設特征數據相匹配;如果匹配結果是特征數據不為口令庫中存儲的口令信息的數據,確定特征數據與預設特征數據不匹配。
進一步地,獲取音頻數據的特征數據包括:通過音頻分析設備接收來自語音輸入對音頻數據執行預處理,得到預處理結果,并從預處理結果中提取特征數據。
進一步地,如果判斷出特征數據與預設特征數據相匹配,輸出語音位置信息和語音的口令信息。
進一步地,對音頻數據按照預設算法執行計算,得到語音位置信息包括:對音頻數據按照聲源定位算法執行計算,得到目標聲源的距離和目標聲源的空間角度坐標,其中,聲源定位算法為通過目標聲源的信息計算目標聲源所在位置的信息的算法,如果判斷出特征數據與預設特征數據相匹配,輸出語音位置信息包括:如果判斷出特征數據與預設特征數據相匹配,輸出目標聲源的距離和目標聲源的空間角度坐標。
進一步地,對目標聲源發出的語音進行處理得到的音頻數據包括:采集目標聲源發出的語音對應的電壓信號,通過語音輸入設備對電壓信號執行放大處理,得到放大電壓信號,通過語音輸入設備對放大電壓信號執行濾波,得到音頻數據。
為了實現上述目的,根據本發明的另一方面,還提供了一種語音方位識別裝置。該語音方位識別裝置包括:第一獲取單元,用于對目標聲源發出的語音進行處理得到的音頻數據;計算單元,用于對音頻數據按照預設算法執行計算,得到語音位置信息,其中,語音位置信息為目標聲源所在位置的信息;第二獲取單元,用于獲取音頻數據的特征數據,其中,特征數據為語音的口令信息對應的數據;判斷單元,用于判斷特征數據是否與預設特征數據相匹配;輸出單元,用于在判斷出特征數據與預設特征數據相匹配時,輸出語音位置信息,在判斷出特征數據與預設特征數據不匹配時,則不輸出。
進一步地,該判斷單元包括:處理模塊,用于判斷特征數據是否為口令庫中存儲的口令信息的數據并生成匹配結果;第一確定模塊,用于當匹配結果是特征數據為口令庫中存儲的口令信息的數據時,確定特征數據與預設特征數據相匹配;第二確定模塊,用于當匹配結果是特征數據不為口令庫中存儲的口令信息的數據時,確定特征數據與預設特征數據不匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳光啟合眾科技有限公司,未經深圳光啟合眾科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610803006.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多輪交互并行語義理解方法和裝置
- 下一篇:音頻制作方法、裝置及系統





