[發明專利]一種聲源鎖定方法在審
| 申請號: | 201810153073.2 | 申請日: | 2018-02-22 |
| 公開(公告)號: | CN108364642A | 公開(公告)日: | 2018-08-03 |
| 發明(設計)人: | 陳思應;孫振奎;陳躍華;余杰;何云鵬;高君效 | 申請(專利權)人: | 成都啟英泰倫科技有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/16;G10L25/18;G01S11/14 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610041 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲源 語音識別 鎖定 聲音采集模塊 語音識別模塊 語音數據傳輸 客戶隱私 語音數據 屏蔽 云端 算法 泄露 采集 傳輸 外部 客戶 | ||
1.一種聲源鎖定方法,其包括以下步驟:
步驟一 語音采集模塊采集外部語音數據并發送給語音識別模塊;
步驟二 所述語音識別模塊將所述語音數據進行快速傅立葉變化后得到頻譜集;
步驟三 將所述頻譜集劃分成N個子帶頻譜,N為大于1的正整數;
步驟四 用主頻分離的方法將所述子帶頻譜進行頻率成分的搜索并歸類分組;
步驟五 對同一所述語音數據在所述語音采集模塊的左通道和右通道的相同頻率的所述子帶頻譜做互相關運算得到互相關函數;
步驟六 累加所述互相關函數獲取延遲時間并計算出聲源與設備之間的距離;
步驟七 將所述頻譜集輸入所述語音識別模塊中的語音識別引擎;
步驟八 所述語音識別引擎根據所述頻譜集內的頻譜特征采用DNN(深度神經網絡)算法在本地終端對所述頻譜集內的頻譜進行識別;
步驟九 語音識別模塊將步驟八的識別結果發送給設備控制電路;
步驟十 所述設備控制電路根據所述識別結果控制所述設備執行操作。
2.根據權利要求1所述的一種聲源鎖定方法,其特征在于:所述語音識別模塊由語音處理電路和聲源鎖定電路組成,所述語音分析電路處理所述語音采集模塊采集來的所述語音數據,所述聲源鎖定電路根據所述語音分析電路的處理結果鎖定聲源的位置。
3.根據權利要求1所述的一種聲源鎖定方法,其特征在于:所述DNN算法包括語音預處理、特征提取、形成發音字典及建立語音模型四個過程。
4.根據權利要求1所述的一種聲源鎖定方法,其特征在于:所述互相關運算的運算式為,其中i為頻帶數,τ為延遲時間。
5.根據權利要求1所述的一種聲源鎖定方法,其特征在于:所述語音采集模塊包含有N個語音采集設備,所述N為大于等于2的正整數。
6.根據權利要求5所述的一種聲源鎖定方法,其特征在于:所述語音采集設備之間的距離為b,C為聲速,所述所述語音采集設備與所述聲源之間的幾何關系確定出聲源的偏角θ,sinθ =ITD(θ )*C/d。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都啟英泰倫科技有限公司,未經成都啟英泰倫科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810153073.2/1.html,轉載請聲明來源鉆瓜專利網。





