[發明專利]聲源定位方法和裝置在審
| 申請號: | 201510801065.0 | 申請日: | 2015-11-19 |
| 公開(公告)號: | CN106772245A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 曾向陽;王海濤 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G01S5/20 | 分類號: | G01S5/20 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司11205 | 代理人: | 馬爽,黃健 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲源 定位 方法 裝置 | ||
技術領域
本發明實施例涉及定位技術,尤其涉及一種聲源定位方法和裝置。
背景技術
聲源定位技術是利用拾音器拾取語音信號,并通過數字信號處理技術對拾音器拾取的語音信號進行分析和處理,從而確定和跟蹤聲源的空間位置的一種技術。聲源定位技術在視頻會議、語音識別和目標定位等領域有著重要的應用。
目前,聲源定位技術主要是基于波束形成的方法來進行聲源定位,圖1是現有技術中基于波束形成的方法來進行聲源定位的示意圖。如圖1所示,拾音器2、拾音器3、拾音器4、拾音器5、拾音器6構成一個拾音器陣列,處理器(圖中未示出)將拾音器陣列采集到的聲源1的信號進行加權求和,形成波束7、波束8和波束9,獲取每個波束的輸出信號功率,將輸出信號功率最大的波束對應的位置確定為聲源位置,例如,圖1中波束8的輸出信號功率最大,則波束8對應的位置為聲源位置。
但是,由于受拾音器陣列形狀的影響,基于波束形成的方法無法獲得穩定的聲源定位精度,尤其在近場或者是聲學環境比較復雜的室內環境中無法精確的進行聲源定位。
發明內容
本發明實施例提供一種聲源定位方法和裝置,以保證在近場、室內環境中對聲源的位置進行準確的定位。
第一方面,本發明實施例提供一種聲源定位方法,包括:根據聲源發出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應;其中,所述第一通道脈沖響應為所述聲源與所述拾音器之間的通道脈沖響應;獲取所述第一通道脈沖響應和模板庫中的每個第二通道脈沖響應之間的相關系數; 其中,所述模板庫中包括待定位空間中每個區域對應的第二通道脈沖響應,所述第二通道脈沖響應為所述區域的測點與所述拾音器之間的通道脈沖響應,所述相關系數表示所述第一通道脈沖響應和所述第二通道脈沖響應之間的相似度;根據絕對值最大的相關系數確定所述聲源的位置。在本實施例中,由于相關系數的絕對值越大,說明該第二通道脈沖響應與第一通道脈沖響應相似度越高,即該第二通道脈沖響應對應的區域位置和聲源的位置越相近,因此,將第二通道脈沖響應對應的區域位置確定為聲源的位置,可以保證在近場、室內環境中對聲源的位置進行準確的定位。
結合第一方面,在第一方面的第一種可能實現方式中,所述根據聲源發出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應之前,所述方法還包括:將所述待定位空間劃分為多個區域,并為每個所述區域設置一個測點;根據每個所述測點與所述拾音器之間的通道脈沖響應生成所述模板庫。在本實施例中,將待定位空間劃分為若干區域,測量每個測點與拾音器之間的通道脈沖響應,以生成模板庫,從而可以將待測聲源的通道脈沖響應與模板庫中的每個通道脈沖響應進行匹配,保證確定的聲源位置更加精確。
結合第一方面或第一方面的第一種可能實現方式,在第一方面的第二種可能實現方式中,所述獲取所述第一通道脈沖響應和模板庫中的每個第二通道脈沖響應之間的相關系數,包括:獲取所述第一通道脈沖響應的反向脈沖序列;獲取所述反向脈沖序列與每個所述第二通道脈沖響應之間的所述相關系數。
結合第一方面的任一種可能實現方式,在第一方面的第三種可能實現方式中,所述根據絕對值最大的相關系數確定所述聲源的位置,包括:獲取所述絕對值最大的相關系數中的第一元素;其中,所述第一元素為所述絕對值最大的相關系數中數值最大的元素;根據所述第一元素確定所述聲源的位置。在本實施例中,由于拾音器接收到的音頻信號不僅包括聲源發出的音頻信號,還包括其它的反射信號和干擾信號,一般情況下,聲源發出的音頻信號的信號強度比其它的反射信號和干擾信號的信號強度高,因此,聲源發出的音頻信號對應的元素的絕對值比其它的信號對應的元素的絕對值高,因此,根據第一元素確定聲源的位置的與實際的聲源的位置更加的接近,提高了聲源定位的精確度。
結合第一方面第二種或第三種可能實現方式,在第一方面的第四種可能實現方式中,所述根據聲源發出的音頻信號和拾音器接收到的音頻信號,獲取第一通道脈沖響應,包括:根據公式計算所述第一通道脈沖響應其中,S(jω)=FFT(s(t)),R(jω)=FFT(r(t)),r(t)為所述拾音器接收到的音頻信號,s(t)為所述聲源發出的音頻信號,t為所述聲源發出的音頻信號的持續時間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510801065.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:品茗杯(素時錦年1)
- 下一篇:品茗杯(荷趣1)





