[發(fā)明專利]一種聲源定位方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201810995819.4 | 申請(qǐng)日: | 2018-08-29 |
| 公開(公告)號(hào): | CN109256153B | 公開(公告)日: | 2021-03-02 |
| 發(fā)明(設(shè)計(jì))人: | 關(guān)海欣;丁少為;馬金龍 | 申請(qǐng)(專利權(quán))人: | 云知聲智能科技股份有限公司 |
| 主分類號(hào): | G10L25/84 | 分類號(hào): | G10L25/84;G01S5/18;G10L25/18;G10L15/22;G10L15/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 聲源 定位 方法 系統(tǒng) | ||
本發(fā)明提供了一種聲源定位方法及系統(tǒng),其中,所述方法包括:從聲源數(shù)據(jù)中識(shí)別語音段數(shù)據(jù)和噪音段數(shù)據(jù);分別計(jì)算所述語音段數(shù)據(jù)和所述噪音段數(shù)據(jù)在各個(gè)相位的語音評(píng)分值和噪音評(píng)分值;對(duì)相同相位處的所述語音評(píng)分值和所述噪音評(píng)分值進(jìn)行處理,得到規(guī)整評(píng)分值,并基于所述規(guī)整評(píng)分值,確定所述聲源對(duì)應(yīng)的目標(biāo)角度。本申請(qǐng)?zhí)峁┑募夹g(shù)方案,能夠提高聲源定位的精度。
技術(shù)領(lǐng)域
本發(fā)明涉及聲音處理技術(shù)領(lǐng)域,特別涉及一種聲源定位方法及系統(tǒng)。
背景技術(shù)
目前,為了對(duì)聲源進(jìn)行定位,通常是通過麥克風(fēng)陣列接收的多通道語音數(shù)據(jù)計(jì)算聲源方位。如可以在給定的角度范圍內(nèi),計(jì)算歸一化頻譜與不同導(dǎo)向矢量間的內(nèi)積,可以得到每個(gè)相位的打分輸出,最終,可以將最大打分輸出對(duì)應(yīng)的相位位置作為聲源的實(shí)際角度位置。
然而,在噪聲干擾下,如果噪聲分量高于語音分量就很容易造成計(jì)算方位錯(cuò)誤。而這種情況在實(shí)際應(yīng)用環(huán)境中非常容易出現(xiàn),比如智能音箱放置于靠近馬路的窗口位置,或者旁邊挨著廚房的智能設(shè)備等等,都很容易出現(xiàn)定位錯(cuò)誤。
發(fā)明內(nèi)容
本申請(qǐng)的目的在于提供一種聲源定位方法及系統(tǒng),能夠提高聲源定位的精度。
為實(shí)現(xiàn)上述目的,本申請(qǐng)?zhí)峁┮环N聲源定位方法,所述方法包括:
從聲源數(shù)據(jù)中識(shí)別語音段數(shù)據(jù)和噪音段數(shù)據(jù);
分別計(jì)算所述語音段數(shù)據(jù)和所述噪音段數(shù)據(jù)在各個(gè)相位的語音評(píng)分值和噪音評(píng)分值;
對(duì)相同相位處的所述語音評(píng)分值和所述噪音評(píng)分值進(jìn)行處理,得到規(guī)整評(píng)分值,并基于所述規(guī)整評(píng)分值,確定所述聲源對(duì)應(yīng)的目標(biāo)角度。
進(jìn)一步地,從聲源數(shù)據(jù)中識(shí)別語音段數(shù)據(jù)和噪音段數(shù)據(jù)包括:
對(duì)所述聲源數(shù)據(jù)進(jìn)行語音檢測(cè),得到所述聲源數(shù)據(jù)中的語音起止點(diǎn),并將所述語音起止點(diǎn)之間的數(shù)據(jù)作為所述語音段數(shù)據(jù);
將所述語音段數(shù)據(jù)之前指定時(shí)長(zhǎng)內(nèi)的聲源數(shù)據(jù)作為所述噪音段數(shù)據(jù)。
進(jìn)一步地,在從聲源數(shù)據(jù)中識(shí)別語音段數(shù)據(jù)和噪音段數(shù)據(jù)之后,所述方法還包括:
根據(jù)所述語音段數(shù)據(jù)和噪音段數(shù)據(jù)計(jì)算信噪比,若計(jì)算得到的所述信噪比小于預(yù)設(shè)信噪比閾值,才分別計(jì)算所述語音段數(shù)據(jù)和所述噪音段數(shù)據(jù)在各個(gè)相位的語音評(píng)分值和噪音評(píng)分值。
進(jìn)一步地,分別計(jì)算所述語音段數(shù)據(jù)和所述噪音段數(shù)據(jù)在各個(gè)相位的語音評(píng)分值和噪音評(píng)分值包括:
分別確定所述語音段數(shù)據(jù)和所述噪音段數(shù)據(jù)各自的歸一化頻譜,并確定用于表征不同相位的導(dǎo)向矢量;
計(jì)算所述歸一化頻譜與所述導(dǎo)向矢量的內(nèi)積,以確定所述歸一化頻譜在各個(gè)相位的評(píng)分值。
進(jìn)一步地,對(duì)相同相位處的所述語音評(píng)分值和所述噪音評(píng)分值進(jìn)行處理包括:
將相同相位處的語音評(píng)分值減去噪音評(píng)分值,得到對(duì)應(yīng)相位處的規(guī)整評(píng)分值。
進(jìn)一步地,基于所述規(guī)整評(píng)分值,確定所述聲源對(duì)應(yīng)的目標(biāo)角度包括:
將最大規(guī)整評(píng)分值對(duì)應(yīng)的相位確定為所述聲源對(duì)應(yīng)的目標(biāo)角度。
為實(shí)現(xiàn)上述目的,本申請(qǐng)還提供一種聲源定位系統(tǒng),所述系統(tǒng)包括:
數(shù)據(jù)識(shí)別單元,用于從聲源數(shù)據(jù)中識(shí)別語音段數(shù)據(jù)和噪音段數(shù)據(jù);
評(píng)分值計(jì)算單元,用于分別計(jì)算所述語音段數(shù)據(jù)和所述噪音段數(shù)據(jù)在各個(gè)相位的語音評(píng)分值和噪音評(píng)分值;
目標(biāo)角度確定單元,用于對(duì)相同相位處的所述語音評(píng)分值和所述噪音評(píng)分值進(jìn)行處理,得到規(guī)整評(píng)分值,并基于所述規(guī)整評(píng)分值,確定所述聲源對(duì)應(yīng)的目標(biāo)角度。
進(jìn)一步地,所述數(shù)據(jù)識(shí)別單元包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云知聲智能科技股份有限公司,未經(jīng)云知聲智能科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810995819.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 音頻信號(hào)接收裝置、音頻信號(hào)接收方法和音頻信號(hào)傳輸系統(tǒng)
- 聲源定位方法和裝置
- 聲源分離裝置和方法以及程序
- 改進(jìn)的頻域SRP聲源方位估計(jì)方法
- 用于提供聲源信息的方法和裝置及增強(qiáng)現(xiàn)實(shí)眼鏡
- 語音識(shí)別方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種聲源定位方法、裝置、介質(zhì)和設(shè)備
- 一種軌道車輛車內(nèi)噪聲源識(shí)別方法及系統(tǒng)
- 一種目標(biāo)定位方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 聲音編碼裝置、聲音譯碼裝置及聲音編碼譯碼裝置、以及聲音編碼方法、聲音譯碼方法及聲音編碼譯碼方法
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





