[發(fā)明專利]聲源位置的確定方法、系統(tǒng)、設(shè)備和存儲介質(zhì)在審
申請?zhí)枺?/td> | 201810367844.8 | 申請日: | 2018-04-23 |
公開(公告)號: | CN110390947A | 公開(公告)日: | 2019-10-29 |
發(fā)明(設(shè)計)人: | 耿嶺 | 申請(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司 |
主分類號: | G10L21/028 | 分類號: | G10L21/028;G10L21/0216;G10L25/18;G10L25/21;G10L25/60;G01S5/22 |
代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;羅朗 |
地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 聲源信號 聲源位置 頻點 頻率分布信息 存儲介質(zhì) 頻譜信息 最大輸出功率 傅里葉變換 準確度 輸出功率 算法獲取 語音能量 權(quán)值和 | ||
1.一種聲源位置的確定方法,其特征在于,所述確定方法包括:
獲取聲源信號,并采用傅里葉變換算法獲取所述聲源信號的頻譜信息;
根據(jù)所述頻譜信息獲取每幀所述聲源信號中的頻率分布信息;
其中,所述頻率分布信息用于表征每幀所述聲源信號的語音能量分布情況;
根據(jù)所述頻率分布信息計算每幀所述聲源信號中的每個頻點的第一權(quán)值;
根據(jù)所述第一權(quán)值和所述頻率分布信息獲取所述聲源信號中的每個頻點的輸出功率,確定最大輸出功率的頻點為產(chǎn)生所述聲源信號的聲源位置。
2.如權(quán)利要求1所述的聲源位置的確定方法,其特征在于,所述獲取聲源信號的步驟具體包括:
通過麥克風陣列獲取聲源信號;
所述根據(jù)所述頻率分布信息計算每幀所述聲源信號中的每個頻點的第一權(quán)值的步驟中,采用如下計算公式計算所述第一權(quán)值:
i表示麥克風陣列中的第i個麥克風,n表示第n幀聲源信號,k表示頻點對應的頻率值,表示第i個麥克風的第n幀聲源信號的功率譜,f0為可調(diào)參數(shù),表示第i個麥克風在第n幀聲源信號的頻點對應的頻率值為k的權(quán)值。
3.如權(quán)利要求1所述的聲源位置的確定方法,其特征在于,所述根據(jù)所述第一權(quán)值和所述頻率分布信息獲取所述聲源信號中的每個頻點的輸出功率的步驟具體包括:
將所述聲源信號在每個頻點對應的所述第一權(quán)值乘以對應的語音能量獲取所述聲源信號中的每個頻點的輸出功率。
4.如權(quán)利要求1所述的聲源位置的確定方法,其特征在于,所述根據(jù)所述第一權(quán)值和所述頻率分布信息獲取所述聲源信號中的每個頻點的輸出功率的步驟之前還包括:
根據(jù)所述頻譜信息分別對所述聲源信號進行噪聲估計處理和混響估計處理,獲取對應的噪聲估計處理結(jié)果和混響估計處理結(jié)果;
獲取所述噪聲估計處理結(jié)果和所述混響估計處理結(jié)果之間的信噪比;
根據(jù)所述信噪比,對所述聲源信號進行加權(quán)處理,獲取所述聲源信號在整個頻率范圍上的第二權(quán)值;
將所述第一權(quán)值乘以所述第二權(quán)值獲取每幀所述聲源信號中的每個頻點的目標權(quán)值;
所述根據(jù)所述第一權(quán)值獲取所述聲源信號中的每個頻點的輸出功率的步驟具體包括:
根據(jù)所述目標權(quán)值獲取所述聲源信號中的每個頻點的輸出功率。
5.一種聲源位置的確定系統(tǒng),其特征在于,所述確定系統(tǒng)包括聲源信號獲取模塊、頻譜信息獲取模塊、頻率信息獲取模塊、第一權(quán)值計算模塊、輸出功率獲取模塊和聲源位置確定模塊;
所述聲源信號獲取模塊用于獲取聲源信號,并調(diào)用所述頻譜信息獲取模塊;
所述頻譜信息獲取模塊用于采用傅里葉變換算法獲取所述聲源信號的頻譜信息;
所述頻率信息獲取模塊用于根據(jù)所述頻譜信息獲取每幀所述聲源信號中的頻率分布信息;
其中,所述頻率分布信息用于表征每幀所述聲源信號的語音能量分布情況;
所述第一權(quán)值計算模塊用于根據(jù)所述頻率分布信息計算每幀所述聲源信號中的每個頻點的第一權(quán)值;
所述輸出功率獲取模塊用于根據(jù)所述第一權(quán)值和所述頻率分布信息獲取所述聲源信號中的每個頻點的輸出功率,并調(diào)用所述聲源位置確定模塊;
所述聲源位置確定模塊用于確定最大輸出功率的頻點為產(chǎn)生所述聲源信號的聲源位置。
6.如權(quán)利要求5所述的聲源位置的確定系統(tǒng),其特征在于,所述聲源信號獲取模塊還用于通過麥克風陣列獲取聲源信號;
所述第一權(quán)值計算模塊采用如下計算公式計算所述第一權(quán)值:
i表示麥克風陣列中的第i個麥克風,n表示第n幀聲源信號,k表示頻點對應的頻率值,表示第i個麥克風的第n幀聲源信號的功率譜,f0為可調(diào)參數(shù),表示第i個麥克風在第n幀聲源信號的頻點對應的頻率值為k的權(quán)值。
7.如權(quán)利要求5所述的聲源位置的確定系統(tǒng),其特征在于,所述輸出功率獲取模塊還用于將所述聲源信號在每個頻點對應的所述第一權(quán)值乘以對應的語音能量獲取所述聲源信號中的每個頻點的輸出功率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810367844.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。