[發(fā)明專利]波達(dá)方向估計(jì)方法、服務(wù)器以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201911355855.5 | 申請(qǐng)日: | 2019-12-25 |
| 公開(kāi)(公告)號(hào): | CN111142066A | 公開(kāi)(公告)日: | 2020-05-12 |
| 發(fā)明(設(shè)計(jì))人: | 車云飛 | 申請(qǐng)(專利權(quán))人: | 達(dá)闥科技成都有限公司 |
| 主分類號(hào): | G01S3/802 | 分類號(hào): | G01S3/802;G06N3/08 |
| 代理公司: | 北京智晨知識(shí)產(chǎn)權(quán)代理有限公司 11584 | 代理人: | 張婧 |
| 地址: | 610094 四川省成都市高*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 方向 估計(jì) 方法 服務(wù)器 以及 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明實(shí)施例涉及語(yǔ)音信號(hào)處理技術(shù)領(lǐng)域,公開(kāi)了一種波達(dá)方向估計(jì)方法、服務(wù)器以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。本發(fā)明中,波達(dá)方向估計(jì)方法包括:獲取麥克風(fēng)陣列采集第一聲源的聲音得到的多路音頻、以及所述第一聲源的聲源角度;將所述多路音頻作為輸入,所述聲源角度作為輸出,訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型;將待識(shí)別音頻輸入已訓(xùn)練的所述神經(jīng)網(wǎng)絡(luò)模型中,得到與所述待識(shí)別音頻對(duì)應(yīng)的待識(shí)別聲源角度作為波達(dá)方向。本發(fā)明提供的波達(dá)方向估計(jì)方法、服務(wù)器以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),能夠在保證波達(dá)方向估計(jì)準(zhǔn)確性的前提下,提高響應(yīng)速度。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及語(yǔ)音信號(hào)處理技術(shù)領(lǐng)域,特別涉及一種波達(dá)方向估計(jì)方法、服務(wù)器以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
波達(dá)方向(DOA)的計(jì)算作為音頻信號(hào)處理的重要環(huán)節(jié),對(duì)波束成形和聲源定位、聲源跟蹤有著極其重要的意義。傳統(tǒng)的波達(dá)方向(DOA)估計(jì)方法是基于麥克風(fēng)陣列各個(gè)麥克風(fēng)直接的接收到音頻信號(hào)的時(shí)間差異對(duì)聲源角度進(jìn)行統(tǒng)計(jì)學(xué)估計(jì)。
發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問(wèn)題:基于麥克風(fēng)陣列各個(gè)麥克風(fēng)直接的接收到音頻信號(hào)的時(shí)間差異對(duì)聲源角度進(jìn)行統(tǒng)計(jì)學(xué)估計(jì)的方法,雖然能夠滿足波達(dá)方向估計(jì)的準(zhǔn)確性要求,但響應(yīng)速度較慢。
發(fā)明內(nèi)容
本發(fā)明實(shí)施方式的目的在于提供一種波達(dá)方向估計(jì)方法、服務(wù)器以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),能夠在保證波達(dá)方向估計(jì)準(zhǔn)確性的前提下,提高響應(yīng)速度。
為解決上述技術(shù)問(wèn)題,本發(fā)明的實(shí)施方式提供了一種波達(dá)方向估計(jì)方法,包括:獲取麥克風(fēng)陣列采集第一聲源的聲音得到的多路音頻、以及所述第一聲源的聲源角度;將所述多路音頻作為輸入,所述聲源角度作為輸出,訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型;將待識(shí)別音頻輸入已訓(xùn)練的所述神經(jīng)網(wǎng)絡(luò)模型中,得到與所述待識(shí)別音頻對(duì)應(yīng)的待識(shí)別聲源角度作為波達(dá)方向。
本發(fā)明的實(shí)施方式還提供了一種服務(wù)器,包括:至少一個(gè)處理器;以及,與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行如上述的波達(dá)方向估計(jì)方法。
本發(fā)明的實(shí)施方式還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的波達(dá)方向估計(jì)方法。
本發(fā)明實(shí)施方式相對(duì)于現(xiàn)有技術(shù)而言,通過(guò)獲取麥克風(fēng)陣列采集第一聲源的聲音得到的多路音頻、以及所述第一聲源的聲源角度,將所述多路音頻作為輸入,所述聲源角度作為輸出,訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,將待識(shí)別音頻輸入已訓(xùn)練的所述神經(jīng)網(wǎng)絡(luò)模型中,得到與所述待識(shí)別音頻對(duì)應(yīng)的待識(shí)別聲源角度作為波達(dá)方向,從而實(shí)現(xiàn)了端到端的波達(dá)方向的計(jì)算,在保證了波達(dá)方向估計(jì)準(zhǔn)確性的前提下,提高了響應(yīng)速度。
另外,所述獲取麥克風(fēng)陣列采集到的多路音頻、以及與所述多路音頻對(duì)應(yīng)的聲源角度,具體包括:獲取所述麥克風(fēng)陣列N次采集到的N個(gè)所述多路音頻、以及分別與N個(gè)所述多路音頻一一對(duì)應(yīng)的N個(gè)聲源角度;其中,每個(gè)所述多路音頻對(duì)應(yīng)的聲源角度均不相等。
另外,獲取的所述麥克風(fēng)陣列相鄰兩次采集到的、兩個(gè)所述多路音頻對(duì)應(yīng)的聲源角度的差值相等。
另外,所述獲取麥克風(fēng)陣列采集到的多路音頻、以及與所述多路音頻對(duì)應(yīng)的聲源角度之后,還包括:識(shí)別所述多路音頻中的語(yǔ)音段以及靜音段;對(duì)所述語(yǔ)音段的所述多路音頻進(jìn)行標(biāo)注;所述將所述多路音頻作為輸入,所述聲源角度作為輸出,訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,具體包括:將所述多路音頻中被標(biāo)注的部分作為輸入,所述聲源角度作為輸出,訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)模型。通過(guò)僅將所述語(yǔ)音段的所述多路音頻作為輸入來(lái)訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)模型,避免了將靜音段的所述多路音頻也作為輸入、而導(dǎo)致神經(jīng)網(wǎng)絡(luò)模型中的對(duì)應(yīng)關(guān)系不準(zhǔn)確的問(wèn)題,從而提高了波達(dá)方向估計(jì)的準(zhǔn)確性。
另外,所述對(duì)所述語(yǔ)音段的所述多路音頻進(jìn)行標(biāo)注,具體為:以與所述多路音頻對(duì)應(yīng)的聲源角度作為音頻標(biāo)注,對(duì)所述語(yǔ)音段的所述多路音頻進(jìn)行標(biāo)注。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于達(dá)闥科技成都有限公司,未經(jīng)達(dá)闥科技成都有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911355855.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G01S 無(wú)線電定向;無(wú)線電導(dǎo)航;采用無(wú)線電波測(cè)距或測(cè)速;采用無(wú)線電波的反射或再輻射的定位或存在檢測(cè);采用其他波的類似裝置
G01S3-00 由方向上無(wú)重要性的次聲波、聲波、超聲波或電磁波或者粒子發(fā)射來(lái)測(cè)定方向的定向器
G01S3-02 .利用無(wú)線電波的
G01S3-78 .應(yīng)用了除無(wú)線電波外的其他電磁波
G01S3-80 .應(yīng)用了超聲波、聲波或次聲波
G01S3-801 ..零部件
G01S3-802 ..確定方向或確定相對(duì)于預(yù)定方向的偏移的系統(tǒng)
- 一種信道估計(jì)方法和裝置
- 基于時(shí)頻聯(lián)合的載波頻偏估計(jì)方法
- 基于改進(jìn)卡爾曼濾波的變參數(shù)迭代估計(jì)方法
- 電機(jī)驅(qū)動(dòng)系統(tǒng)以及電機(jī)控制裝置
- 意圖估計(jì)裝置和意圖估計(jì)方法
- 分布式驅(qū)動(dòng)電動(dòng)汽車路面自適應(yīng)縱向車速估計(jì)系統(tǒng)及方法
- 一種分布式驅(qū)動(dòng)電動(dòng)汽車路面附著系數(shù)估計(jì)系統(tǒng)
- 視線估計(jì)方法、終端及存儲(chǔ)介質(zhì)
- 一種SNR估計(jì)方法及其估計(jì)系統(tǒng)
- 估計(jì)車輛載荷的方法
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于UDP分布式小文件存儲(chǔ)系統(tǒng)及其數(shù)據(jù)處理方法
- 一種新型云計(jì)算管理系統(tǒng)
- 一種云計(jì)算管理裝置
- 一種節(jié)能數(shù)據(jù)服務(wù)器架構(gòu)系統(tǒng)
- 一種基于云計(jì)算的客戶信息管理裝置
- 一種基于即時(shí)通訊技術(shù)的通訊系統(tǒng)
- 服務(wù)器系統(tǒng)及分配服務(wù)器的方法
- 一種MMORPG游戲服務(wù)器端
- 一種訪問(wèn)請(qǐng)求的處理方法、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于Spark技術(shù)的大數(shù)據(jù)脫敏管理系統(tǒng)





