[發(fā)明專利]基于人工智能的遠(yuǎn)場語音數(shù)據(jù)信噪比估計(jì)方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201810102302.8 | 申請(qǐng)日: | 2018-02-01 |
| 公開(公告)號(hào): | CN108416096B | 公開(公告)日: | 2022-02-25 |
| 發(fā)明(設(shè)計(jì))人: | 孫建偉;李超;李鑫;朱唯鑫;文銘 | 申請(qǐng)(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號(hào): | G06F30/27 | 分類號(hào): | G06F30/27;G06F119/10 |
| 代理公司: | 北京鴻德海業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人工智能 語音 數(shù)據(jù) 估計(jì) 方法 裝置 | ||
本發(fā)明公開了基于人工智能的遠(yuǎn)場語音數(shù)據(jù)信噪比估計(jì)方法及裝置,其中方法包括:基于預(yù)先訓(xùn)練得到的決策樹模型,對(duì)待處理的遠(yuǎn)場語音數(shù)據(jù)進(jìn)行狀態(tài)綁定;根據(jù)狀態(tài)綁定結(jié)果劃分出遠(yuǎn)場語音數(shù)據(jù)中的噪聲段和語音段;根據(jù)劃分結(jié)果確定出遠(yuǎn)場語音數(shù)據(jù)的信噪比。應(yīng)用本發(fā)明所述方案,能夠提高信噪比估計(jì)結(jié)果的準(zhǔn)確性等。
【技術(shù)領(lǐng)域】
本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù),特比涉及基于人工智能的遠(yuǎn)場語音數(shù)據(jù)信噪比估計(jì)方法及裝置。
【背景技術(shù)】
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語言識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。
遠(yuǎn)場語音產(chǎn)品如音響、車機(jī)等的聲學(xué)模型在訓(xùn)練過程中都需要用到大量的遠(yuǎn)場語音數(shù)據(jù),而真實(shí)的遠(yuǎn)場語音數(shù)據(jù)有限,為滿足模型訓(xùn)練的需求,則需要生成大量仿真出的遠(yuǎn)場語音數(shù)據(jù)。
可通過對(duì)近場語音數(shù)據(jù)按照真實(shí)場景中的信噪比(SNR)分布進(jìn)行加噪來生成仿真的遠(yuǎn)場語音數(shù)據(jù),因此對(duì)真實(shí)的遠(yuǎn)場語音數(shù)據(jù)的信噪比估計(jì)就顯得十分重要。
現(xiàn)有技術(shù)中,針對(duì)遠(yuǎn)場語音數(shù)據(jù),通常采用以下方式來估計(jì)其信噪比:首先,獲取遠(yuǎn)場語音數(shù)據(jù)的幅值能量,之后,確定遠(yuǎn)場語音數(shù)據(jù)幅值能量的分割閾值,并通過分割閾值將遠(yuǎn)場語音數(shù)據(jù)劃分為噪聲段和語音段,最后,根據(jù)劃分出的噪聲段和語音段計(jì)算信噪比。但是,這種方式中的分割閾值很難準(zhǔn)確確定,而一旦分割閾值不準(zhǔn)確,就會(huì)導(dǎo)致獲取到的信噪比不準(zhǔn)確。
【發(fā)明內(nèi)容】
有鑒于此,本發(fā)明提供了基于人工智能的遠(yuǎn)場語音數(shù)據(jù)信噪比估計(jì)方法及裝置。
具體技術(shù)方案如下:
一種基于人工智能的遠(yuǎn)場語音數(shù)據(jù)信噪比估計(jì)方法,包括:
基于預(yù)先訓(xùn)練得到的決策樹模型,對(duì)待處理的遠(yuǎn)場語音數(shù)據(jù)進(jìn)行狀態(tài)綁定;
根據(jù)狀態(tài)綁定結(jié)果劃分出所述遠(yuǎn)場語音數(shù)據(jù)中的噪聲段和語音段;
根據(jù)劃分結(jié)果確定出所述遠(yuǎn)場語音數(shù)據(jù)的信噪比。
根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述基于預(yù)先訓(xùn)練得到的決策樹模型,對(duì)待處理的遠(yuǎn)場語音數(shù)據(jù)進(jìn)行狀態(tài)綁定之前,進(jìn)一步包括:
利用獲取到的近場語音數(shù)據(jù),訓(xùn)練得到所述決策樹模型。
根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述根據(jù)狀態(tài)綁定結(jié)果劃分出所述遠(yuǎn)場語音數(shù)據(jù)中的噪聲段和語音段包括:
根據(jù)獲取到的狀態(tài)id對(duì)齊標(biāo)簽,劃分出所述遠(yuǎn)場語音數(shù)據(jù)中的噪聲段和語音段。
根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述根據(jù)劃分結(jié)果確定出所述遠(yuǎn)場語音數(shù)據(jù)的信噪比包括:
分別獲取所述噪聲段以及所述語音段的幅值能量;
根據(jù)獲取到的幅值能量計(jì)算出所述遠(yuǎn)場語音數(shù)據(jù)的信噪比。
根據(jù)本發(fā)明一優(yōu)選實(shí)施例,該方法進(jìn)一步包括:
分別獲取N條遠(yuǎn)場語音數(shù)據(jù)的信噪比,N為大于一的正整數(shù);
根據(jù)N條遠(yuǎn)場語音數(shù)據(jù)的信噪比,生成信噪比統(tǒng)計(jì)直方圖;所述信噪比統(tǒng)計(jì)直方圖的橫軸為不同的信噪比取值,所述信噪比統(tǒng)計(jì)直方圖的縱軸為分別對(duì)應(yīng)于不同的信噪比取值的遠(yuǎn)場語音數(shù)據(jù)的條數(shù);
根據(jù)所述信噪比統(tǒng)計(jì)直方圖確定出遠(yuǎn)場語音數(shù)據(jù)的信噪比分布范圍。
根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述根據(jù)所述信噪比統(tǒng)計(jì)直方圖確定出遠(yuǎn)場語音數(shù)據(jù)的信噪比分布范圍包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810102302.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





