[發(fā)明專(zhuān)利]一種音頻特征提取方法、裝置、訓(xùn)練方法及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201911409010.X | 申請(qǐng)日: | 2019-12-31 |
| 公開(kāi)(公告)號(hào): | CN111105812A | 公開(kāi)(公告)日: | 2020-05-05 |
| 發(fā)明(設(shè)計(jì))人: | 何維禎 | 申請(qǐng)(專(zhuān)利權(quán))人: | 普聯(lián)國(guó)際有限公司 |
| 主分類(lèi)號(hào): | G10L25/03 | 分類(lèi)號(hào): | G10L25/03;G10L25/18 |
| 代理公司: | 廣州三環(huán)專(zhuān)利商標(biāo)代理有限公司 44202 | 代理人: | 黃詩(shī)彬;郝傳鑫 |
| 地址: | 中國(guó)香港九龍尖沙咀科*** | 國(guó)省代碼: | 香港;81 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 特征 提取 方法 裝置 訓(xùn)練 電子設(shè)備 | ||
本發(fā)明公開(kāi)了一種音頻特征提取方法、裝置、訓(xùn)練方法及電子設(shè)備,其中方法包括:按照預(yù)設(shè)的窗口長(zhǎng)度獲取待提取音頻,將待提取音頻按照預(yù)設(shè)的幀長(zhǎng)劃分為M幀音頻幀;計(jì)算每一音頻幀對(duì)應(yīng)的頻譜;根據(jù)每一頻譜的N個(gè)頻域點(diǎn),基于線(xiàn)性擬合算法獲得每一頻譜對(duì)應(yīng)的擬合斜率和擬合截距;根據(jù)頻譜和預(yù)設(shè)的計(jì)算公式,計(jì)算獲得每一頻譜的頻譜平坦度;將每一頻譜劃分為m段頻譜帶,計(jì)算獲得每一段頻譜帶對(duì)應(yīng)的對(duì)數(shù)頻譜,進(jìn)而計(jì)算獲得每一頻譜的頻譜對(duì)比度;根據(jù)音頻幀的擬合斜率、擬合截距、頻譜平坦度和頻譜對(duì)比度,獲得音頻幀的特征量,進(jìn)而提取出待提取音頻的音頻特征。本發(fā)明提取的音頻特征用于嬰兒哭聲等檢測(cè)場(chǎng)景時(shí),有利于提高音頻檢測(cè)的準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻處理技術(shù)領(lǐng)域,尤其涉及一種音頻特征提取方法、裝置、訓(xùn)練方法及電子設(shè)備。
背景技術(shù)
隨著社會(huì)的發(fā)展,人力成本昂貴等問(wèn)題逐漸涌現(xiàn),現(xiàn)今嬰兒看護(hù)方面的消費(fèi)成本或時(shí)間成本越來(lái)越高,諸如嬰兒看護(hù)器等可識(shí)別嬰兒哭聲的看護(hù)產(chǎn)品或家用安防產(chǎn)品越來(lái)越受到家長(zhǎng)的青睞。當(dāng)看護(hù)產(chǎn)品或家用安防產(chǎn)品檢測(cè)到嬰兒哭聲后,自動(dòng)向看護(hù)人員或家長(zhǎng)發(fā)出警示,以便于及時(shí)照看嬰兒。
在現(xiàn)有技術(shù)中,檢測(cè)嬰兒哭聲時(shí),通常是根據(jù)檢測(cè)到的音頻的能量特征來(lái)判斷是否有嬰兒哭聲,當(dāng)檢測(cè)到的音頻的能量特征與嬰兒哭聲的能量特征相吻合時(shí),判定音頻中有嬰兒哭聲,便向看護(hù)人員或家長(zhǎng)發(fā)出警示。
然而,檢測(cè)環(huán)境往往比較復(fù)雜,可能存在周?chē)h(huán)境的其他聲音,則音頻有可能存在不是嬰兒哭聲的環(huán)境噪聲,而當(dāng)其他聲音的能量特征與嬰兒哭聲的能量特征相類(lèi)似時(shí),若僅通過(guò)音頻的能量檢測(cè)嬰兒哭聲,很有可能會(huì)將環(huán)境噪聲作為嬰兒哭聲檢測(cè)出來(lái),檢測(cè)準(zhǔn)確度較低。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題在于,提供一種音頻特征提取方法、裝置、訓(xùn)練方法及電子設(shè)備,能夠根據(jù)音頻的擬合斜率、擬合截距、頻譜對(duì)比度、頻譜平坦度提取出音頻特征,用于嬰兒哭聲等音頻檢測(cè)場(chǎng)景時(shí),有利于多維度對(duì)音頻精細(xì)檢測(cè),有利于提高音頻檢測(cè)的準(zhǔn)確度。
為了解決上述技術(shù)問(wèn)題,第一方面,本發(fā)明提供了一種音頻特征提取方法,所述方法包括:
按照預(yù)設(shè)的窗口長(zhǎng)度獲取待提取音頻,并將所述待提取音頻按照預(yù)設(shè)的幀長(zhǎng)劃分為M幀音頻幀,M1;
計(jì)算每一所述音頻幀對(duì)應(yīng)的頻譜;其中,所述頻譜包括N個(gè)頻域點(diǎn),N1;
根據(jù)每一所述頻譜的N個(gè)頻域點(diǎn),基于線(xiàn)性擬合算法獲得每一所述頻譜對(duì)應(yīng)的擬合斜率和擬合截距;
根據(jù)所述頻譜和預(yù)設(shè)的計(jì)算公式,計(jì)算獲得每一所述頻譜的頻譜平坦度;
將每一所述頻譜劃分為m段頻譜帶,并計(jì)算獲得每一段所述頻譜帶對(duì)應(yīng)的對(duì)數(shù)頻譜;m1;
根據(jù)每一所述頻譜對(duì)應(yīng)的m段所述對(duì)數(shù)頻譜,獲得每一所述頻譜的頻譜對(duì)比度;
根據(jù)每一所述音頻幀的所述擬合斜率、所述擬合截距、所述頻譜平坦度和所述頻譜對(duì)比度,獲得每一所述音頻幀的特征量;
根據(jù)M幀所述音頻幀的特征量,提取出所述待提取音頻的音頻特征。
進(jìn)一步的,所述線(xiàn)性擬合算法為線(xiàn)性最小二乘算法,所述根據(jù)每一所述頻譜的N個(gè)頻域點(diǎn),基于線(xiàn)性擬合算法獲得每一所述頻譜對(duì)應(yīng)的擬合斜率和擬合截距,具體包括:
從每一所述頻譜的N個(gè)頻域點(diǎn)中,選取所對(duì)應(yīng)的頻率位于預(yù)設(shè)頻率范圍內(nèi)的頻域點(diǎn);
基于線(xiàn)性最小二乘算法,對(duì)所選取的對(duì)應(yīng)的頻率位于預(yù)設(shè)頻率范圍內(nèi)的頻域點(diǎn)進(jìn)行線(xiàn)性擬合,獲得每一所述頻譜對(duì)應(yīng)的擬合斜率和擬合截距。
進(jìn)一步的,所述將每一所述頻譜劃分為m段頻譜帶,并計(jì)算獲得每一段所述頻譜帶對(duì)應(yīng)的對(duì)數(shù)頻譜,具體包括:
將每一所述頻譜劃分為m段頻譜帶,分別對(duì)每一段所述頻譜帶進(jìn)行K-L變換處理;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于普聯(lián)國(guó)際有限公司,未經(jīng)普聯(lián)國(guó)際有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911409010.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





