[發(fā)明專利]音頻識(shí)別方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 201711486757.6 | 申請(qǐng)日: | 2017-12-29 |
| 公開(kāi)(公告)號(hào): | CN108198573B | 公開(kāi)(公告)日: | 2021-04-30 |
| 發(fā)明(設(shè)計(jì))人: | 黃瑛;胡明清;王濤;楊琛 | 申請(qǐng)(專利權(quán))人: | 北京奇藝世紀(jì)科技有限公司 |
| 主分類號(hào): | G10L25/48 | 分類號(hào): | G10L25/48;G06F16/683 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 李偉;王寶筠 |
| 地址: | 100080 北京市海淀*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 識(shí)別 方法 裝置 存儲(chǔ) 介質(zhì) 電子設(shè)備 | ||
1.一種音頻識(shí)別方法,其特征在于,包括:
依據(jù)預(yù)設(shè)的第一選取規(guī)則,在待識(shí)別音頻中分段選取目標(biāo)音頻樣本;
按第一音頻指紋提取密度,在所述目標(biāo)音頻樣本中提取多個(gè)音頻指紋;
將提取的所述多個(gè)音頻指紋與預(yù)建立的音頻指紋庫(kù)中的指紋進(jìn)行匹配;所述預(yù)建立的音頻指紋庫(kù)按第二音頻指紋提取密度進(jìn)行音頻指紋的提取,所述第一音頻指紋提取密度小于所述第二音頻指紋提取密度;
當(dāng)未匹配成功時(shí),在所述待識(shí)別音頻中,重新選取新的目標(biāo)音頻樣本,直至匹配成功,以實(shí)現(xiàn)對(duì)待識(shí)別音頻的識(shí)別。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)預(yù)設(shè)的選取規(guī)則,在待識(shí)別音頻中分段選取目標(biāo)音頻樣本,包括:
確定第一時(shí)間長(zhǎng)度;
在所述待識(shí)別音頻中隨機(jī)選取時(shí)長(zhǎng)為所述第一時(shí)間長(zhǎng)度的音頻作為目標(biāo)音頻樣本。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)預(yù)設(shè)的選取規(guī)則,在待識(shí)別音頻中分段選取目標(biāo)音頻樣本包括:
對(duì)所述待識(shí)別音頻中的各個(gè)音頻片段進(jìn)行音頻能量檢測(cè);
在音頻能量大于預(yù)設(shè)音頻能量閾值的各個(gè)音頻片段中,選取一個(gè)音頻片段作為目標(biāo)音頻樣本。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將提取的多個(gè)音頻指紋與預(yù)建立的音頻指紋庫(kù)中的指紋進(jìn)行匹配包括:
對(duì)所述提取的多個(gè)音頻指紋進(jìn)行降采樣處理;
將經(jīng)過(guò)降采樣處理的所述多個(gè)音頻指紋,與預(yù)建立的音頻指紋庫(kù)中的指紋進(jìn)行匹配。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在待識(shí)別音頻中,重新選取新的目標(biāo)音頻樣本包括:
依據(jù)預(yù)設(shè)的第二選取規(guī)則,在所述待識(shí)別音頻中重新選取新的目標(biāo)音頻樣本,所述第二選取規(guī)則不同于所述第一選取規(guī)則。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
當(dāng)匹配成功時(shí),獲取所述待識(shí)別音頻對(duì)應(yīng)的音頻信息,并將所述音頻信息反饋至客戶端。
7.一種音頻識(shí)別裝置,其特征在于,包括:
第一選取單元,用于依據(jù)預(yù)設(shè)的第一選取規(guī)則,在待識(shí)別音頻中分段選取目標(biāo)音頻樣本;
提取單元,用于按第一音頻指紋提取密度,在所述目標(biāo)音頻樣本中提取多個(gè)音頻指紋;
匹配單元,用于將提取的所述多個(gè)音頻指紋與預(yù)建立的音頻指紋庫(kù)中的指紋進(jìn)行匹配;所述預(yù)建立的音頻指紋庫(kù)按第二音頻指紋提取密度進(jìn)行音頻指紋的提取,所述第一音頻指紋提取密度小于所述第二音頻指紋提取密度;
第二選取單元,用于當(dāng)未匹配成功時(shí),在所述待識(shí)別音頻中,重新選取新的目標(biāo)音頻樣本,直至匹配成功,以實(shí)現(xiàn)對(duì)待識(shí)別音頻的識(shí)別。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括:
反饋單元,用于當(dāng)匹配成功時(shí),獲取所述待識(shí)別音頻對(duì)應(yīng)的音頻信息,并將所述音頻信息反饋至客戶端。
9.一種存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在所述程序運(yùn)行時(shí)控制所述存儲(chǔ)介質(zhì)所在的設(shè)備執(zhí)行如權(quán)利要求1~6任意一項(xiàng)所述的音頻識(shí)別方法。
10.一種電子設(shè)備,其特征在于,包括存儲(chǔ)器,以及一個(gè)或者一個(gè)以上的程序,其中一個(gè)或者一個(gè)以上程序存儲(chǔ)于存儲(chǔ)器中,且經(jīng)配置以由一個(gè)或者一個(gè)以上處理器執(zhí)行如權(quán)利要求1~6任意一項(xiàng)所述的音頻識(shí)別方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇藝世紀(jì)科技有限公司,未經(jīng)北京奇藝世紀(jì)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711486757.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種音頻處理方法及裝置
- 下一篇:變聲檢測(cè)方法及裝置
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





