[發(fā)明專(zhuān)利]一種音頻片段的檢測(cè)方法及相關(guān)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201911399043.0 | 申請(qǐng)日: | 2019-12-26 |
| 公開(kāi)(公告)號(hào): | CN111159464A | 公開(kāi)(公告)日: | 2020-05-15 |
| 發(fā)明(設(shè)計(jì))人: | 繆暢宇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G06F16/65 | 分類(lèi)號(hào): | G06F16/65;G06F16/683;G06N3/04;G06N3/08 |
| 代理公司: | 廣州三環(huán)專(zhuān)利商標(biāo)代理有限公司 44202 | 代理人: | 熊永強(qiáng);杜維 |
| 地址: | 518057 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 片段 檢測(cè) 方法 相關(guān) 設(shè)備 | ||
本發(fā)明實(shí)施例公開(kāi)了一種音頻片段的檢測(cè)方法,包括:接收對(duì)目標(biāo)音頻文件的音頻片段檢測(cè)請(qǐng)求,所述音頻片段檢測(cè)請(qǐng)求攜帶目標(biāo)類(lèi)別標(biāo)識(shí);將所述目標(biāo)音頻文件的音頻特征和所述目標(biāo)類(lèi)別標(biāo)識(shí)的類(lèi)別向量輸入至訓(xùn)練后的音頻片段提取模型;其中,所述訓(xùn)練后的音頻片段提取模型包括訓(xùn)練后的分類(lèi)模型和訓(xùn)練后的回歸模型;根據(jù)所述訓(xùn)練后的分類(lèi)模型,對(duì)所述目標(biāo)音頻文件的音頻特征進(jìn)行檢測(cè),以判斷所述目標(biāo)音頻文件對(duì)應(yīng)的所有音頻類(lèi)別中是否存在所述類(lèi)別向量對(duì)應(yīng)的音頻類(lèi)別;若存在,則根據(jù)訓(xùn)練后的回歸模型確定所述目標(biāo)音頻文件中所述類(lèi)別向量對(duì)應(yīng)的音頻片段的起止信息。采用本發(fā)明,可以在音頻文件中準(zhǔn)確檢測(cè)出目標(biāo)類(lèi)別標(biāo)識(shí)的音頻片段。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種音頻片段的檢測(cè)方法及相關(guān)設(shè)備。
背景技術(shù)
隨著科學(xué)技術(shù)的發(fā)展,音頻片段的檢測(cè)技術(shù)得到快速發(fā)展,人們對(duì)于檢測(cè)并獲得一個(gè)音頻文件中某一類(lèi)別的音頻片段的要求越來(lái)越高。通常來(lái)說(shuō),音頻文件的組成很多樣,從音頻的音色組成來(lái)看,可以有打擊樂(lè)、鍵盤(pán)樂(lè)、人聲等,從音頻的流程來(lái)看,可以有副歌、間奏、前奏等,從音頻的人聲聲部來(lái)看,可以有男高音、女低音、男中音等。而現(xiàn)目前的技術(shù)中,對(duì)于一個(gè)訓(xùn)練模型,只能檢測(cè)出音頻文件中的一種類(lèi)別的音頻片段,不能用一個(gè)訓(xùn)練模型檢測(cè)出音頻文件中任意一種類(lèi)別的音頻片段,例如只能檢測(cè)出男高音、女低音或男中音,不能檢測(cè)出副歌、間奏或前奏,因此,如何用一個(gè)訓(xùn)練模型檢測(cè)出音頻文件中任意一種類(lèi)別的音頻片段是當(dāng)前的研究熱點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題在于,提供一種音頻片段的檢測(cè)方法,可以在音頻文件中準(zhǔn)確檢測(cè)出目標(biāo)類(lèi)別標(biāo)識(shí)的音頻片段。
一方面,本發(fā)明實(shí)施例提供了一種音頻片段的檢測(cè)方法,包括:
接收對(duì)目標(biāo)音頻文件的音頻片段檢測(cè)請(qǐng)求,所述音頻片段檢測(cè)請(qǐng)求攜帶目標(biāo)類(lèi)別標(biāo)識(shí);
將所述音頻文件的音頻特征和所述目標(biāo)類(lèi)別標(biāo)識(shí)的類(lèi)別向量輸入至訓(xùn)練后的音頻片段提取模型,得到所述音頻文件中所述類(lèi)別向量對(duì)應(yīng)的音頻片段的起止信息;
根據(jù)所述起止信息確定所述音頻片段。
另一方面,本發(fā)明實(shí)施例提供了一種音頻片段的檢測(cè)裝置,包括:
接收單元,用于接收對(duì)目標(biāo)音頻文件的音頻片段檢測(cè)請(qǐng)求,所述音頻片段檢測(cè)請(qǐng)求攜帶目標(biāo)類(lèi)別標(biāo)識(shí);
處理單元,將所述目標(biāo)音頻文件的音頻特征和所述目標(biāo)類(lèi)別標(biāo)識(shí)的類(lèi)別向量輸入至訓(xùn)練后的音頻片段提取模型;其中,所述訓(xùn)練后的音頻片段提取模型包括訓(xùn)練后的分類(lèi)模型和訓(xùn)練后的回歸模型;
所述處理單元,還用于根據(jù)所述訓(xùn)練后的分類(lèi)模型,對(duì)所述目標(biāo)音頻文件的音頻特征進(jìn)行檢測(cè),以判斷所述目標(biāo)音頻文件對(duì)應(yīng)的所有音頻類(lèi)別中是否存在所述類(lèi)別向量對(duì)應(yīng)的音頻類(lèi)別;
所述處理單元,還用于若所述目標(biāo)音頻文件對(duì)應(yīng)的所有音頻類(lèi)別中存在所述類(lèi)別向量對(duì)應(yīng)的音頻類(lèi)別,則根據(jù)訓(xùn)練后的回歸模型確定所述目標(biāo)音頻文件中所述類(lèi)別向量對(duì)應(yīng)的音頻片段的起止信息;
所述處理單元,還用于根據(jù)所述起止信息確定所述音頻片段。
相應(yīng)的,本發(fā)明實(shí)施例提供了一種終端,包括:所述終端包括:存儲(chǔ)器,所述存儲(chǔ)器包括計(jì)算機(jī)可讀指令;與所述存儲(chǔ)器相連的處理器,所述處理器用于執(zhí)行所述計(jì)算機(jī)可讀指令,從而使得所述設(shè)備執(zhí)行上述涉及的音頻片段的檢測(cè)方法。
相應(yīng)的,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括:所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有程序指令,所述程序指令被處理器執(zhí)行時(shí),實(shí)現(xiàn)上述涉及的音頻片段的檢測(cè)方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911399043.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





