[發(fā)明專利]一種基于深度學(xué)習(xí)的音質(zhì)特性處理方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201810583119.4 | 申請(qǐng)日: | 2018-06-05 |
| 公開(kāi)(公告)號(hào): | CN109147804A | 公開(kāi)(公告)日: | 2019-01-04 |
| 發(fā)明(設(shè)計(jì))人: | 姚青山;秦宇;喻浩文;盧峰;陽(yáng)萌 | 申請(qǐng)(專利權(quán))人: | 安克創(chuàng)新科技股份有限公司 |
| 主分類號(hào): | G10L21/007 | 分類號(hào): | G10L21/007;G10L25/30;G10L25/51;G10L25/84;G10L15/06 |
| 代理公司: | 北京市磐華律師事務(wù)所 11336 | 代理人: | 董巍;高偉 |
| 地址: | 410205 湖南省長(zhǎng)沙市高新開(kāi)發(fā)區(qū)尖*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻數(shù)據(jù) 音質(zhì)特性 基線模型 數(shù)據(jù)特征 神經(jīng)網(wǎng)絡(luò)模型 用戶反饋數(shù)據(jù) 用戶偏好數(shù)據(jù) 單個(gè)用戶 數(shù)據(jù)訓(xùn)練 特征提取 行為數(shù)據(jù) 音質(zhì)處理 音質(zhì)調(diào)節(jié) 在線學(xué)習(xí) 學(xué)習(xí) 個(gè)性化 | ||
1.一種基于深度學(xué)習(xí)的音質(zhì)特性處理方法,其特征在于,所述方法包括:
對(duì)包含待處理音頻數(shù)據(jù)的用戶偏好數(shù)據(jù)進(jìn)行特征提取得到所述待處理的音頻數(shù)據(jù)的數(shù)據(jù)特征;
基于所述數(shù)據(jù)特征,利用訓(xùn)練好的基線模型,生成所述待處理的音頻數(shù)據(jù)的音質(zhì)處理結(jié)果;
所述基線模型是利用廣泛大眾或單個(gè)用戶的音頻數(shù)據(jù),行為數(shù)據(jù)及其他相關(guān)數(shù)據(jù)訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型。
2.如權(quán)利要求1所述的音質(zhì)特性處理方法,其特征在于,用戶偏好數(shù)據(jù)包括反映用戶對(duì)音質(zhì)特性偏好的數(shù)據(jù)。
3.如權(quán)利要求1所述的音質(zhì)特性處理方法,其特征在于,所述用戶偏好數(shù)據(jù)包括用戶行為數(shù)據(jù)、用戶音頻列表數(shù)據(jù)、播放中的音頻數(shù)據(jù)、環(huán)境噪聲數(shù)據(jù)、設(shè)備數(shù)據(jù)及其他參數(shù)數(shù)據(jù)中的至少一種。
4.如權(quán)利要求1所述的音質(zhì)特性處理方法,其特征在于,所述特征提取的方法包括FFT,STFT,MFCC,一幀或多幀的時(shí)域波形,和其他人工設(shè)計(jì)特征中的至少一種。
5.如權(quán)利要求1所述的音頻音質(zhì)推薦方法,其特征在于,所述數(shù)據(jù)特征包括時(shí)域和/或頻域特征。
6.如權(quán)利要求1所述的音質(zhì)特性處理方法,其特征在于,所述基線模型的訓(xùn)練方法包括:
基于訓(xùn)練數(shù)據(jù)進(jìn)行特征提取得到訓(xùn)練數(shù)據(jù)的數(shù)據(jù)特征,將所述數(shù)據(jù)特征作為輸入層輸入,將能夠反應(yīng)所述音質(zhì)特性的特征作為輸出層目標(biāo),訓(xùn)練得到所述基線模型;或?qū)τ脩羝脭?shù)據(jù)進(jìn)行特征提取,采用無(wú)監(jiān)督的深度學(xué)習(xí)方法,得到所述基線模型。
7.如權(quán)利要求1所述的音質(zhì)特性處理方法,其特征在于,所述音質(zhì)特性包括經(jīng)驗(yàn)融合類,人為損傷類,音質(zhì)設(shè)置可反饋類,經(jīng)驗(yàn)公式可調(diào)類,信號(hào)域可計(jì)算類,噪聲雜音類或其他類。
8.如權(quán)利要求7所述的音質(zhì)特性處理方法,其特征在于,所述經(jīng)驗(yàn)融合類音質(zhì)特性的基線模型的訓(xùn)練包括:
基于音頻數(shù)據(jù)庫(kù)提取音頻數(shù)據(jù)的類別標(biāo)簽特征以及所述音頻數(shù)據(jù)的數(shù)據(jù)特征;
將所述音頻數(shù)據(jù)的數(shù)據(jù)特征作為輸入層數(shù)據(jù),所述類別標(biāo)簽特征作為輸出層數(shù)據(jù),訓(xùn)練得到經(jīng)驗(yàn)融合類音質(zhì)特性的基線模型。
9.如權(quán)利要求7所述的音質(zhì)特性處理方法,其特征在于,所述人為損傷類音質(zhì)特性的基線模型的訓(xùn)練包括:
基于音頻數(shù)據(jù)庫(kù)中的高質(zhì)量音頻數(shù)據(jù)樣本進(jìn)行人為處理得到有損的低質(zhì)量音頻數(shù)據(jù)樣本,并對(duì)所述有損的低質(zhì)量音頻數(shù)據(jù)樣本和所述高質(zhì)量音頻數(shù)據(jù)樣本分別進(jìn)行特征提取得到低質(zhì)量音頻數(shù)據(jù)特征和高質(zhì)量音頻數(shù)據(jù)特征;
將所述低質(zhì)量音頻數(shù)據(jù)特征作為輸入層數(shù)據(jù),高質(zhì)量音頻數(shù)據(jù)特征作為輸出層數(shù)據(jù),訓(xùn)練得到人為損傷類音質(zhì)特性的基線模型。
10.如權(quán)利要求7所述的音質(zhì)特性處理方法,其特征在于,所述音質(zhì)設(shè)置可反饋類音質(zhì)特性的基線模型的訓(xùn)練包括:
基于大眾用戶音頻數(shù)據(jù)中的環(huán)境數(shù)據(jù)和與所述環(huán)境數(shù)據(jù)相應(yīng)的行為數(shù)據(jù),分別進(jìn)行特征提取,得到所述環(huán)境數(shù)據(jù)的環(huán)境參數(shù)特征和所述行為數(shù)據(jù)的音質(zhì)特性設(shè)置特征;
將所述環(huán)境參數(shù)特征作為輸入層數(shù)據(jù),所述音質(zhì)特性設(shè)置特征作為輸出層數(shù)據(jù),訓(xùn)練得到音質(zhì)設(shè)置可反饋類音質(zhì)特性的基線模型。
11.如權(quán)利要求7所述的音質(zhì)特性處理方法,其特征在于,所述公式經(jīng)驗(yàn)可調(diào)類音質(zhì)特性的基線模型的訓(xùn)練包括:
基于音頻數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù),進(jìn)行特征提取得到原始數(shù)據(jù)特征;
對(duì)所述音頻數(shù)據(jù)進(jìn)行音質(zhì)特性調(diào)整并對(duì)調(diào)整后的音頻數(shù)據(jù)提取特征得到調(diào)整參數(shù)特征,通過(guò)主觀評(píng)測(cè)實(shí)驗(yàn)建立將所述調(diào)整參數(shù)特征映射到主觀評(píng)測(cè)的網(wǎng)絡(luò)模型,得到最佳音質(zhì)特性調(diào)整參數(shù);
將所述原始數(shù)據(jù)特征作為輸入層數(shù)據(jù),所述最佳音質(zhì)特性調(diào)整參數(shù)作為輸出層數(shù)據(jù),訓(xùn)練得到所述經(jīng)驗(yàn)公式可調(diào)類音質(zhì)特性的基線模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安克創(chuàng)新科技股份有限公司,未經(jīng)安克創(chuàng)新科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810583119.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L21-00 為了改變語(yǔ)音信號(hào)的質(zhì)量或其可識(shí)度而處理語(yǔ)音信號(hào),以產(chǎn)生另一種可聽(tīng)的或非可聽(tīng)的信號(hào),例如視覺(jué)信號(hào)或觸覺(jué)信號(hào)
G10L21-02 .語(yǔ)音增強(qiáng),例如降低噪聲或消除回聲
G10L21-04 .時(shí)間壓縮或擴(kuò)展
G10L21-06 .將語(yǔ)音轉(zhuǎn)換成非可聽(tīng)表達(dá)形式,例如語(yǔ)音可視化、觸覺(jué)輔助的語(yǔ)音處理
- 一種音頻調(diào)整方法、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 音頻數(shù)據(jù)識(shí)別方法及系統(tǒng)
- 消除背景音頻數(shù)據(jù)的方法、裝置和系統(tǒng)
- 音頻數(shù)據(jù)確定方法、裝置、設(shè)備和介質(zhì)
- 音頻分類的方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 一種音頻處理方法及電子設(shè)備
- 一種音頻傳輸方法和裝置
- 一種音頻數(shù)據(jù)生成方法、音頻數(shù)據(jù)轉(zhuǎn)寫方法及其裝置
- 語(yǔ)音數(shù)據(jù)的處理方法、裝置及電子設(shè)備
- 模型訓(xùn)練、數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種模擬網(wǎng)絡(luò)特性引起語(yǔ)音質(zhì)量變化的測(cè)試方法及裝置
- 音質(zhì)調(diào)整耳機(jī)
- 用于計(jì)算機(jī)的音效處理裝置
- 外觀可展示音質(zhì)特性的耳機(jī)包裝盒
- 一種網(wǎng)絡(luò)語(yǔ)音質(zhì)量評(píng)估方法、裝置和系統(tǒng)
- 音質(zhì)檢測(cè)方法及裝置
- 耳機(jī)和調(diào)節(jié)耳機(jī)音頻特性的方法
- 耳機(jī)和調(diào)節(jié)耳機(jī)音頻特性的方法
- 智能均衡器設(shè)計(jì)方法及具有智能均衡器的降噪耳機(jī)
- 一種音頻推薦方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)
- 漸變描繪裝置
- 一種接收機(jī)觀測(cè)噪聲的獲取方法和裝置
- 一種對(duì)不同格式安全基線知識(shí)庫(kù)進(jìn)行抽象的方法
- 一種基于安全基線模型的網(wǎng)絡(luò)數(shù)據(jù)安全檢測(cè)方法及系統(tǒng)
- 一種基于動(dòng)態(tài)基線的主機(jī)監(jiān)控報(bào)警系統(tǒng)及方法
- 一種數(shù)據(jù)處理方法、裝置及設(shè)備
- 一種數(shù)據(jù)處理方法、裝置及設(shè)備
- 基線的自適應(yīng)調(diào)整方法及裝置
- 一種計(jì)算機(jī)終端安全基線核查方法
- 一種數(shù)據(jù)處理方法、裝置及設(shè)備
- 會(huì)員特征數(shù)據(jù)統(tǒng)計(jì)方法及特征數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)
- 人臉特征數(shù)據(jù)獲取系統(tǒng)
- 生物特征數(shù)據(jù)檢測(cè)裝置
- 學(xué)生特征數(shù)據(jù)挖掘系統(tǒng)
- 學(xué)生特征數(shù)據(jù)挖掘系統(tǒng)
- 時(shí)間序列數(shù)據(jù)特征量提取裝置、時(shí)間序列數(shù)據(jù)特征量提取方法和時(shí)間序列數(shù)據(jù)特征量提取程序
- 特征數(shù)據(jù)庫(kù)的更新、數(shù)據(jù)特征的確定方法、裝置及設(shè)備
- 生理特征數(shù)據(jù)測(cè)量裝置
- 特征大數(shù)據(jù)提取裝置
- 數(shù)據(jù)特征處理方法及數(shù)據(jù)特征處理裝置





