[發(fā)明專利]語(yǔ)音傳輸方法、系統(tǒng)、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 202010104793.7 | 申請(qǐng)日: | 2020-02-20 |
| 公開(kāi)(公告)號(hào): | CN112820306B | 公開(kāi)(公告)日: | 2023-08-15 |
| 發(fā)明(設(shè)計(jì))人: | 梁俊斌 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G10L19/16 | 分類號(hào): | G10L19/16;G10L19/008 |
| 代理公司: | 華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 董慧;李文淵 |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 傳輸 方法 系統(tǒng) 裝置 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) 設(shè)備 | ||
1.一種語(yǔ)音傳輸方法,包括:
獲取語(yǔ)音編碼碼流中的當(dāng)前編碼數(shù)據(jù);
通過(guò)訓(xùn)練好的基于機(jī)器學(xué)習(xí)的丟包恢復(fù)能力預(yù)測(cè)模型,根據(jù)當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的第一語(yǔ)音編碼特征參數(shù)以及所述當(dāng)前編碼數(shù)據(jù)的在前編碼數(shù)據(jù)對(duì)應(yīng)的第二語(yǔ)音編碼特征參數(shù),獲得所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的丟包恢復(fù)能力;
根據(jù)所述丟包恢復(fù)能力判決是否需要進(jìn)行冗余編碼處理;
若是,則根據(jù)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行冗余編碼生成相應(yīng)的冗余包后,再將所述當(dāng)前編碼數(shù)據(jù)及所述冗余包傳輸至接收端;
若否,則直接將所述當(dāng)前編碼數(shù)據(jù)傳輸至接收端;
其中,所述丟包恢復(fù)能力預(yù)測(cè)模型通過(guò)以下步驟確定:
獲取訓(xùn)練集中的樣本語(yǔ)音序列,對(duì)所述樣本語(yǔ)音序列進(jìn)行語(yǔ)音編碼,獲得樣本語(yǔ)音編碼碼流,提取所述樣本語(yǔ)音編碼碼流中的當(dāng)前編碼數(shù)據(jù)所采用的第一語(yǔ)音編碼特征參數(shù)以及所述當(dāng)前編碼數(shù)據(jù)的在前編碼數(shù)據(jù)所采用的第二語(yǔ)音編碼特征參數(shù);
獲取直接對(duì)所述樣本語(yǔ)音編碼碼流進(jìn)行解碼并獲得第一語(yǔ)音信號(hào)后,基于所述第一語(yǔ)音信號(hào)所確定的第一語(yǔ)音質(zhì)量評(píng)分;獲取對(duì)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行模擬丟包恢復(fù)處理獲得恢復(fù)包,對(duì)所述恢復(fù)包進(jìn)行解碼并獲得第二語(yǔ)音信號(hào)后,基于所述第二語(yǔ)音信號(hào)所確定的第二語(yǔ)音質(zhì)量評(píng)分;
根據(jù)所述第一語(yǔ)音質(zhì)量評(píng)分與所述第二語(yǔ)音質(zhì)量評(píng)分之間的評(píng)分差異確定所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的真實(shí)丟包恢復(fù)能力;將所述第一語(yǔ)音編碼特征參數(shù)及所述第二語(yǔ)音編碼特征參數(shù)輸入至機(jī)器學(xué)習(xí)模型,通過(guò)所述機(jī)器學(xué)習(xí)模型輸出所述當(dāng)前編碼數(shù)據(jù)所對(duì)應(yīng)的預(yù)測(cè)丟包恢復(fù)能力;
根據(jù)所述真實(shí)丟包恢復(fù)能力與所述預(yù)測(cè)丟包恢復(fù)能力之間的差異調(diào)整所述機(jī)器學(xué)習(xí)模型的模型參數(shù)后,返回至所述獲取訓(xùn)練集中的樣本語(yǔ)音序列的步驟繼續(xù)訓(xùn)練,直至滿足訓(xùn)練結(jié)束條件。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
獲取原始語(yǔ)音信號(hào);
將原始語(yǔ)音信號(hào)進(jìn)行分割,獲得原始語(yǔ)音序列;
依次對(duì)所述原始語(yǔ)音序列中的語(yǔ)音片段進(jìn)行語(yǔ)音編碼,獲得語(yǔ)音編碼碼流。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
獲取原始語(yǔ)音序列中的語(yǔ)音片段各自對(duì)應(yīng)的語(yǔ)音編碼特征參數(shù);
根據(jù)所述語(yǔ)音編碼特征參數(shù)對(duì)相應(yīng)的語(yǔ)音片段進(jìn)行語(yǔ)音編碼,生成對(duì)應(yīng)的編碼數(shù)據(jù)后獲得語(yǔ)音編碼碼流;
緩存語(yǔ)音編碼過(guò)程中各個(gè)編碼數(shù)據(jù)所采用的語(yǔ)音編碼特征參數(shù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過(guò)訓(xùn)練好的基于機(jī)器學(xué)習(xí)的丟包恢復(fù)能力預(yù)測(cè)模型,根據(jù)當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的第一語(yǔ)音編碼特征參數(shù)以及所述當(dāng)前編碼數(shù)據(jù)的在前編碼數(shù)據(jù)對(duì)應(yīng)的第二語(yǔ)音編碼特征參數(shù),獲得所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的丟包恢復(fù)能力,包括:
將所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的第一語(yǔ)音編碼特征參數(shù)以及所述當(dāng)前編碼數(shù)據(jù)的在前編碼數(shù)據(jù)對(duì)應(yīng)的第二語(yǔ)音編碼特征參數(shù)輸入至丟包恢復(fù)能力預(yù)測(cè)模型;
通過(guò)所述丟包恢復(fù)能力預(yù)測(cè)模型,根據(jù)所述第一語(yǔ)音編碼特征參數(shù)及所述第二語(yǔ)音編碼特征參數(shù),輸出對(duì)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行直接解碼所確定的第一語(yǔ)音質(zhì)量評(píng)分與對(duì)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行丟包恢復(fù)處理后解碼所確定的第二語(yǔ)音質(zhì)量評(píng)分之間的評(píng)分差異;
根據(jù)所述評(píng)分差異確定所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的丟包恢復(fù)能力;
其中,所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的丟包恢復(fù)能力與所述評(píng)分差異成反相關(guān)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行冗余編碼生成相應(yīng)的冗余包后,再將所述當(dāng)前編碼數(shù)據(jù)及所述冗余包傳輸至接收端,包括:
獲取接收端所反饋的丟包狀態(tài)信息;
根據(jù)所述丟包狀態(tài)信息確定所述當(dāng)前編碼數(shù)據(jù)所對(duì)應(yīng)的冗余率;
按照所述冗余率,根據(jù)所述當(dāng)前編碼數(shù)據(jù)生成冗余包后將所述當(dāng)前編碼數(shù)據(jù)及所述冗余包傳輸至所述接收端。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010104793.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





