[發(fā)明專(zhuān)利]網(wǎng)絡(luò)通話方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201911259913.4 | 申請(qǐng)日: | 2019-12-10 |
| 公開(kāi)(公告)號(hào): | CN110992963B | 公開(kāi)(公告)日: | 2023-09-29 |
| 發(fā)明(設(shè)計(jì))人: | 梁俊斌 | 申請(qǐng)(專(zhuān)利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G10L19/002 | 分類(lèi)號(hào): | G10L19/002;G10L19/24;H04L65/1069;H04L65/60 |
| 代理公司: | 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 邢惠童 |
| 地址: | 518057 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)絡(luò) 通話 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種網(wǎng)絡(luò)通話方法,其特征在于,所述方法包括:
從采集到的音頻信號(hào)中提取人聲信號(hào),基于目標(biāo)幀長(zhǎng)和目標(biāo)幀移將所述人聲信號(hào)劃分為多個(gè)音頻幀,其中,在時(shí)間上相鄰兩個(gè)音頻幀有重合部分;
將每個(gè)音頻幀和所述每個(gè)音頻幀對(duì)應(yīng)的窗函數(shù)相乘,得到多個(gè)加窗后的音頻幀,任一音頻幀對(duì)應(yīng)的窗函數(shù)基于任一音頻幀的音頻信號(hào)特征確定;
對(duì)所述多個(gè)加窗后的音頻幀進(jìn)行傅里葉變換,得到所述音頻信號(hào)的多個(gè)頻域信息;
將所述多個(gè)頻域信息輸入到碼率預(yù)測(cè)模型中,由所述碼率預(yù)測(cè)模型輸出使網(wǎng)絡(luò)通話的語(yǔ)音質(zhì)量符合目標(biāo)語(yǔ)音質(zhì)量條件的多個(gè)第一碼率;從所述多個(gè)第一碼率中獲取碼率相同的第一碼率的數(shù)量,將數(shù)量最多的第一碼率確定為與所述音頻信號(hào)對(duì)應(yīng)的目標(biāo)碼率;
基于所述目標(biāo)碼率對(duì)所述音頻信號(hào)進(jìn)行編碼,將編碼后的音頻信號(hào)發(fā)送至服務(wù)器,由所述服務(wù)器將所述編碼后的音頻信號(hào)發(fā)送至音頻信號(hào)接收方,以實(shí)現(xiàn)網(wǎng)絡(luò)通話。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從所述多個(gè)第一碼率中獲取碼率相同的第一碼率的數(shù)量,將數(shù)量最多的第一碼率確定為與所述音頻信號(hào)對(duì)應(yīng)的目標(biāo)碼率包括:
在所述多個(gè)第一碼率中,將碼率相同的第一碼率劃分成一個(gè)碼率小組;
獲取每個(gè)碼率小組中包含所述第一碼率的數(shù)量,將包含所述第一碼率的數(shù)量最多的碼率小組,確定為所述目標(biāo)碼率小組;
將所述目標(biāo)碼率小組中包含的所述第一碼率確定為所述目標(biāo)碼率。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述多個(gè)頻域信息輸入到碼率預(yù)測(cè)模型中之前,所述方法還包括:
基于樣本數(shù)據(jù)集進(jìn)行模型訓(xùn)練,得到所述碼率預(yù)測(cè)模型,其中,所述樣本數(shù)據(jù)集包括多個(gè)樣本音頻信號(hào)以及所述多個(gè)樣本音頻信號(hào)對(duì)應(yīng)的樣本碼率,其中,所述多個(gè)樣本音頻信號(hào)均符合相同的語(yǔ)音質(zhì)量條件。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于樣本數(shù)據(jù)集進(jìn)行模型訓(xùn)練,得到所述碼率預(yù)測(cè)模型之前,所述方法還包括:
基于所述多個(gè)樣本音頻信號(hào)對(duì)應(yīng)的樣本碼率,對(duì)所述多個(gè)樣本音頻信號(hào)進(jìn)行編碼后再解碼,得到多個(gè)樣本解碼音頻信號(hào);
基于所述多個(gè)樣本音頻信號(hào)與所述多個(gè)樣本解碼音頻信號(hào),確定所述多個(gè)樣本音頻信號(hào)的語(yǔ)音質(zhì)量。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于樣本數(shù)據(jù)集進(jìn)行模型訓(xùn)練,得到所述碼率預(yù)測(cè)模型包括:
對(duì)所述多個(gè)樣本音頻信號(hào)進(jìn)行時(shí)頻變換,得到多個(gè)樣本頻域信息;
將所述多個(gè)樣本頻域信息輸入到初始模型中;
由所述初始模型基于所述多個(gè)樣本頻域信息進(jìn)行碼率預(yù)測(cè),輸出多個(gè)與所述多個(gè)樣本頻域信息對(duì)應(yīng)的預(yù)測(cè)碼率;
基于所述樣本碼率和所述預(yù)測(cè)碼率的差別信息,調(diào)整所述初始模型的模型參數(shù),直至所述初始模型的模型參數(shù)符合目標(biāo)截止條件時(shí),停止訓(xùn)練所述初始模型,將訓(xùn)練后的初始模型作為所述碼率預(yù)測(cè)模型。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述多個(gè)加窗后的音頻幀進(jìn)行傅里葉變換,得到所述音頻信號(hào)的多個(gè)頻域信息,包括:
對(duì)所述多個(gè)加窗后的音頻幀進(jìn)行傅里葉變換,得到每個(gè)音頻幀的線性頻域參數(shù);
基于所述每個(gè)音頻幀的線性頻域參數(shù),得到所述每個(gè)音頻幀的線性頻域功率譜值;
基于所述每個(gè)音頻幀的線性頻域功率譜值,得到多個(gè)巴克域功率譜值;
對(duì)所述多個(gè)巴克域功率譜值進(jìn)行對(duì)數(shù)運(yùn)算,得到所述多個(gè)頻域信息。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從采集到的音頻信號(hào)中提取人聲信號(hào)包括:
識(shí)別所述音頻信號(hào)中人聲的起始時(shí)間點(diǎn)和結(jié)束時(shí)間點(diǎn),將所述起始時(shí)間點(diǎn)和所述結(jié)束時(shí)間點(diǎn)之間的音頻信號(hào)作為所述人聲信號(hào)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911259913.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





