[發(fā)明專利]語(yǔ)音參數(shù)量化方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201811109230.6 | 申請(qǐng)日: | 2018-09-21 |
| 公開(公告)號(hào): | CN109256143A | 公開(公告)日: | 2019-01-22 |
| 發(fā)明(設(shè)計(jì))人: | 袁念德 | 申請(qǐng)(專利權(quán))人: | 西安蜂語(yǔ)信息科技有限公司 |
| 主分類號(hào): | G10L19/16 | 分類號(hào): | G10L19/16;G10L19/00;G10L19/032 |
| 代理公司: | 北京華進(jìn)京聯(lián)知識(shí)產(chǎn)權(quán)代理有限公司 11606 | 代理人: | 王程 |
| 地址: | 710077 陜西省西安市高*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音參數(shù) 量化 計(jì)算機(jī)設(shè)備 存儲(chǔ)介質(zhì) 速率和 參數(shù)分析 靈活設(shè)置 語(yǔ)音信號(hào) 傳輸 預(yù)設(shè) 場(chǎng)景 申請(qǐng) | ||
本申請(qǐng)涉及一種語(yǔ)音參數(shù)量化方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。所述方法包括:采用預(yù)設(shè)的參數(shù)分析方法獲取語(yǔ)音信號(hào)的語(yǔ)音參數(shù);根據(jù)所述語(yǔ)音信號(hào)的傳輸速率和所述語(yǔ)音參數(shù),確定與所述語(yǔ)音參數(shù)對(duì)應(yīng)的量化方法對(duì)所述語(yǔ)音參數(shù)進(jìn)行量化。采用本方法能夠可以針對(duì)不同的傳輸速率和語(yǔ)音參數(shù)靈活設(shè)置不同的量化方法,適用于不同的場(chǎng)景中,滿足用戶的不同需求。
技術(shù)領(lǐng)域
本申請(qǐng)涉及音頻編碼技術(shù)領(lǐng)域,特別是涉及一種語(yǔ)音參數(shù)量化方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù)
聲碼器是一種對(duì)話音進(jìn)行分析和合成的編譯碼器,也稱話音分析合成系統(tǒng)或話音頻帶壓縮系統(tǒng),是壓縮話音通信頻帶和進(jìn)行保密通信的有力工具。
聲碼器可以分為編碼器和解碼器,編碼器將音頻信號(hào)轉(zhuǎn)化為比特流用于信道傳輸,解碼器從比特流中恢復(fù)出用于語(yǔ)音合成的參數(shù)進(jìn)行語(yǔ)音合成,輸出音頻數(shù)據(jù)。目前,編碼器常用的語(yǔ)音參數(shù)量化方法包括互聯(lián)網(wǎng)低比特率編碼(Internet Low Bitrate Codec,ILBC)、增強(qiáng)型可變速率編解碼器(Enhanced Variable Rate Codec,EVRC)、自適應(yīng)多速率語(yǔ)音編碼(Adaptive Multi Rate,AMR)等方法。
但是,上述語(yǔ)音參數(shù)量化方法不夠靈活,不能適應(yīng)各種場(chǎng)景。
發(fā)明內(nèi)容
基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供一種能夠靈活適應(yīng)多種場(chǎng)景的語(yǔ)音參數(shù)量化方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。
一種語(yǔ)音參數(shù)量化方法,所述方法包括:
采用預(yù)設(shè)的參數(shù)分析方法獲取語(yǔ)音信號(hào)的語(yǔ)音參數(shù);
根據(jù)所述語(yǔ)音信號(hào)的傳輸速率和所述語(yǔ)音參數(shù),確定與所述語(yǔ)音參數(shù)對(duì)應(yīng)的量化方法對(duì)所述語(yǔ)音參數(shù)進(jìn)行量化。
在其中一個(gè)實(shí)施例中,所述根據(jù)所述語(yǔ)音信號(hào)的傳輸速率和所述語(yǔ)音參數(shù),確定與所述語(yǔ)音參數(shù)對(duì)應(yīng)的量化方法對(duì)所述語(yǔ)音參數(shù)進(jìn)行量化,包括:
若所述語(yǔ)音信號(hào)的傳輸速率為2400bps,且所述語(yǔ)音參數(shù)為基音周期,則根據(jù)所述語(yǔ)音信號(hào)的周期屬性或傳輸所述語(yǔ)音信號(hào)的當(dāng)前幀的清濁類型,對(duì)所述基音周期進(jìn)行量化。
在其中一個(gè)實(shí)施例中,所述根據(jù)所述語(yǔ)音信號(hào)的周期屬性或傳輸所述語(yǔ)音信號(hào)的當(dāng)前幀的清濁類型,對(duì)所述基音周期進(jìn)行量化,包括:
若所述當(dāng)前幀為濁音幀,則對(duì)所述語(yǔ)音信號(hào)在所述當(dāng)前幀的基音周期進(jìn)行對(duì)數(shù)轉(zhuǎn)換,并采用預(yù)設(shè)階數(shù)對(duì)轉(zhuǎn)換結(jié)果進(jìn)行均勻量化;
若所述當(dāng)前幀為清音幀,或者,所述語(yǔ)音信號(hào)的周期屬性為非周期,則對(duì)所述語(yǔ)音信號(hào)的基音周期進(jìn)行比特量化。
在其中一個(gè)實(shí)施例中,若所述當(dāng)前幀為清音幀,或者,所述語(yǔ)音信號(hào)的周期屬性為非周期,則對(duì)所述語(yǔ)音信號(hào)的基音周期進(jìn)行比特量化,包括:
若所述當(dāng)前幀為清音幀,則將所述語(yǔ)音信號(hào)的基音周期對(duì)應(yīng)的比特位均量化為第一值;
若所述語(yǔ)音信號(hào)的周期屬性為非周期,則將所述語(yǔ)音信號(hào)的基音周期對(duì)應(yīng)的比特位均量化為第二值。
在其中一個(gè)實(shí)施例中,所述根據(jù)所述語(yǔ)音信號(hào)的傳輸速率和所述語(yǔ)音參數(shù),確定與所述語(yǔ)音參數(shù)對(duì)應(yīng)的量化方法對(duì)所述語(yǔ)音參數(shù)進(jìn)行量化,包括:
若所述語(yǔ)音信號(hào)的傳輸速率為2400bps,且所述語(yǔ)音參數(shù)為線譜對(duì)LSF參數(shù),則采用預(yù)設(shè)的三級(jí)矢量碼本對(duì)所述LSF參數(shù)進(jìn)行量化。
在其中一個(gè)實(shí)施例中,所述根據(jù)所述語(yǔ)音信號(hào)的傳輸速率和所述語(yǔ)音參數(shù),確定與所述語(yǔ)音參數(shù)對(duì)應(yīng)的量化方法對(duì)所述語(yǔ)音參數(shù)進(jìn)行量化,包括:
若所述語(yǔ)音信號(hào)的傳輸速率為1200bps,則根據(jù)傳輸所述語(yǔ)音信號(hào)的時(shí)間幀的清濁類型確定所述語(yǔ)音信號(hào)的超幀模式;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安蜂語(yǔ)信息科技有限公司,未經(jīng)西安蜂語(yǔ)信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811109230.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:語(yǔ)音轉(zhuǎn)換基于擴(kuò)展內(nèi)核類網(wǎng)格法處理零散數(shù)據(jù)建模方法及設(shè)備
- 下一篇:基于集成學(xué)習(xí)與噪聲感知訓(xùn)練的語(yǔ)音增強(qiáng)方法
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 語(yǔ)音音調(diào)轉(zhuǎn)換方法
- 混合參數(shù)模式的語(yǔ)音合成系統(tǒng)及方法
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種自適應(yīng)智能語(yǔ)音裝置及方法
- 一種語(yǔ)音引擎參數(shù)配置方法和裝置
- 語(yǔ)音自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 語(yǔ)音參數(shù)量化方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種AI語(yǔ)音速率調(diào)整方法、裝置及電子設(shè)備
- 一種語(yǔ)音處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在電信系統(tǒng)中處理語(yǔ)音編碼參數(shù)的方法及裝置
- 在分布式數(shù)據(jù)庫(kù)系統(tǒng)中管理查詢
- 設(shè)備間互動(dòng)虛擬角色系統(tǒng)
- 計(jì)算機(jī)虛擬角色拿取系統(tǒng)
- 用于向計(jì)算機(jī)設(shè)備供電的燃料電池
- 虛擬角色同步更新式傳輸系統(tǒng)
- 虛擬角色自行傳輸?shù)挠?jì)算機(jī)交互系統(tǒng)
- 虛擬角色傳輸系統(tǒng)
- 計(jì)算機(jī)設(shè)備的啟動(dòng)方法、裝置及計(jì)算機(jī)設(shè)備
- 一種基于區(qū)塊鏈技術(shù)的計(jì)算機(jī)設(shè)備防盜系統(tǒng)及方法
- 一種用于計(jì)算機(jī)設(shè)備管理的終端
- 用于接合與分離存儲(chǔ)介質(zhì)的裝置
- 存儲(chǔ)介質(zhì)陣列控制器、控制方法、設(shè)備、和存儲(chǔ)介質(zhì)驅(qū)動(dòng)器
- 存儲(chǔ)介質(zhì)處理方法、系統(tǒng)及數(shù)據(jù)讀寫操作方法、系統(tǒng)
- 存儲(chǔ)裝置、存儲(chǔ)介質(zhì)以及存儲(chǔ)介質(zhì)的制造方法
- 數(shù)據(jù)存儲(chǔ)
- 存儲(chǔ)介質(zhì)之間的數(shù)據(jù)遷移
- 一種基于存儲(chǔ)系統(tǒng)的控制方法及裝置
- 自助設(shè)備及自助設(shè)備的介質(zhì)存儲(chǔ)裝置
- 融合存儲(chǔ)系統(tǒng)中的數(shù)據(jù)遷移方法和裝置
- 一種數(shù)據(jù)存儲(chǔ)方法、裝置及電子設(shè)備





