[發(fā)明專利]一種音頻會議的音質(zhì)測試方法有效
| 申請?zhí)枺?/td> | 201611004655.1 | 申請日: | 2016-11-15 |
| 公開(公告)號: | CN106782610B | 公開(公告)日: | 2019-09-20 |
| 發(fā)明(設(shè)計)人: | 洪劍平;陳錦輝 | 申請(專利權(quán))人: | 福建星網(wǎng)智慧科技股份有限公司 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60 |
| 代理公司: | 福州市鼓樓區(qū)京華專利事務(wù)所(普通合伙) 35212 | 代理人: | 宋連梅 |
| 地址: | 350000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 會議 音質(zhì) 測試 方法 | ||
本發(fā)明提供一種音頻會議的音質(zhì)測試方法,所述方法為:獲取參加音頻會議的各個成員對應(yīng)的源音頻;每個成員通過音頻系統(tǒng)基于源音頻構(gòu)造出與目標音頻相近的合成音頻,即每個成員扣除自身的源音頻后,將其他成員的源音頻進行混合后形成合成音頻,該合成音頻為每個成員自身對應(yīng)的合成音頻;每個成員將自身對應(yīng)的合成音頻與音頻會議服務(wù)器發(fā)送的目標音頻數(shù)據(jù)使用ITU?T P.862建議書進行PESQ計算獲得當(dāng)前的實時音質(zhì),并將音質(zhì)的數(shù)值記錄下來,來完成音質(zhì)的測試。該方法測試簡單,且測試比較精確。
技術(shù)領(lǐng)域
本發(fā)明涉及通信設(shè)備技術(shù)領(lǐng)域,尤其涉及一種音頻會議的音質(zhì)測試方法。
背景技術(shù)
在現(xiàn)有的音質(zhì)測試模型中,最為常用的是PESQ(Perceptual evaluation ofspeech quality)即:主觀語音質(zhì)量評估的測試方法。該方法是ITU-T P.862建議書提供的客觀MOS(Mean Opinion Score,平均主觀意見分)值評價方法。使用PESQ的測試方法,必須有源音頻以及目標音頻。通過計算源音頻與目標音頻的PESQ,來判斷出音質(zhì)的前后差異,進而得出MOS值。MOS值就是當(dāng)前對應(yīng)音質(zhì)的量化結(jié)果。
在音頻會議中,每個成員加入同一個會議中,只能聽到非自己的音頻,也就是對于音頻會議來說,每個成員聽到的都是其余成員的混音結(jié)果。這也就造就每個成員聽到的音頻是特殊的。每個人都不一樣。
因為會議會將每個與會者的音頻進行合成,并且每個與會者聽到的都是其余與會者的混音結(jié)果,也就是每個人聽到的音頻都不盡相同。因此測試音頻會議的音質(zhì)可以很容易的獲取到每個與會者的源音頻,但是目標音頻已經(jīng)是被混合過的數(shù)據(jù),一般情況下與源音頻已經(jīng)有很大的差異,因此不容易基于ITU-T P.862建議書進行PESQ的音質(zhì)評估,如果基于ITU-T P.862建議書進行音頻評估,音質(zhì)肯定是相對較差的。
針對以上的情況,可以很容易獲取到每個與會者的源音頻,但是比較難獲取到目標音頻,或者可以這么認為,容易獲取到目標音頻,但是源音頻并不能與目標音頻相對應(yīng),因此就需要構(gòu)造能夠符合目標音頻的源音頻。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題,在于提供一種音頻會議的音質(zhì)測試方法,該方法測試簡單,且測試比較精確。
本發(fā)明是這樣實現(xiàn)的:一種音頻會議的音質(zhì)測試方法,所述方法為:
獲取參加音頻會議的各個成員對應(yīng)的源音頻;
每個成員通過音頻系統(tǒng)基于源音頻構(gòu)造出與目標音頻相近的合成音頻,即每個成員扣除自身的源音頻后,將其他成員的源音頻進行混合后形成合成音頻,該合成音頻為每個成員自身對應(yīng)的合成音頻;
每個成員將自身對應(yīng)的合成音頻與音頻會議服務(wù)器發(fā)送的目標音頻數(shù)據(jù)使用ITU-T P.862建議書進行PESQ計算獲得當(dāng)前的實時音質(zhì),并將音質(zhì)的數(shù)值記錄下來,來完成音質(zhì)的測試。
進一步的,所述方法具體為:會議開始后,獲取參加音頻會議的各個成員對應(yīng)的源音頻;音頻會議服務(wù)器需要給每個成員本地合成做一個時間同步,告知本地合成需要從哪個時間點開始合成;告知后,本地合成開始根據(jù)每個成員的源音頻進行本地合成,此時服務(wù)器開始進行從本地源音頻發(fā)送過來的報文解析,并進行合成操作;當(dāng)合成到某個時間點,不需要給進行合成操作的成員做通知做其它操作;但必須給其它成員的本地合成做通知,其它成員本地合成在接收到進行合成操作的成員被靜音的操作后,必須及時的做出響應(yīng),將進行合成操作成員的源數(shù)據(jù)替換成靜音音頻。
進一步的,由于音頻會議服務(wù)器到本地還會有網(wǎng)絡(luò)延時,因此通知數(shù)據(jù)中,也要告知進行合成操作的成員在哪個時段被靜音,然后本地合成模型將進行合成操作的成員開始靜音時段的數(shù)據(jù)進行同步操作處理。
進一步的,音頻會議服務(wù)器將合成的RTP報文發(fā)回來后,本地接收音頻會議服務(wù)器發(fā)回的RTP報文數(shù)據(jù),該RTP報文數(shù)據(jù)即為音頻會議服務(wù)器發(fā)送的目標音頻數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建星網(wǎng)智慧科技股份有限公司,未經(jīng)福建星網(wǎng)智慧科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611004655.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





