[發明專利]實現從文本到語音TTS的音頻轉碼方法、裝置及系統有效
| 申請號: | 201110169703.3 | 申請日: | 2011-06-22 |
| 公開(公告)號: | CN102231734B | 公開(公告)日: | 2017-10-03 |
| 發明(設計)人: | 張閩;張偉;劉澍 | 申請(專利權)人: | 南京中興新軟件有限責任公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 余剛,梁麗超 |
| 地址: | 210012 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實現 文本 語音 tts 音頻 方法 裝置 系統 | ||
技術領域
本發明涉及通信領域,具體而言,尤其涉及一種實現從文本到語音TTS的音頻轉碼方法、裝置及系統。
背景技術
媒體服務器用于所有與音視頻相關的媒體處理,包括視頻和音頻RTP數據流到視音頻文件的相互轉換。同時,也負責接收用戶通過終端的DTMF輸入、播放業務的引導語音、顯示動態的引導畫面。它具有的SIP協議和MSML/MOML能力使得其能在應用服務器APP的控制下完成整個會話過程的與用戶的交互。
媒體控制單元(MSCU)是媒體服務器中的一個重要單元,主要完成與其他實體進行能力協商,提供資源本身的管理、維護以及控制其它業務資源單元完成復雜業務的功能。
媒體存儲傳輸音頻單元(MSTU-audio)是媒體服務器中的業務資源單元,完成海量的音頻數據存儲,包括實現音頻文件播放功能。媒體存儲單元上有對外網口,可以直接通過單元上的對外網口收發。
媒體存儲傳輸視頻單元(MSTU-video)是媒體服務器中的業務資源單元,完成海量的多媒體音視頻數據存儲,包括實現視頻文件播放功能。媒體存儲單元上有對外網口,可以直接通過單元上的對外網口收發。
現在,媒體服務器播的使用很廣。主要可以歸納為音視頻播放,收號和會議等功能。
從文本到語音(Text To Speech,簡稱為TTS)的功能是將輸入的文本信息識別出來,轉化為語音信息,將語音媒體發送給用戶。目前在電信領域,TTS的應用基本是配置一個專門的TTS服務器,通過信令指定TTS將語音發送到用戶端來完成一次業務。
圖1是根據相關技術的實現TTS音頻轉碼的系統結構示意圖。如圖1所示,該系統的工作流程包括如下步驟:
步驟101:終端發起一次呼叫,激活APP的業務。APP向媒體服務器發起業務流程;
步驟102:APP通過SIP信令向媒體服務器請求TTS業務;
步驟103:媒體服務器通過SIP信令向TTS服務器請求TTS資源,并通過MRCP協議控制TTS服務器完成業務功能;
步驟104:TTS服務器向終端發送媒體
以上便是目前典型的組網和業務流程。TTS服務器作為媒體服務器的外置設備使用。APP在請求業務的時候只是向媒體服務器發起,媒體服務器判斷業務類型,當業務類型為TTS應用時,媒體服務器再向TTS服務器發起請求,申請資源,并控制TTS服務器的行為,TTS服務器在收到信令后自動將媒體發送給遠方的終端。
以上流程能完成一個基本的TTS業務。不過隨著業務的應用的擴展出現了一些問題。比如,TTS服務器的音頻能力集同媒體服務器能力集不匹配的問題,造成業務失敗。因為APP在同媒體服務器協議SDP的時候,媒體服務器并不知道業務類型是否是TTS,所以會按照自己的能力范圍同終端協商音頻參數。當APP向媒體服務器下發INFO指令時,媒體服務器才能識別出TTS業務類型,此時媒體服務器通過終端SDP信息向TTS服務器申請資源。如果TTS服務器的音頻能力范圍不滿足媒體服務器同終端協商出的結果,就是造成業務失敗。比如:媒體服務器同終端協商出編解碼類型為G726格式,但是TTS服務器只支持G711的音頻格式。。
針對上述現有技術中在TTS服務器的音頻能力集無法滿足媒體服務器的業務需求的情況下,終端訪問媒體業務數據包數據失敗的問題,目前還沒有有效的解決方案。
發明內容
本發明的主要目的在于提供一種實現從文本到語音TTS的音頻轉碼方法、裝置及系統,以解決現有技術中在TTS服務器的音頻能力集無法滿足媒體服務器的業務需求的情況下,終端訪問媒體業務數據包數據失敗的問題。
為了實現上述目的,根據本發明的一方面,提供了一種實現從文本到語音TTS的音頻轉碼方法。
根據本發明的實現TTS音頻轉碼的方法包括:媒體服務器接收來自應用服務器APP的訪問請求,并確定媒體服務器支持的編解碼類型集;媒體服務器接收APP申請的TTS業務請求,并根據TTS業務類型向TTS服務器申請滿足該業務類型的媒體業務數據包;媒體服務器根據編解碼類型集與TTS服務器進行協商,以獲取協商后的音頻編解碼類型,并按照音頻編解碼類型將媒體業務數據包轉碼后發送至終端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京中興新軟件有限責任公司,未經南京中興新軟件有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110169703.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示系統和顯示方法
- 下一篇:基于信息網絡的數值評估方法及系統





