[發明專利]一種基于綜合語音編碼的自適應水下通信方法有效
| 申請號: | 201310699050.9 | 申請日: | 2013-12-19 |
| 公開(公告)號: | CN103714823A | 公開(公告)日: | 2014-04-09 |
| 發明(設計)人: | 李立志;趙曉群;吳海燕;高迪;龐翔鵬;徐靜云 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G10L19/16 | 分類號: | G10L19/16;H04L25/02;H04B13/02;H04B11/00 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 張磊 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 綜合 語音 編碼 自適應 水下 通信 方法 | ||
技術領域
本發明屬于一種語音通信系統。特別涉及一種基于綜合語音編碼的自適應水下通信方法。
背景技術
所有的水聲通信方式一般分為模擬和數字兩種,其中模擬通信方式多以單邊帶調幅調制方式為主,當信道屬于嚴格帶限時,通常采用模擬通信方式就可以達到語音通信的帶寬要求,但是模擬通信方式的質量較差,語音清晰度時好時壞,不能適應于復雜而多變的惡劣信道。通常海洋信道具有高噪聲背景、低載波頻率、極為有限的帶寬以及時間-空間-頻率變化的特性,這些特性使得水聲信道成為迄今最為惡劣的通信信道之一。國內外眾多研究機構在水聲通信的信道穩定性、調制方法上做了很多研究,但傳統方法的水聲通信很難突破穩定信道帶寬和實時可靠通信的技術難題。為此,從信源角度考慮,對信源進行編碼,大幅度地壓縮語音信號的數據量,實現與水聲信道所提供的速率相匹配的穩定可靠的語音通信系統。
在實際的水聲通信中,部分海域只能以0.8?kbps以下的速率進行通信,由于2.4?kbps速率以下的語音編碼速度過低,激勵信息相對不足,使其語音質量與環境噪聲的相關性大,不容易構建具有適用性較大的編碼算法,目前語音編碼低于2.4?kbps速率的語音編碼方案目前尚無國際標準。
低速率語音編碼器采用了比傳統編碼器更為復雜的方法對語音的激勵源進行劃分和重構,最早提出的是線性預測編碼模型,在此基礎上不斷有新的編碼算法提出。目前國內外主要有使用碼本作為激勵源的碼激勵線性預測編碼技術、多帶激勵模型、混合激勵線性預測語音編碼技術和原形波形內插方法這四種主要的低速率編碼算法,研究者們在此基礎上展開了積極的探索和研究,但是低速率編解碼后的語音信號,其語音的自然度和容忍環境噪聲的魯棒能力有很大的缺陷,無法較好地滿足水聲信道的通信要求。在眾多的語音信源壓縮編碼技術中,語音識別無疑是壓縮比最高的算法。
目前世界上關于水下語音通信技術研究的還不多,一般都是按照傳統的無線網絡通信的方式進行壓縮編碼、調制、傳輸以及解調解碼的。目前查閱到有關于語音識別技術運用于水下通信系統的專利和文獻2篇:中國專利申請號(200810064290.0)一種低碼率的水下語音通信方法中應用了語音識別技術和語音的拼音合成技術,先通過語音識別系統將發送端的語音信號轉換成漢語拼音或者漢語拼音對應的ASCII碼,然后進行信道編碼后發送出去,接收端進行解調和解碼,再根據解調出來的拼音代碼或者漢字發音代碼,調用語音庫相對應的拼音或者漢字發音信息。利用語音合成算法將發音合成為語音信號輸出;文獻“語音識別于合成技術在水聲通信中的運用”,2003年通信理論與信號處理年會論文集,2008年3月,P?434?~?439,程恩等,其思路是將語音信號轉換成文本信號,利用現成的Via?Voice識別軟件和語音合成軟件,實現水下語音通信,選用的Via?Voice軟件只能運用于通用計算機,發送的是文字代碼,而語音合成方法未有說明,不適合將其運用于水下微小型載體和水下工作者之間的語音通話。
發明內容
本發明的目的在于提供一種基于綜合語音編碼的自適應水下通信方法。
在信道惡劣的水下環境中進行語音通信時,采用語音識別與合成技術,在發射端將語音信號轉化為極低速率的語音文本數據通過水聲信道進行傳輸,接收端將接收到的語音文本數據合成為語音,由于識別后的語音文本數據的數據率極低,可以利用低碼率糾錯編碼技術來改善信道特性,達到穩定可靠的傳輸,這是實現水聲語音低速率數字通信的一種新思路。由于水聲環境下水下工作者通信設備硬件的限制,業界性能良好的語音識別系統都是采用隱馬爾科夫模型(HMM)的連續語音識別建模技術框架,而在水下通信環境下,由于受到環境噪聲,運算復雜度等方面的限制,直接使用傳統的算法和模型遠遠滿足不了實用的需求。
根據水聲通信和海洋信道的特性,本發明利用語音識別/語音編碼技術,將語音轉化為帶寬要求極低的語音識別數據和較低速率的語音編碼數據,并根據信道特性自適應地選擇語音識別數據/語音編碼數據進行雙路混合編碼或語音識別數據單獨編碼兩種方式進行傳輸,靈活實現適應于不同通信距離、不同通信方式、不同通信需求條件下的語音通信,數據通信的系統體系結構和方式。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310699050.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:改進型直飲龍頭
- 下一篇:一種氨基葡萄糖單體的制備方法





