[發明專利]基于遺傳算法優化模型參數的音頻帶寬擴展方法及系統有效
| 申請號: | 201710911340.3 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN109599123B | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 白海釧;計哲;高圣翔;顏永紅;劉建;周若華 | 申請(專利權)人: | 中國科學院聲學研究所;國家計算機網絡與信息安全管理中心 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L19/02;G10L19/04;G10L21/038 |
| 代理公司: | 北京方安思達知識產權代理有限公司 11472 | 代理人: | 陳琳琳;楊青 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遺傳 算法 優化 模型 參數 音頻 帶寬 擴展 方法 系統 | ||
本發明公開一種基于遺傳算法優化模型參數的音頻帶寬擴展方法,所述方法包括:步驟1)對輸入音頻信號x(n)進行預處理,獲得濾波信號;步驟2)對濾波信號進行調制重疊變換得到低頻調制重疊變換系數;步驟3)將低頻調制重疊變換系數劃分子帶,計算每個子帶的均方根能量,得到低頻頻譜包絡序列;步驟4)根據低頻頻譜包絡序列,采用灰色模型GM(1,1)對音頻信號的高頻子帶能量進行估計,得到高頻頻譜包絡;步驟5)采用頻譜復制、頻譜折疊、非線性計算、綜合多帶激勵或非線性預測方法對音頻頻譜細節進行擴展,得到高頻頻譜細節;步驟6)根據上述所得高頻頻譜包絡和高頻頻譜細節恢復音頻信號x(n)的高頻頻譜信息;步驟7)利用調制重疊反變換實現x(n)的帶寬擴展。
技術領域
本發明涉及一種音頻帶寬擴展技術領域,更具體地說,本發明涉及一種基于遺傳算法優化模型參數的音頻帶寬擴展方法及系統。
背景技術
根據人們對音頻質量的實際需求,數字音頻技術所重現信號的帶寬會受到一定的限制。為此,音頻信號可以分為窄帶、寬帶、超寬帶和全帶四種。其中全帶信號的有效帶寬覆蓋了人耳能感知全部頻率范圍(20Hz~20kHz),這類音頻主要用于音樂信號的高保真重現,所需要的網絡傳輸速率和終端計算能力相對較高。傳統電話語音通常采用窄帶信號,其頻率分布在300Hz~3.4kHz內,采樣率為8kHz,可以滿足人們基本通話需求,但存在語音主觀感知質量不高等缺陷。電話語音通信領域中,采樣率16kHz、有效帶寬為50Hz~7kHz寬帶音頻的引入可以獲得更好的可懂度。此外,與寬帶音頻信號相比,32kHz采樣的超寬帶音頻頻帶范圍進一步擴大到50Hz~14kHz,其重現聲音具有更好的自然度和表現力。
鑒于較高帶寬的音頻信號具有良好的聽覺質量,寬帶、超寬帶音頻處理技術日益成為電視電話會議、網絡流媒體等通信傳輸市場的熱點。然而,信號帶寬的提高必然導致處理數據量的增加,而數據量增加所導致網絡服務器在傳輸、運算、存儲能力方面的設備改動將會十分繁瑣,對基站設備的大規模升級也將會耗資巨大。與此同時,超寬帶音頻傳輸需要終端設備至少包含更加先進的前端聲電器件和數模轉換器,同時還要具備新的超寬帶音頻編碼器以及向下兼容寬窄帶通信的處理能力。而要求大多數用戶為終端設備的更新進行投資也是不切實際的。并且在復雜的音頻通信傳輸系統中,由于受到碼率限制、設備缺陷等方面影響,輸入信號帶寬不夠穩定,存在可變帶寬的現象。因此,受到歷史、經濟、技術等諸多問題的限制,在不同帶寬設備長期共存的過渡時期中,如何最小代價地改善現有寬帶通信設備的兼容性使其能夠較為穩定地達到寬帶甚至超寬帶處理能力就成為現代通信系統亟待解決的問題。
作為一種有效的音頻增強方法,音頻帶寬擴展日臻成為過渡時期寬帶、超寬帶音頻處理領域研究的最新熱點。它在不影響網絡傳輸和寬帶信號信源編碼的前提下,通過分析原始全帶音頻的信號特點,在接收端對重建的窄帶或者寬帶音頻人為增加一定的頻率信息,恢復其截去的高頻帶成分,從而達到增強聽覺質量、重現寬帶或者超寬帶音頻的目的。在目前網絡傳輸條件下,該技術的引入對于緩解通信設備兼容性不足和用戶高質量音頻需求間的矛盾具有十分重要的現實意義,因此近幾年來國內外學者針對帶寬擴展技術進行了廣泛而深入的研究。然而,目前傳統的音頻帶寬擴展方法一般采用傳統的統計模型對頻譜包絡部分進行擴展,并非從音頻信號高低頻頻譜包絡本身的變化趨勢進行研究,導致擴展的高頻部分比較均勻、自然度較差,且不同音頻擴展部分之間區分度較低。
發明內容
本發明的目的在于,針對傳統統計模型在音頻帶寬擴展上存在的缺陷,提出了一種采用灰色模型(Grey Model,GM)對音頻高頻頻譜包絡成分進行估計的方法,結合常規高頻頻譜細節預測技術,實現了一種新的音頻帶寬擴展技術。本發明創造性地將灰色模型引入信號處理領域,同時對該模型中的背景值序列進行了優化,從而設計實現了一種基于遺傳算法來優化灰色模型參數的音頻帶寬擴展方法和系統,有效地實現了音頻高頻頻譜成分的恢復和重建。
為了實現上述目的,本發明提供了一種基于遺傳算法優化模型參數的音頻帶寬擴展方法,所述方法包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院聲學研究所;國家計算機網絡與信息安全管理中心,未經中國科學院聲學研究所;國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710911340.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:沉浸式音頻性能評價系統及方法
- 下一篇:一種音頻數據處理方法、裝置及存儲介質





