[發明專利]一種基于GAN的音頻音質還原系統有效
| 申請號: | 201810532016.5 | 申請日: | 2018-05-29 |
| 公開(公告)號: | CN108877832B | 公開(公告)日: | 2022-12-23 |
| 發明(設計)人: | 張逸;韓芳;黃榮 | 申請(專利權)人: | 東華大學 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/27;G10L15/06 |
| 代理公司: | 上海泰能知識產權代理事務所(普通合伙) 31233 | 代理人: | 宋纓;錢文斌 |
| 地址: | 201620 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 gan 音頻 音質 還原 系統 | ||
本發明涉及一種基于GAN的音頻音質還原系統,包括模型共享區塊模塊、生成網絡模型模塊、判別網絡模型模塊和序列重組模塊;所述模型共享區塊模塊主要用于對于因防止損失信息沒有進行頻域處理的時域信號進行特征提取,將特征抽象為高層單元;所述生成網絡模型模塊利用高層抽象單元進行分析和重構;所述判別網絡模型模塊不斷與所述生成網絡模型進行對抗訓練,不斷改進生成效果;所述序列重組模塊分析網絡對最終生成輸出進行序列加權重組。本發明能夠生成更加逼真的音頻信號。
技術領域
本發明涉及音頻信號還原處理技術領域,特別是涉及一種基于GAN的音頻音質還原系統。
背景技術
為了方便網絡傳輸和本地存儲需對大量音頻文件進行壓縮處理,但獲取存儲空間下降的同時會犧牲相應的音質,為了有效利用網絡資源,音樂平臺往往提供不同的音樂品質,這在物理空間或計算資源上不是最有效的,使用音頻還原技術可以對壓縮比較高的音頻資源進行還原,從而避免分別存儲或者服務端和客戶端的解壓縮過程。有損壓縮不僅用于MP3播放器和個人電腦,還用于視頻播放設備、數字電視、網絡流媒體、衛星廣播等。因為有損壓縮拋棄了部分不重要的部分,壓縮率遠遠高于無損壓縮(原信號的5%到20%之間)。音頻有損壓縮是一個不可逆的過程,為了削減信息的冗余性,需要使用符號化、模式識別、線性預測等方法。
人類聽覺并非能夠識別所有的聲音信號數據,大多的有損壓縮通過識別人耳難以捕捉的信號從而減少知覺的冗余性。這種信號典型的有高頻率信號和伴隨高能量信號出現的小能量信號。把這些難以識別的信號刪除還不足以獲得可觀的比特削減效果,信號進行編碼的位數減少降低了信號比,通過基于心理聲學的有損壓縮,隱藏不易察覺的高頻細節的技術是重要的。例如通過減少分配給高頻分量的比特數來完成。這樣做并不是因為原始信息只包含一些高頻成分,而是人耳感知低頻的能力要強于高頻。從而高頻細節被很好地隱藏并且不被察覺。為了進一步壓縮信號,甚至可能降低采樣率和通道數。這些有損壓縮是一定程度上失真的,對聲音的泛音有較大的影響,使得聲音不夠飽滿,降低了人們的聽覺感受。音質還原能夠在提供較小的容量同時保持較好的音質,同時有利于服務商和用戶雙方。
現在為了向用戶提供不同的體驗,往往需要存儲多種不同音質的文件,這顯然是不明智的,使用音頻還原技術,可以只保存一份低音質源文件,通過算法,提升音質,既不用保存多份文件,單份文件的大小也相對較小。
發明內容
本發明所要解決的技術問題是提供一種基于GAN的音頻音質還原系統,能夠生成更加逼真的音頻信號。
本發明解決其技術問題所采用的技術方案是:提供一種基于GAN的音頻音質還原系統,包括模型共享區塊模塊、生成網絡模型模塊、判別網絡模型模塊和序列重組模塊;所述模型共享區塊模塊主要用于對于因防止損失信息沒有進行頻域處理的時域信號進行特征提取,將特征抽象為高層單元;所述生成網絡模型模塊利用高層抽象單元進行分析和重構;所述判別網絡模型模塊不斷與所述生成網絡模型進行對抗訓練,不斷改進生成效果;所述序列重組模塊分析網絡對最終生成輸出進行序列加權重組。
所述模型共享區塊模塊使用離散卷積核對離散音頻信號進行卷積計算從而提取特征,將信號抽象化,同時使用批標準化,在每次反向傳導時,通過送入數組的激活值做規范化操作使得輸出信號的均值擬似正態分布,利用線性整流函數的非線性特性擬合模型特性降低網絡整體的計算負擔,從而使得系統整體顯得更為魯棒。
所述生成網絡模型模塊使用空洞卷積進行跨步輸入降低輸入維度并同時增大感受野,讓每個卷積輸出都包括更大感受野的信息,融合批標準化對輸入數據進行標準化減少數據偏移和尺度縮放,使用殘差網絡分段學習使網絡注重學習網絡的殘差,在增加網絡深度的同時,防止網絡的退化問題,使網絡更容易優化且獲得更好的準確性,保持較低的復雜度,降低訓練誤差和測試誤差。
所述判別網絡模型模塊使用間隔步長降低網絡維度從而防止序列過長導致后續循環神經網絡難以訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810532016.5/2.html,轉載請聲明來源鉆瓜專利網。





