[發明專利]一種基于FPGA平臺的聲音識別系統及方法在審
| 申請號: | 202111663019.0 | 申請日: | 2021-12-30 |
| 公開(公告)號: | CN114333779A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 肖卓凌;王智;張新辰;付宇飛 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/08;G10L19/26;G10L25/24;G10L25/27 |
| 代理公司: | 北京正華智誠專利代理事務所(普通合伙) 11870 | 代理人: | 代維凡 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 fpga 平臺 聲音 識別 系統 方法 | ||
本發明公開了一種基于FPGA平臺的聲音識別系統及方法,系統包括相互連接的FPGA開發板和聲音輸入模塊;其中,FPGA開發板包括聲音輸入預處理模塊、聲音MFSC提取模塊、CNN識別模塊、DMA模塊、DDR3、DDR Ctrl、數據緩存布控模塊、乒乓RAM、MFSC RAM、CNN輸入RAM和CNN輸出RAM;聲音輸入模塊依次通過聲音輸入預處理模塊、乒乓RAM、聲音MFSC提取模塊和MFSC RAM與數據緩存布控模塊連接;數據緩存布控模塊還分別與DMA模塊、CNN輸入RAM和CNN輸出RAM連接,CNN識別模塊分別與DMA模塊、CNN輸入RAM和CNN輸出RAM連接,DMA模塊還分別與DDR Ctrl和DDR3連接。
技術領域
本發明屬于聲音識別技術領域,具體涉及一種基于FPGA平臺的聲音識別系統及方法。
背景技術
聲音信號在人們的生活中無處不在。作為最常見的信號之一,聲音信號是信息的源頭,可以讓人類建立對外部世界的認識。選擇現場可編程門陣列(Field ProgrammableGate Array,FPGA)作為算法實現的平臺,研究了聲音特征提取和識別算法的FPGA實現。
基于FPGA平臺實現的聲音識別系統能夠合并在智能物聯網預警系統中,可以單獨工作,用于實時檢測環境聲音,預防突發事件;也可以和視頻監測系統混合使用,在視頻監測系統運行條件不良時(如光照過暗等),輔助監測外部環境,協同達到更好的檢測效果。FPGA設備通常尺寸較小、所需要能耗較低,能夠較為便捷地部署在外界環境中,作為終端節點連接到整個物聯網預警系統,擴展預警系統可監測范圍和條件;有較強的可替換性,可以隨時增加和取消,方便預警系統監測范圍的改變;擁有較強的計算能力,可以接受指令、獨自處理聲音數據、上傳處理結果,能夠減輕中心節點的負擔。由于聲音識別過程較為復雜,需要預處理、特征提取和聲音識別等步驟,使用資源充足的FPGA平臺。
發明內容
針對現有技術中的上述不足,本發明提供的一種基于FPGA平臺的聲音識別系統及方法解決了檢測環境聲音過程復雜的問題。
為了達到上述發明目的,本發明采用的技術方案為:一種基于FPGA平臺的聲音識別系統,包括相互連接的FPGA開發板和聲音輸入模塊;
其中,所述FPGA開發板包括聲音輸入預處理模塊、聲音MFSC提取模塊、CNN識別模塊、DMA(直接存儲器訪問)模塊、DDR3、DDR Ctrl(DDR控制器)、數據緩存布控模塊、乒乓RAM、MFSC RAM、CNN輸入RAM和CNN輸出RAM;
所述聲音輸入模塊依次通過所述聲音輸入預處理模塊、乒乓RAM、聲音MFSC提取模塊和MFSC RAM與所述數據緩存布控模塊連接;所述數據緩存布控模塊還分別與所述DMA模塊、CNN輸入RAM和CNN輸出RAM連接,所述CNN識別模塊分別與所述DMA模塊、CNN輸入RAM和CNN輸出RAM連接,所述DMA模塊還分別與所述DDR Ctrl和DDR3連接;
所述聲音輸入模塊用于接收外部聲音,并轉換成數字聲音信號;所述聲音輸入預處理模塊用于將輸入的聲音數據進行處理,使其符合聲音MFSC提取模塊需要的格式;所述乒乓RAM用于存儲聲音輸入預處理模塊輸出的聲音數據;所述聲音MFSC提取模塊用于提取聲音數據中的MFSC數據;所述MFSC RAM用于存儲MFSC數據;所述數據緩存布控模塊用于暫存中間數據、MFSC數據和CNN的權重數據;所述CNN識別模塊用于讀取MFSC數據,完成聲音識別;所述CNN輸入RAM用于存儲CNN的權重數據和MFSC數據;所述CNN輸出RAM用于存儲CNN識別模塊生成的中間數據;所述DMA模塊用于控制DDR Ctrl搬運數據;所述DDR Ctrl用于搬運中間數據、MFSC數據和CNN的權重數據;所述DDR3用于存儲中間數據、MFSC數據和CNN的權重數據。
進一步地:所述CNN輸入RAM包括第一輸入RAM、第二輸入RAM、第三輸入RAM、第四輸入RAM、第一權重RAM、第二權重RAM、第三權重RAM和第四權重RAM;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111663019.0/2.html,轉載請聲明來源鉆瓜專利網。





