[發明專利]一種二值權重卷積神經網絡模塊及其用于聲紋識別的方法有效
申請號: | 202110060392.0 | 申請日: | 2021-01-18 |
公開(公告)號: | CN112863520B | 公開(公告)日: | 2023-10-24 |
發明(設計)人: | 劉波;吳海舸;張軒;蔡浩;葛偉;楊軍 | 申請(專利權)人: | 東南大學 |
主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L17/18 |
代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 徐激波 |
地址: | 211189 江*** | 國省代碼: | 江蘇;32 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 權重 卷積 神經網絡 模塊 及其 用于 聲紋 識別 方法 | ||
本發明公開了一種二值權重卷積神經網絡模塊及其用于聲紋識別的方法。屬于人工智能神經網絡技術領域。其功能為對采集到的語音特征進行二值化的卷積計算與全連接計算,采用符號判斷方式判斷輸入語音中是否含有目標說話人,并輸出判斷結果。其核心結構包括地址生成單元、狀態機控制單元和復用計算單元。本發明采用二值化的卷積神經網絡,極大減少了計算過程中的乘法操作,通過狀態機控制單元控制整個網絡的操作,通過判斷全連接神經元的符號進行說話人判斷,簡單有效。模塊化程度高,結構簡單,可行性好,實現了較好的聲紋識別效果同時有效降低了整體計算的功耗和延時。
技術領域
本發明涉及人工智能神經網絡技術領域,尤其是一種二值權重卷積神經網絡模塊及其用于聲紋識別的方法。
背景技術
聲紋識別技術屬于語音識別技術的一個分支,實現對說話人的身份的確認的功能。傳統上來說,聲紋識別技術會采用高斯混合模型來實現,但采用該模型雖然可以保證較為優秀的準確率,但會面臨硬件開銷大,資源利用率低,無法復用等問題。目前在整個行業對軟件模型和硬件結構的優化的追求下,行業內涌現出了很多采用通用卷積神經網絡來實現聲紋識別的方案,但采用該方案對硬件資源的利用率仍不夠高,且相對功耗較高。本發明采用了具有高能源效率和低硬件開銷的二值權重卷積神經網絡來實現聲紋識別方案,用很少的精確度降低換取了硬件面積和能源效率上的大幅度提升,并且網絡結構可復用。
發明內容
本發明要解決的技術問題是采用傳統方法的實現聲紋識別網絡系統規模大,功耗大,結構冗余嚴重,本發明提供一種二值權重卷積神經網絡模塊及其用于聲紋識別的方法,應用于說話人聲紋識別以及卷積神經網絡二值化。本發明在可重構二值權重神經網絡結構下實現了說話人聲紋識別,以實現網絡模塊在接收到說話人語音聲紋特征數據后進行分析處理并輸出識別結果的功能。本發明在硬件實現時采用了高度復用的設計,在保證了相當的計算精度的同時,對計算的復雜度進行了簡化,相對于傳統結構對芯片的硬件開銷和計算的功耗與延時都進行了較大的優化,并給網絡復用與重構做好了準備。
一種二值權重卷積神經網絡模塊,用于對接受到的說話人語音聲紋特征數據依次進行二值化的卷積計算、全連接計算和符號比較計算,判斷輸入的語音聲紋特征數據是否與目標說話人的語音特征相匹配,并輸出判斷結果。
本發明為實現上述發明目的采用如下技術方案:一種二值權重卷積神經網絡模塊,包括地址生成單元、狀態機控制單元和復用計算單元;狀態機控制單元與地址生成單元以及復用計算單元連接;所述狀態機控制單元用于控制地址生成單元和復用計算單元,完成神經網絡權重參數與語音聲紋特征數據讀寫與計算;地址生成單元用于產生神經網絡權重參數的讀取地址、語音聲紋特征數據的讀寫地址;復用計算單元對輸入的語音聲紋特征數據依次進行二值化的卷積計算、全連接計算和符號比較計算;判斷輸入的語音聲紋特征數據是否與目標說話人的語音特征相匹配,并輸出判斷結果。
所述地址生成單元包括數據讀地址模塊、計算結果寫地址模塊、語音數據寫地址模塊、語音數據讀地址模塊、權重參數寫地址模塊和讀寫地址選擇模塊。
所述數據讀地址模塊用于生成讀取接收到的說話人聲紋特征數據時的基址,所述計算結果寫地址模塊用于生成神經網絡計算完畢后寫入結果的目標地址,所述語音數據寫地址模塊用于生成訓練時存儲目標語音數據時的目標地址,所述語音數據讀地址模塊用于生成神經網絡加載語音聲紋特征數據時的對應地址,所述權重參數寫地址模塊用于按預設邏輯生成存儲訓練時得到的網絡權重參數的目標地址。所述讀寫地址選擇模塊受狀態機控制單元直接控制,數據讀地址模塊、計算結果寫地址模塊、語音數據寫地址模塊、語音數據讀地址模塊和權重參數讀地址模塊的輸出,就是讀寫地址選擇模塊的輸入數據,根據當前所處的工作狀態與計算狀態,狀態機控制單元發出控制信號到讀寫地址選擇模塊,控制讀寫地址選擇模塊數據的輸出,讀寫地址選擇模塊根據狀態機控制單元的控制信號選擇性的輸出其中一個地址。
優選的,所述復用計算單元包括特征緩沖器模塊、二維卷積計算模塊、歸一化單元、全連接緩沖器、智能計算模塊組和閾值比較模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110060392.0/2.html,轉載請聲明來源鉆瓜專利網。