[發明專利]方言類型的確定方法、裝置、設備及存儲介質在審
| 申請號: | 202011077556.2 | 申請日: | 2020-10-10 |
| 公開(公告)號: | CN112233651A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 黃小玲;宋元峰;姜迪;徐倩 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/02;G10L15/16;G10L15/26;G10L25/24 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 張娜;劉芳 |
| 地址: | 518027 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 方言 類型 確定 方法 裝置 設備 存儲 介質 | ||
1.一種方言類型的確定方法,其特征在于,包括:
獲取語音信號;
提取所述語音信號的語音特征,其中,所述語音特征包括梅爾頻率倒譜系數特征和移位差分倒譜特征;
基于預設方言分類神經網絡,根據所述語音特征確定所述語音信號的方言類型。
2.根據權利要求1所述的方法,其特征在于,提取所述語音信號的語音特征,包括:
提取所述語音信號的梅爾頻率倒譜系數特征;
根據所述梅爾頻率倒譜系數特征,提取所述語音信號的移位差分倒譜特征;
將所述梅爾頻率倒譜系數特征和移位差分倒譜特征進行組合,生成所述語音信號的二維語音特征;
相應的,基于預設方言分類神經網絡,根據所述語音特征確定所述語音信號的方言類型,包括:
基于預設方言分類神經網絡,根據所述二維語音特征確定所述語音信號的方言類型。
3.根據權利要求1所述的方法,其特征在于,所述預設方言分類神經網絡包括深度殘差網絡和基于自注意力機制的Transformer模型;
相應的,基于預設方言分類神經網絡,根據所述語音特征確定所述語音信號的方言類型,包括:
基于所述深度殘差網絡,對所述語音特征進行卷積、池化和歸一化操作,以提取所述語音特征的高層級特征;
基于所述Transformer模型的自注意力機制對所述高層級特征進行時域相關,以生成模型特征;
基于所述Transformer模型的輸出層,根據所述模型特征確定所述語音信號的方言類型。
4.根據權利要求1-3任一項所述的方法,其特征在于,基于預設方言分類神經網絡,根據所述語音特征確定所述語音信號的方言類型,包括:
基于預設方言分類神經網絡,根據所述語音特征確定所述語音信號的各個預設類型的類型概率;
根據各個所述類型概率確定所述語音信號的方言類型。
5.根據權利要求4所述的方法,其特征在于,在根據各個所述類型概率確定所述語音信號的方言類型之后,還包括:
根據所述語音信號的方言類型,確定所述語音信號的語音識別算法;
基于所述語音識別算法確定所述語音信號的語音文本;
將所述語音文本輸入各個預設類型對應的預設語言模型,以得到所述語音文本的各個預設類型對應的文本分數;
根據各個預設類型對應的類型概率和文本分數,判斷所述方言類型是否準確;
若準確,則根據所述方言類型對所述語音信號進行語音識別。
6.根據權利要求5所述的方法,其特征在于,所述預設語言模型為N元語法模型,將所述語音文本輸入各個預設類型對應的預設語言模型,以得到所述語音文本的各個預設類型對應的文本分數,包括:
將所述語音文本輸入各個預設類型對應的N元語法模型,以得到所述語音文本的各個預設類型對應的文本困惑度;
針對每個預設類型,根據所述預設類型的文本困惑度確定所述語音文本的文本分數。
7.根據權利要求5所述的方法,其特征在于,根據各個預設類型對應的類型概率和文本分數,判斷所述方言類型是否準確,包括:
基于邏輯回歸模型,根據各個預設類型對應的類型概率和文本分數,判斷所述方言類型是否準確。
8.一種方言類型的確定裝置,其特征在于,包括:
語音信號獲取模塊,用于獲取語音信號;
特征提取模塊,用于提取所述語音信號的語音特征,其中,所述語音特征包括梅爾頻率倒譜系數特征和移位差分倒譜特征;
方言類型確定模塊,用于基于預設訓練好的預設方言分類神經網絡,根據所述語音特征確定所述語音信號的方言類型。
9.一種方言類型的確定設備,其特征在于,所述方言類型的確定設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的方言類型的確定程序,所述方言類型的確定程序被所述處理器執行時實現如權利要求1至7中任一項所述的方言類型的確定方法的步驟。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有方言類型的確定程序,所述方言類型的確定程序被處理器執行時實現如權利要求1至7中任一項所述的方言類型的確定方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011077556.2/1.html,轉載請聲明來源鉆瓜專利網。





