[發(fā)明專利]一種數(shù)字串語音識別方法、身份驗證裝置及計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010224785.6 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN111429913B | 公開(公告)日: | 2023-03-31 |
| 發(fā)明(設(shè)計)人: | 曾志先;肖龍源;李稀敏;葉志堅;劉曉葳 | 申請(專利權(quán))人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06;G10L17/00 |
| 代理公司: | 廈門仕誠聯(lián)合知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35227 | 代理人: | 吳圳添 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 種數(shù) 字串 語音 識別 方法 身份驗證 裝置 計算機 可讀 存儲 介質(zhì) | ||
1.一種數(shù)字串語音識別方法,其特征在于,所述方法包含步驟:
獲取待識別語音;
將所述語音輸入至數(shù)字串語音識別模型進行識別,以得到所述待識別語音對應(yīng)的數(shù)字串文本,其中,構(gòu)建所述數(shù)字串語音識別模型的算法包含卷積神經(jīng)網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)及全連接網(wǎng)絡(luò),所述待識別語音進入所述數(shù)字串語音識別模型后,先后經(jīng)由卷積神經(jīng)網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)及全連接網(wǎng)絡(luò)的計算,得到所述數(shù)字串文本;
所述長短期記憶網(wǎng)絡(luò)的上層封裝神經(jīng)網(wǎng)絡(luò)注意機制,以對所述長短期記憶網(wǎng)絡(luò)的輸出結(jié)果進行過濾;
所述數(shù)字串語音識別模型的訓練方法包含:
收集內(nèi)容為數(shù)字串的音頻數(shù)據(jù),并對所述音頻數(shù)據(jù)進行標注;
對所述標注后的音頻數(shù)據(jù)進行頻譜轉(zhuǎn)換,得到對應(yīng)的頻譜特征數(shù)據(jù);
基于所述音頻數(shù)據(jù)的頻譜特征數(shù)據(jù)及標注對所述數(shù)字串語音識別模型的損失值進行計算;
并在得到損失值后,對所述數(shù)字串語音識別模型進行迭代訓練,從而實現(xiàn)模型優(yōu)化;
構(gòu)建所述數(shù)字串語音識別模型中的所述卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包含一層卷積網(wǎng)絡(luò)和一層maxpooling,其中,卷積網(wǎng)絡(luò)采用5×5的卷積核,maxpooling層采用5×5的Filter結(jié)構(gòu);
所述卷積神經(jīng)網(wǎng)絡(luò)的輸入層為所述待識別語音的頻譜圖特征數(shù)據(jù),輸出層的數(shù)據(jù)結(jié)構(gòu)為幀數(shù)乘以1024維的矩陣。
2.如權(quán)利要求1所述的方法,其特征在于,所述長短期記憶網(wǎng)絡(luò)的結(jié)構(gòu)為3層,每層網(wǎng)絡(luò)包含300個神經(jīng)元。
3.如權(quán)利要求2所述的方法,其特征在于,所述長短期記憶網(wǎng)絡(luò)的輸入層為所述卷積神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果,輸出層為幀數(shù)乘以300維的矩陣。
4.如權(quán)利要求1所述的方法,其特征在于,所述全連接網(wǎng)絡(luò)對所述長短期記憶網(wǎng)絡(luò)的每幀300維的輸出結(jié)果轉(zhuǎn)換為10個分類,10個分類分別對應(yīng)數(shù)字0到9。
5.一種身份驗證裝置,其特征在于,所述裝置包含輸入單元、驗證單元和輸出單元,其中,
所述輸出單元向用戶展示語音輸入要求,所述語音輸入要求中包含預(yù)設(shè)數(shù)字串或提示信息;
所述輸入單元用于接收用戶輸入的語音信號,并傳輸至驗證單元;
所述驗證單元對接收到的語音信號進行驗證,包含基于權(quán)利要求1至4中任一所述的數(shù)字串語音識別方法,對所述語音信號進行識別,并基于識別出的數(shù)字串文本對所述用戶身份進行驗證,并發(fā)送驗證結(jié)果至所述輸出單元;
所述輸出單元接收所述驗證結(jié)果,并對其進行顯示。
6.一種計算機可讀存儲介質(zhì),存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至4中任一項所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門快商通科技股份有限公司,未經(jīng)廈門快商通科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010224785.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)產(chǎn)生裝置和方法、以及數(shù)據(jù)處理裝置和方法
- 一種數(shù)據(jù)存儲方法和設(shè)備
- 協(xié)議報文處理方法、裝置及終端
- 一種大數(shù)據(jù)交易方法及系統(tǒng)
- 數(shù)據(jù)存儲方法、數(shù)據(jù)獲取方法、裝置及系統(tǒng)
- 數(shù)據(jù)分組方法及裝置
- 一種高效可靠的物聯(lián)網(wǎng)實現(xiàn)方法
- 一種車流量預(yù)測的方法、裝置及服務(wù)器
- 一種基于區(qū)塊鏈的物種發(fā)表系統(tǒng)及方法
- 數(shù)據(jù)應(yīng)用門戶系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲介質(zhì)





