[發明專利]語音識別方法、裝置和存儲介質在審
| 申請號: | 202010597703.2 | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN112259084A | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 吳川隆;鄧麗萍;張超 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L15/22 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 曹蓓;許蓓 |
| 地址: | 100176 北京市大興區北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 存儲 介質 | ||
本公開提出一種語音識別方法、裝置和存儲介質,涉及語音識別技術領域。本公開的一種語音識別方法,包括:根據當前語句的語音信號獲取候選lattice;根據當前語句對應的上文文本重置神經網絡模型,其中,上文文本為當前語句的前一句或多句的識別文本;通過重置后的神經網絡模型對候選lattice重打分,獲取重打分lattice;根據重打分lattice確定當前語句的識別文本。通過這樣的方法,對當前語句的語音識別能夠考慮到上文一句或多句的信息,從而更加充分的利用先驗信息,使重打分更加準確,提高語音識別的準確率。
技術領域
本公開涉及語音識別技術領域,特別是一種語音識別方法、裝置和存儲介質。
背景技術
語音識別是語音質檢、人機對話等系統中的關鍵技術,廣泛應用于物流、金融及工業等領域。準確的識別率是所有語音系統的關鍵,比如在對話機器人中,若語音識別準確率較差,那么將無法準確理解說話人的真實意圖,進而下達錯誤的指令。
發明內容
本公開的一個目的在于提高語音識別的準確度。
根據本公開的一些實施例的一個方面,提出一種語音識別方法,包括:根據當前語句的語音信號獲取候選晶格lattice;根據當前語句對應的上文文本重置神經網絡模型,其中,上文文本為當前語句的前一句或多句的識別文本,神經網絡模型為基于帶上文文本的語料樣本訓練生成;通過重置后的神經網絡模型對候選lattice重打分,獲取重打分lattice;根據重打分lattice確定當前語句的識別文本。
在一些實施例中,語音識別方法還包括:將當前語句的識別文本存入緩存區,以便作為后續語句的上文文本。
在一些實施例中,語音識別方法還包括:從緩存區獲取當前語句對應的已識別的上文文本。
在一些實施例中,根據將當前語句的語音信號獲取候選lattice包括:基于聲學模型和語言模型,對語音信號進行一遍解碼,獲取候選lattice。
在一些實施例中,根據重打分lattice確定當前語句的識別文本包括:對重打分lattice做聲學權重和語言權重分析,獲得得分最高的路徑的解碼結果,作為當前語句的識別文本。
在一些實施例中,神經網絡模型包括LSTM(Long-Short Term Memory,長短期記憶)模型或GRU(Gate Recurrent Unit,門控循環單元)模型。
在一些實施例中,在語音信號為對話的語音信號的情況下,當前語句對應的已識別的上文文本包括當前語句的前一個發言者的最接近當前語句的發言的語音信號。
在一些實施例中,語音識別方法還包括:利用帶上文的樣本訓練神經網絡模型,直至損失函數的輸出收斂,包括:根據當前樣本語句的語音信號獲取樣本候選lattice;根據當前樣本語句對應的上文樣本文本重置待訓練的神經網絡模型,其中,上文樣本文本為當前樣本語句的前一句或多句的樣本文本;通過重置后的待訓練的神經網絡模型對樣本候選lattice重打分,獲取重打分樣本lattice,確定當前樣本語句的識別文本;根據當前樣本語句的識別文本和當前樣本語句的樣本文本確定損失函數的輸出。
通過這樣的方法,對當前語句的語音識別能夠考慮到上文一句或多句的信息,從而更加充分的利用先驗信息,使重打分更加準確,提高語音識別的準確率。
根據本公開的另一些實施例的一個方面,提出一種語音識別裝置,包括:解碼單元,被配置為根據當前語句的語音信號獲取候選lattice;重置單元,被配置為根據當前語句對應的已識別的上文文本重置神經網絡模型,其中,上文文本為當前語句的前一句或多句的識別文本,神經網絡模型為基于帶上文文本的語料樣本訓練生成;重打分單元,被配置為通過重置后的神經網絡模型對候選lattice重打分,獲取重打分lattice;識別單元,被配置為根據重打分lattice確定當前語句的識別文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司,未經北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010597703.2/2.html,轉載請聲明來源鉆瓜專利網。





