[發明專利]語音識別方法及相關裝置有效

申請號：	202110088987.7	申請日：	2021-01-22
公開（公告）號：	CN112885335B	公開（公告）日：	2023-05-02
發明（設計）人：	黃智超;陳現麟;王強	申請（專利權）人：	北京讀我科技有限公司
主分類號：	G10L15/06	分類號：	G10L15/06;G10L15/02;G10L15/16;G10L15/22;G10L15/26
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	尹秀
地址：	100088 北京市海***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別方法相關裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請提供了語音識別方法及相關裝置，其中，方法包括：采用目標領域的公開數據對聲學模型和語言模型進行訓練，得到目標聲學模型和初始語言模型；目標領域指：語音數據的內容具有分布規律的領域；將目標領域的采集語音數據輸入目標聲學模型得到的特征數據輸入初始語言模型，得到文本數據；采用符合目標領域語音內容的分布規律的文本庫，對文本數據進行糾錯；至少采用采集語音數據和糾錯后的文本數據，對初始語言模型進行訓練，得到目標語言模型；依據目標聲學模型和目標語言模型，對目標領域的待識別語音進行識別。本申請可以實現在保證語音識別準確率的前提下，低成本的得到語音識別系統。

技術領域

本申請涉及語音處理領域，尤其涉及語音識別方法及相關裝置。

背景技術

在一些領域，通過通話向客戶推銷產品，產生大量的通話語音。其中，通話語音中含有大量有價值的信息。因此，可以對通話語音進行信息挖掘，其中，信息挖掘的過程包括：先將通話語音轉換為文本，再對文本進行信息挖掘。其中，將通話語音轉換為文本的過程就是通話語音識別的過程。例如，對于在線教育領域，客服需要和家長進行約課和推銷課程，每天會有大量的通話語音，需要對通話語音進行語音識別，得到文本數據，并從文本數據中，分析客服是否違規，家長為何虛報等有價值的信息。

目前，語音識別的方式包括：采用市面上標注好的標注數據，對語音識別系統(聲學模型和語言模型)進行訓練，得到具有較高語音識別準確率的語音識別系統。采用語音識別系統對待識別語音進行識別。

但是，市面上標注好的標注數據的價格不菲，因此，得到具有較高語音識別準確率的語音識別系統的成本較高。因此，如何在保證語音識別準確率的前提下，低成本的得到語音識別系統，是急需解決的問題。

發明內容

本申請提供了語音識別方法及相關裝置，目的在于在保證語音識別準確率的前提下，低成本的得到語音識別系統。

為了實現上述目的，本申請提供了以下技術方案：

本申請提供了一種語音識別方法，包括：

采用目標領域的公開數據對聲學模型和語言模型進行訓練，得到目標聲學模型和初始語言模型；所述目標領域指：語音數據的內容具有分布規律的領域；

將所述目標領域的采集語音數據輸入所述目標聲學模型得到的特征數據輸入所述初始語言模型，得到文本數據；

采用符合所述目標領域語音內容的分布規律的文本庫，對所述文本數據進行糾錯；

至少采用所述采集語音數據和糾錯后的文本數據，對所述初始語言模型進行訓練，得到目標語言模型；

依據所述目標聲學模型和所述目標語言模型，對所述目標領域的待識別語音進行識別。

可選的，所述文本庫包括：所述目標領域語音內容的語義點、滿足所述語義點的語句，以及所述語義點的易錯關鍵詞；