[發明專利]語音識別系統中的算法參數更新方法、裝置、終端及介質有效
| 申請號: | 202110705270.2 | 申請日: | 2021-06-24 |
| 公開(公告)號: | CN113241063B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 李少軍 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/16 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 劉麗華 |
| 地址: | 518000 廣東省深圳市福田區益田路503*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 系統 中的 算法 參數 更新 方法 裝置 終端 介質 | ||
本發明涉及人工智能技術領域,提供一種語音識別系統中的算法參數更新方法、裝置、終端及介質,所述方法包括:解析預設周期獲取的原始音頻,以獲取目標音頻;根據預設的語音識別流程對目標音頻進行語音識別,得到目標識別結果,并接收識別過程日志;采用流式計算框架對目標識別結果和識別過程日志進行計算,得到計算結果;當計算結果中存在異常結果時,識別異常結果對應的識別節點中的預設的目標算法策略,并基于異常結果更新預設的目標算法策略中的算法參數。本發明基于異常結果實時更新算法策略中的算法參數,使得后面說的每一句話識別的結果越來越準確,提高了語音識別的準確率。
技術領域
本發明涉及人工智能技術領域,具體涉及一種語音識別系統中的算法參數更新方法、裝置、終端及介質。
背景技術
目前ASR語音識別系統,存在斷句不準確問題,無法滿足所有場景,特別是在長時間靜音或者沒有語音輸入的場景下,現有技術缺少對語音識別系統整體流程的實時監控和實時反饋,無法及時更新語音識別系統中的算法參數,導致語音識別結果的準確率低。
發明內容
鑒于以上內容,有必要提出一種語音識別系統中的算法參數更新方法、裝置、終端及介質,基于異常結果實時更新算法策略中的算法參數,使得后面說的每一句話識別的結果越來越準確,提高了語音識別的準確率。
本發明的第一方面提供一種語音識別系統中的算法參數更新方法,所述方法包括:
解析預設周期獲取的原始音頻,獲取目標音頻;
根據預設的語音識別流程對所述目標音頻進行語音識別,得到目標識別結果,其中,所述預設的語音識別流程包含多個識別節點,每個識別節點包含有預設的算法策略;
接收識別過程日志,采用流式計算框架對所述目標識別結果和識別過程日志進行流式計算,得到計算結果,其中,所述過程日志中包含有一個或者多個子日志,所述計算結果中包含有每個子日志的指標參數值;
將每個子日志的指標參數值與對應預設的指標參數閾值進行比對,根據對比結果判斷所述計算結果中是否存在異常結果,其中,所述異常結果對應的識別節點中包含有預設的目標算法策略;
若存在所述異常結果,根據所述異常結果更新所述預設的目標算法策略中的算法參數。
可選地,所述接收識別過程日志,采用流式計算框架對所述目標識別結果和識別過程日志進行流式計算,得到計算結果包括:
獲取所述預設的語音識別流程的每個識別節點的識別碼;
根據所述每個識別節點的識別碼將所述識別過程日志劃分為多個子日志;
按照所述預設的語音識別流程的順序將每個子日志依次發送至消息隊列Kafka中;
通過所述流式計算框架從所述消息隊列的隊頭依次對每個子日志進行流式計算,得到每個子日志的指標參數值;
將每個子日志的指標參數值與對應的識別碼進行關聯,并將關聯后的多個子日志的指標參數值和目標識別結果作為計算結果。
可選地,所述解析預設周期獲取的原始音頻,獲取目標音頻包括:
每隔預設周期獲取原始音頻,從所述原始音頻中提取音頻碼流;
采用預設的類庫對所述音頻碼流進行解碼獲取目標音頻。
可選地,所述根據預設的語音識別流程對所述目標音頻進行語音識別,得到目標識別結果包括:
將所述目標音頻輸入至所述預設的語音識別流程的第一個識別節點對應的預設的第一算法策略中進行語音活性檢測,得到第一結果;
將所述第一結果輸入至所述預設的語音識別流程的第二個識別節點對應的預設的第二算法策略中進行預處理,得到第二結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110705270.2/2.html,轉載請聲明來源鉆瓜專利網。





