[發明專利]語音識別結果測試方法、裝置、計算機設備和介質有效
| 申請號: | 201910667054.6 | 申請日: | 2019-07-23 |
| 公開(公告)號: | CN110556098B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 劉麗珍;呂小立 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/26;G10L25/51 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 黃晶晶 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 結果 測試 方法 裝置 計算機 設備 介質 | ||
1.一種語音識別結果測試方法,所述方法包括:
隨機選擇任意應用場景下基于預設話術腳本的用戶答復語音數據;
獲取所述用戶答復語音數據中用戶話段,將所述用戶話段分為多個預設時間長度的子話段,并分配子話段標識;
提取各子話段的聲學特征,根據聲學特征獲取各子話段的情感標簽;
采用語音識別技術獲取所述各子話段對應的文本數據,將各子話段的情感標簽與對應的文本數據線性拼接,并添加所述子話段標識于所述情感標簽與所述文本數據之間,得到各子話段的語音識別結果;根據所述子話段標識,將所述各子話段的語音識別結果與已選擇應用場景下預設標準語音識別結果中攜帶的各子話段的語音識別結果逐一對比,計數語音識別結果一致的子話段占比,得到已選擇應用場景下語音識別結果的準確度。
2.根據權利要求1所述的方法,其特征在于,所述提取各子話段的聲學特征,根據聲學特征獲取各子話段的情感標簽包括:
提取各子話段的聲學特征;
將提取的聲學特征輸入已訓練的基于深度學習的神經網絡模型,得到情感標簽。
3.根據權利要求2所述的方法,其特征在于,還包括:
獲取不同情感標簽對應的答復語音樣本數據;
提取所述答復語音樣本數據中時間構造特征、振幅構造特征、基頻構造特征以及共振峰構造特征;
將所述答復語音樣本數據中情感標簽以及對應的時間構造特征、振幅構造特征、基頻構造特征以及共振峰構造特征作為訓練數據,訓練基于深度學習的神經網絡模型,得到已訓練的基于深度學習的神經網絡模型。
4.根據權利要求3所述的方法,其特征在于,所述訓練基于深度學習的神經網絡模型,得到已訓練的基于深度學習的神經網絡模型包括:
提取所述訓練數據中情感標簽以及對應的時間構造特征、振幅構造特征、基頻構造特征以及共振峰構造特征;
根據提取的特征數據訓練基于深度學習的神經網絡中的卷積神經網絡部分、學習的局部情感標簽;
通過卷積神經網絡中的循環神經網絡部分、對所述局部情感標簽進行抽象,并通過基于深度學習的神經網絡中池化層學習到全局情感標簽,得到已訓練的基于深度學習的神經網絡模型。
5.根據權利要求1所述的方法,其特征在于,所述提取各子話段的聲學特征,根據聲學特征獲取各子話段的情感標簽包括:
根據提取各子話段的聲學特征以及預設情感標簽對應的聲學特征定性分析表,得到情感標簽;
其中,所述預設情感標簽對應的聲學特征定性分析表中攜帶有情感標簽、聲學特征以及不同情感標簽對應聲學特征的定性分析區間數據,所述聲學特征包括語速、平均基頻、基頻范圍、強度、音質、基頻變化以及清晰度。
6.根據權利要求1所述的方法,其特征在于,所述得到已選擇應用場景下語音識別結果的準確度之后,還包括:
延時預設時間,返回所述隨機選擇任意應用場景下基于預設話術腳本的用戶答復語音數據的步驟。
7.一種語音識別結果測試裝置,其特征在于,所述裝置包括:
數據獲取模塊,用于隨機選擇任意應用場景下基于預設話術腳本的用戶答復語音數據;
劃分模塊,用于獲取所述用戶答復語音數據中用戶話段,將所述用戶話段分為多個預設時間長度的子話段,并分配子話段標識;
特征提取模塊,用于提取各子話段的聲學特征,根據聲學特征獲取各子話段的情感標簽;
拼接組合模塊,用于采用語音識別技術獲取所述各子話段對應的文本數據,將各子話段的情感標簽與對應的文本數據線性拼接,并添加所述子話段標識于所述情感標簽與所述文本數據之間,得到各子話段的語音識別結果;
測試模塊,用于根據所述子話段標識,將所述各子話段的語音識別結果與已選擇應用場景下預設標準語音識別結果中攜帶的各子話段的語音識別結果逐一對比,計數語音識別結果一致的子話段占比,得到已選擇應用場景下語音識別結果的準確度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910667054.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:定制聲學模型
- 下一篇:一種命令詞控制方法及設備





