[發明專利]語音識別結果的校準方法、裝置、設備及存儲介質在審
| 申請號: | 202010581203.X | 申請日: | 2020-06-23 |
| 公開(公告)號: | CN111696557A | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 王振華 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/22;G10L15/06;G06F40/232;G06F40/247 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉挽瀾 |
| 地址: | 518052 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 結果 校準 方法 裝置 設備 存儲 介質 | ||
1.一種語音識別結果的校準方法,其特征在于,所述語音識別結果的校準方法包括:
基于語音識別算法獲取多條目標語音,并將所述多條目標語音轉化為文字,得到多條初始語句;
通過模糊匹配算法篩選目標語句中的多個關鍵詞,并根據轉化閾值將所述多個關鍵詞替換為多個基礎標準詞,得到第一校準語句,其中,所述目標語句為所述多條初始語句中的任意一條初始語句,所述基礎標準詞是業務數據中的常用詞;
根據上文語句中的其他標準詞,對所述第一校準語句進行匹配校準,得到第二校準語句,其中,所述上文語句為所述第一校準語句的前一條語句,所述其他標準詞為所述業務數據中除所述基礎標準詞之外的常用詞;
采用相似度算法分別計算所述第一校準語句的第一意圖匹配度以及所述第二校準語句的第二意圖匹配度;
若所述第二意圖匹配度大于所述第一意圖匹配度,且所述第二意圖匹配度的數值大于匹配閾值,則將所述第二校準語句確定為輸出語句,否則將所述第一校準語句確定為輸出語句。
2.根據權利要求1所述的語音識別結果的校準方法,其特征在于,所述基于語音識別算法獲取多條目標語音,并將所述多條目標語音轉化為文字,得到多條初始語句包括:
基于語音識別算法獲取多條目標語音,并提取所述多條目標語音中的語音特征;
通過預設的聲學模型將所述語音特征轉化為音素信息,其中,所述音素信息用于指示構成音節的最小語音單位;
利用所述音素信息匹配對應的文字信息,得到多條初始語句。
3.根據權利要求2所述的語音識別結果的校準方法,其特征在于,所述利用所述音素信息匹配對應的文字信息,得到多條初始語句包括:
在預置字典中匹配與所述音素信息相對應的文字信息,其中,所述文字信息包括單個文字或詞語;
在預置關聯概率中獲取所述文字信息的關聯概率,并提取出關聯概率最大的文字信息作為目標文字,其中,所述預置關聯概率用于指示任意兩個單個文字或詞語之間相互關聯的概率;
按照排列順序將所述目標文字組合在一起,得到多條初始語句,其中,所述多條初始語句的數量與所述多條目標語音的數量相同。
4.根據權利要求1所述的語音識別結果的校準方法,其特征在于,所述通過模糊匹配算法篩選目標語句中的多個關鍵詞,并根據轉化閾值將所述多個關鍵詞替換為多個基礎標準詞,得到第一校準語句包括:
通過模糊匹配算法將目標語句轉化為拼音語句;
篩選出所述拼音語句中的目標音標,并將所述目標音標轉化為近音音標,得到轉化拼音語句,其中,所述目標音標包括具有易混淆的韻母和/或聲母;
提取出所述轉化拼音語句中多個帶有近音音標的關鍵詞,并計算所述關鍵詞與對應的基礎標準詞之間的相似度,其中,所述基礎標準詞是業務數據中的常用詞;
當目標相似度的數值大于替換閾值時,將目標相似度對應的關鍵詞替換為對應的基礎標準詞,得到第一校準語句。
5.根據權利要求1所述的語音識別結果的校準方法,其特征在于,所述根據上文語句中的其他標準詞,對所述第一校準語句進行匹配校準,得到第二校準語句包括:
判斷所述第一校準語句的上文語句中是否包括其他標準詞;
若所述上文語句中包括所述其他標準詞,則判斷所述第一校準語句中是否包括與所述其他標準詞對應的性質相近的關鍵詞,其中,所述性質相近的關鍵詞包括近義關鍵詞以及同音關鍵詞;
若所述第一校準語句中包括所述性質相近的關鍵詞,則將所述性質相近的關鍵詞替換為對應的其他標準詞,得到第二校準語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010581203.X/1.html,轉載請聲明來源鉆瓜專利網。





