[發(fā)明專利]語音識別結果的校準方法、裝置、設備及存儲介質在審
| 申請?zhí)枺?/td> | 202010581203.X | 申請日: | 2020-06-23 |
| 公開(公告)號: | CN111696557A | 公開(公告)日: | 2020-09-22 |
| 發(fā)明(設計)人: | 王振華 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/22;G10L15/06;G06F40/232;G06F40/247 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉挽瀾 |
| 地址: | 518052 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 結果 校準 方法 裝置 設備 存儲 介質 | ||
本案涉及人工智能,提供一種語音識別結果的校準方法、裝置、設備及存儲介質,用于解決將語音轉化為文字時文字錯誤識別率高的問題。語音識別結果的校準方法包括:獲取多條目標語音,將多條目標語音轉化為多條初始語句;通過模糊匹配算法篩選目標語句中的多個關鍵詞,根據(jù)轉化閾值將多個關鍵詞替換為多個基礎標準詞,得到第一校準語句;根據(jù)上文語句中的其他標準詞,對第一校準語句進行匹配校準,得到第二校準語句;采用相似度算法計算第一校準語句的第一意圖匹配度及第二校準語句的第二意圖匹配度;若第二意圖匹配度大于第一意圖匹配度,且第二意圖匹配度的數(shù)值大于匹配閾值,則將第二校準語句確定為輸出語句,否則將第一校準語句確定為輸出語句。
技術領域
本發(fā)明涉及人工智能領域,尤其涉及一種語音識別結果的校準方法、裝置、設備及存儲介質。
背景技術
人工智能中的語音識別技術,是讓機器通過識別和理解過程將語音信號轉變?yōu)橄鄳奈谋净蛎畹募夹g,隨著科學技術的進步與不斷發(fā)展,語音識別及時被應用到工業(yè)、家電、通信、醫(yī)療、電子產(chǎn)品等多個領域中,其中,自動語音識別技術(automatic speechrecognition,ASR)是語音識別技術中應用范圍最廣的技術,ASR是利用模型將識別到的聲音信息轉換為相應的文本信息。
本申請的發(fā)明人在研究中發(fā)現(xiàn),利用語音識別技術進行語音識別時,因缺少對目標語句上下語句的理解與分析,導致語音識別時的文字錯誤識別率高,語音識別的轉化效率低下。
發(fā)明內容
本發(fā)明的主要目的在于解決將語音轉化為文字時文字錯誤識別率高的問題。
本發(fā)明第一方面提供了一種語音識別結果的校準方法,包括:基于語音識別算法獲取多條目標語音,并將所述多條目標語音轉化為文字,得到多條初始語句;通過模糊匹配算法篩選目標語句中的多個關鍵詞,并根據(jù)轉化閾值將所述多個關鍵詞替換為多個基礎標準詞,得到第一校準語句,其中,所述目標語句為所述多條初始語句中的任意一條初始語句,所述基礎標準詞是業(yè)務數(shù)據(jù)中的常用詞;根據(jù)上文語句中的其他標準詞,對所述第一校準語句進行匹配校準,得到第二校準語句,其中,所述上文語句為所述第一校準語句的前一條語句,所述其他標準詞為所述業(yè)務數(shù)據(jù)中除所述基礎標準詞之外的常用詞;采用相似度算法分別計算所述第一校準語句的第一意圖匹配度以及所述第二校準語句的第二意圖匹配度;若所述第二意圖匹配度大于所述第一意圖匹配度,且所述第二意圖匹配度的數(shù)值大于匹配閾值,則將所述第二校準語句確定為輸出語句,否則將所述第一校準語句確定為輸出語句。
可選的,在本發(fā)明第一方面的第一種實現(xiàn)方式中,所述基于語音識別算法獲取多條目標語音,并將所述多條目標語音轉化為文字,得到多條初始語句包括:基于語音識別算法獲取多條目標語音,并提取所述多條目標語音中的語音特征;通過預設的聲學模型將所述語音特征轉化為音素信息,其中,所述音素信息用于指示構成音節(jié)的最小語音單位;利用所述音素信息匹配對應的文字信息,得到多條初始語句。
可選的,在本發(fā)明第一方面的第二種實現(xiàn)方式中,所述利用所述音素信息匹配對應的文字信息,得到多條初始語句包括:在預置字典中匹配與所述音素信息相對應的文字信息,其中,所述文字信息包括單個文字或詞語;在預置關聯(lián)概率中獲取所述文字信息的關聯(lián)概率,并提取出關聯(lián)概率最大的文字信息作為目標文字,其中,所述預置關聯(lián)概率用于指示任意兩個單個文字或詞語之間相互關聯(lián)的概率;按照排列順序將所述目標文字組合在一起,得到多條初始語句,其中,所述多條初始語句的數(shù)量與所述多條目標語音的數(shù)量相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經(jīng)深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010581203.X/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





