[發明專利]一種語音控制指令生成方法、裝置及電子設備有效
| 申請號: | 201910449619.3 | 申請日: | 2019-05-28 |
| 公開(公告)號: | CN110232923B | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 馬宏 | 申請(專利權)人: | 海信視像科技股份有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/22 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 266555 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 控制 指令 生成 方法 裝置 電子設備 | ||
本發明公開了一種語音控制指令生成方法、裝置及電子設備,包括:根據接收到的語音信息獲取待輸出的文本,識別待輸出的文本中的數字及數字在文本中的位置;將該位置的數字分別轉換為中文數字和阿拉伯數字,確定不同的候選文本;根據每個分詞的權重及分詞的長度,確定候選文本的得分并確定文本識別結果,將文本識別結果及預先設定的標準文本進行匹配,根據匹配成功的標準文本生成語音控制指令。由于在本發明實施例中,通過將識別的數字在文本中的位置處的數字分別轉換為中文數字和阿拉伯數字,確定不同的候選文本,并計算每個候選文本的得分,根據候選文本的得分確定到的文本識別結果更加準確,從而可以保證后續生成的語音控制指令的準確性。
本申請要求在2019年05月09日提交中國專利局、申請號為201910383416.9、申請名稱為“一種文本識別方法、裝置及電子設備”的中國專利申請的優先權,其全部內容通過引用結合在本申請中。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種語音控制指令生成方法、裝置及電子設備。
背景技術
語音識別技術可以實現從語音信息向文字信息的轉化,即根據語音信的識別結果可以生成對應的語音控制指令,在轉化時需要基于聲學模型解碼、語言模型解碼等處理。語言模型是最終識別文本的一個重要參考標準,語言模型根據訓練語料中中文文本的出現概率來決定識別文本的一種模型。而現有的語音識別的方法導致語音識別的準確性難以達到理想水平,語音識別的結果經常出現錯誤,這將會增加后續的語義理解的工作難度,并可能導致生成錯誤的語音控制指令。
在進行語音識別時,數字識別是語音識別的一部分,數字一般包括中文數字和阿拉伯數字。因為在進行語音識別時是基于語言模型的,因此語言模型訓練語料中中文數字和阿拉伯數字出現的比重大小將決定數字的識別形式。如果識別出的文本中數字形式識別錯誤,將導致包含數字的實體詞整體無法有效提取和標注,進而影響語義的整體理解,并可能生成錯誤的語音控制指令。因此一種可靠的語音控制指令生成方法,將會有效的提高語音理解的準確性。
發明內容
本發明實施例提供了一種語音控制指令生成方法、裝置及電子設備,用以解決現有技術生成語音控制指令的過程中,在進行文本識別時數字形式識別錯誤,導致生成的語音控制指令的準確性較低的問題。
本發明實施例提供了一種語音控制指令生成方法,所述方法包括:
根據接收到的語音信息獲取待輸出的文本,識別所述待輸出的文本中的數字及所述數字在所述文本中的位置;將所述待輸出的文本中所述位置的數字分別轉換為中文數字和阿拉伯數字,確定不同的候選文本;
根據候選文本分詞后每個分詞的權重及分詞的長度,確定候選文本的得分,根據候選文本的得分確定文本識別結果;
將所述文本識別結果及預先設定的標準文本進行匹配,根據匹配成功的標準文本生成語音控制指令。
進一步地,所述識別待輸出的文本中的數字及所述數字在所述文本中的位置包括:
將所述待輸出的文本中的第一個字符作為待檢測的字符;
采用當前長度的滑動窗口滑動到所述待檢測的字符,判斷該滑動窗口內的字符串是否為滿足數字規則的字符串;
如果是,對記錄的所述待檢測的字符對應的字符串在所述文本中的位置進行更新,并將所述滑動窗口增加設定長度,繼續根據所述待檢測的字符和改變長度后的滑動窗口,對對應的字符串進行判斷;
如果否,根據記錄的所述待檢測的字符對應的字符串在所述文本中的位置,將所述位置后的下一字符作為待檢測字符進行判斷。
進一步地,所述滿足數字規則的字符串包括:
全部為阿拉伯數字的字符串;或
由中文數字和位詞構成的字符串。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海信視像科技股份有限公司,未經海信視像科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910449619.3/2.html,轉載請聲明來源鉆瓜專利網。





