[發明專利]語音識別方法、裝置、設備及存儲介質在審

申請號：	201811436230.7	申請日：	2018-11-28
公開（公告）號：	CN109346060A	公開（公告）日：	2019-02-15
發明（設計）人：	盧俊杰;肖曙	申請（專利權）人：	珂伯特機器人（天津）有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/26
代理公司：	天津合正知識產權代理有限公司 12229	代理人：	郭樂
地址：	300380 天津市西青區***	國省代碼：	天津;12
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	詞匯語音識別語音識別軟件存儲介質應用場景非期望預設語音識別結果場景規則修正功能語音信息拼音修正
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例公開了一種語音識別方法、裝置、設備及存儲介質，其中，所述方法包括：獲取語音信息中的詞匯，并根據預設的場景規則集，從所述詞匯中提取非期望合理詞匯；獲取所述非期望合理詞匯的拼音，并根據預設的詞匯集選取正確的詞匯。與現有技術相比，能夠根據特定應用場景，對語音識別結果進行修正，提高語音識別在特定應用場景的準確性。并且無需對語音識別軟件進行更改，利用現有的語音識別軟件口即可實現修正功能。

技術領域

本發明涉及計算機技術領域，尤其涉及一種語音識別方法、裝置、設備及存儲介質。

背景技術

隨著科學的進步和技術的發展，語音識別技術已經日趨成熟，正逐步成為信息技術中人機接口的關鍵技術。多種語音識別算法使得語音識別無論是識別率還是識別效率上都有較大提升。近年來，語音識別技術也逐漸被普遍使用于各個領域。目前語音識別作為一種常用的人機交互技術，已廣泛應用于各類電子產品中，以其自然方便的交互方式收到了消費者的喜愛，逐漸成為了智能產品時代的主流交互控制方式。

語音識別技術大多采用本地語音識別、或者遠程服務器利用軟件進行語音識別。不同的語音識別算法對于不同的語音輸入環境的語音識別效果勢必會有差異。在實現本發明的過程中，發明人發現如下技術問題：由于存在多種近似的發音詞匯，以及相同語音對應不同的詞匯，這些詞匯在不同場景中存在著不同的意義，進而造成錯誤識別，嚴重影響語音交互效果。

發明內容

有鑒于此，本發明實施例提供了一種語音識別方法、裝置、設備及存儲介質，以解決現有技術中語音識別在不同運用場景下識別率較低的技術問題。

第一方面，本發明實施例提供了一種語音識別方法，其特征在于，包括：

獲取語音信息中的詞匯，并根據預設的場景規則集，從所述詞匯中提取非期望合理詞匯；

獲取所述非期望合理詞匯的拼音，并根據預設的詞匯集選取正確的詞匯。

進一步的，所述獲取語音信息中的詞匯，包括：

將所述語音信息轉換為文字；

將所述文字信息進行拆分，獲取所述文字信息中的詞匯。

進一步的，所述從所述詞匯中提取非期望合理詞匯，包括：

確定所述詞匯的屬性；

根據當前應用場景的預設規則集，提取所述非期望合理詞匯，所述預設規則集包括：期望合理詞匯的屬性和位置。

進一步的，所述獲取所述非期望合理詞匯的拼音，并根據預設的場景詞匯集選取正確的詞匯，包括：

根據所述非期望合理詞匯的拼音從所述預設的場景詞匯集中選取近似拼音詞匯；

計算所述近似拼音詞匯的近似度；

選取相似度最高的詞匯作為正確詞匯。

進一步的，所述計算所述近似拼音詞匯的近似度，包括：

根據近似拼音詞匯的字母和非期望合理詞匯的拼音字母生成比較表格；

按照預設規則對所述比較表格進行填充；

根據填充后的表格確定近似拼音詞匯和非期望合理詞匯的差值；

將所述近似拼音詞匯和非期望合理詞匯的字母數量進行比較，將字母數量較多的詞匯的字母數量作為最大長度；

根據所述差值和最大長度計算所述近似拼音詞匯的近似度。

進一步的，所述預設規則包括：

從所述表格的中心位置開始計算,取以下三個值的最小值：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于珂伯特機器人（天津）有限公司，未經珂伯特機器人（天津）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811436230.7/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】