[發明專利]語音識別方法、裝置、設備及存儲介質在審
| 申請號: | 201811436230.7 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109346060A | 公開(公告)日: | 2019-02-15 |
| 發明(設計)人: | 盧俊杰;肖曙 | 申請(專利權)人: | 珂伯特機器人(天津)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/26 |
| 代理公司: | 天津合正知識產權代理有限公司 12229 | 代理人: | 郭樂 |
| 地址: | 300380 天津市西青區*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞匯 語音識別 語音識別軟件 存儲介質 應用場景 非期望 預設 語音識別結果 場景規則 修正功能 語音信息 拼音 修正 | ||
本發明實施例公開了一種語音識別方法、裝置、設備及存儲介質,其中,所述方法包括:獲取語音信息中的詞匯,并根據預設的場景規則集,從所述詞匯中提取非期望合理詞匯;獲取所述非期望合理詞匯的拼音,并根據預設的詞匯集選取正確的詞匯。與現有技術相比,能夠根據特定應用場景,對語音識別結果進行修正,提高語音識別在特定應用場景的準確性。并且無需對語音識別軟件進行更改,利用現有的語音識別軟件口即可實現修正功能。
技術領域
本發明涉及計算機技術領域,尤其涉及一種語音識別方法、裝置、設備及存儲介質。
背景技術
隨著科學的進步和技術的發展,語音識別技術已經日趨成熟,正逐步成為信息技術中人機接口的關鍵技術。多種語音識別算法使得語音識別無論是識別率還是識別效率上都有較大提升。近年來,語音識別技術也逐漸被普遍使用于各個領域。目前語音識別作為一種常用的人機交互技術,已廣泛應用于各類電子產品中,以其自然方便的交互方式收到了消費者的喜愛,逐漸成為了智能產品時代的主流交互控制方式。
語音識別技術大多采用本地語音識別、或者遠程服務器利用軟件進行語音識別。不同的語音識別算法對于不同的語音輸入環境的語音識別效果勢必會有差異。在實現本發明的過程中,發明人發現如下技術問題:由于存在多種近似的發音詞匯,以及相同語音對應不同的詞匯,這些詞匯在不同場景中存在著不同的意義,進而造成錯誤識別,嚴重影響語音交互效果。
發明內容
有鑒于此,本發明實施例提供了一種語音識別方法、裝置、設備及存儲介質,以解決現有技術中語音識別在不同運用場景下識別率較低的技術問題。
第一方面,本發明實施例提供了一種語音識別方法,其特征在于,包括:
獲取語音信息中的詞匯,并根據預設的場景規則集,從所述詞匯中提取非期望合理詞匯;
獲取所述非期望合理詞匯的拼音,并根據預設的詞匯集選取正確的詞匯。
進一步的,所述獲取語音信息中的詞匯,包括:
將所述語音信息轉換為文字;
將所述文字信息進行拆分,獲取所述文字信息中的詞匯。
進一步的,所述從所述詞匯中提取非期望合理詞匯,包括:
確定所述詞匯的屬性;
根據當前應用場景的預設規則集,提取所述非期望合理詞匯,所述預設規則集包括:期望合理詞匯的屬性和位置。
進一步的,所述獲取所述非期望合理詞匯的拼音,并根據預設的場景詞匯集選取正確的詞匯,包括:
根據所述非期望合理詞匯的拼音從所述預設的場景詞匯集中選取近似拼音詞匯;
計算所述近似拼音詞匯的近似度;
選取相似度最高的詞匯作為正確詞匯。
進一步的,所述計算所述近似拼音詞匯的近似度,包括:
根據近似拼音詞匯的字母和非期望合理詞匯的拼音字母生成比較表格;
按照預設規則對所述比較表格進行填充;
根據填充后的表格確定近似拼音詞匯和非期望合理詞匯的差值;
將所述近似拼音詞匯和非期望合理詞匯的字母數量進行比較,將字母數量較多的詞匯的字母數量作為最大長度;
根據所述差值和最大長度計算所述近似拼音詞匯的近似度。
進一步的,所述預設規則包括:
從所述表格的中心位置開始計算,取以下三個值的最小值:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珂伯特機器人(天津)有限公司,未經珂伯特機器人(天津)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811436230.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語音聲學特征擴大系統
- 下一篇:音頻檢測方法、裝置及存儲介質





