[發明專利]語音識別方法、裝置、設備、存儲介質及空調在審
| 申請號: | 201811323620.3 | 申請日: | 2018-11-07 |
| 公開(公告)號: | CN111161718A | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | 劉文峰 | 申請(專利權)人: | 珠海格力電器股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G10L15/18;G10L15/06;G10L15/08 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 郭亞芳 |
| 地址: | 519000*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 設備 存儲 介質 空調 | ||
1.一種語音識別方法,其特征在于,包括:
獲取語音信息;所述語音信息包括口音;
將所述語音信息發送給預設的目標語音識別模型;所述目標語音識別模型識別的口音與目標口音相匹配,所述目標口音為設備所處地理位置使用的口音;
由所述目標語音識別模型識別所述語音信息,得到所述語音信息的文本信息。
2.根據權利要求1所述的方法,其特征在于,所述目標語音識別模型包括標準口音推斷模型和目標口音推斷模型;
所述由所述目標語音識別模型識別所述語音信息,得到所述語音信息的文本信息,包括:
將所述語音信息發送給預先訓練得到的標準口音推斷模型和預先訓練得到的目標口音推斷模型,分別對應得到所述語音信息的第一文本信息和第二文本信息;所述目標口音推斷模型識別的口音與目標口音相匹配,所述目標口音為設備的地理位置使用的口音;
分別確定所述第一文本信息與所述語音信息的第一匹配度和所述第二文本信息與所述語音信息的第二匹配度;
輸出所述第一匹配度和所述第二匹配度中匹配度較高的匹配度對應的文本信息。
3.根據權利要求2所述的方法,其特征在于,所述輸出所述第一匹配度和所述第二匹配度中匹配度較高的匹配度對應的文本信息,包括:
當所述第一匹配度與所述第二匹配度均低于預設值時,將所述語音信息上傳到服務器,以使所述服務器根據所述語音信息匹配最佳口音推斷模型;
從所述服務器中獲取所述最佳口音推斷模型;
將所述語音信息發送給所述最佳口音推斷模型;
由所述最佳口音推斷模型識別所述語音信息得到所述語音信息的文本信息。
4.根據權利要求2所述的方法,其特征在于,還包括:
接收用戶發出的同一關鍵詞的標準口音信息和目標口音信息;
將所述標準口音信息發送給預先訓練得到的標準口音推斷模型,得到所述標準口音信息的文本信息;
將所述標準口音信息的文本信息設置為所述目標口音信息對應的文本信息;
獲取目標地理位置;
由聚類算法對相同關鍵詞的所述方言口音語音信息進行音素的比較和聚類,并根據所述方言口音語音信息對應的所述目標地理位置形成方言邊界,進而形成口音地圖。
5.根據權利要求4所述的方法,其特征在于,所述目標口音推斷模型的訓練過程包括:
獲取所述目標口音信息、與所述目標口音信息對應的所述文本信息;
以所述目標口音信息和所述目標口音信息對應的文本信息作為訓練樣本,訓練預先建立的深度學習模型,得到所述目標口音推斷模型。
6.根據權利要求4所述的方法,其特征在于,所述獲取目標地理位置,包括:
獲取設備所在的目標地理位置;
或,
獲取用戶輸入的目標地理位置。
7.根據權利要求6所述的方法,其特征在于,所述獲取設備所在的目標地理位置包括:
獲取與所述設備相連的鄰近的移動終端地理位置作為所述目標地理位置。
8.一種語音識別裝置,其特征在于,包括:
獲取模塊,用于獲取語音信息;所述語音信息包括口音;
發送模塊,用于所述目標語音識別模型識別的口音與目標口音相匹配,所述目標口音為設備所處地理位置使用的口音;
識別模塊,用于由所述目標語音識別模型識別所述語音信息,得到所述語音信息的文本信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海格力電器股份有限公司,未經珠海格力電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811323620.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:精控業務的基站調度方法和裝置
- 下一篇:充電電路、電子設備及控制方法





