[發明專利]一種基于語音識別的控制方法及裝置在審
| 申請號: | 202110483555.6 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113160821A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 黨戰雄;陳禹衡 | 申請(專利權)人: | 中天智領(北京)科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26 |
| 代理公司: | 深圳睿臻知識產權代理事務所(普通合伙) 44684 | 代理人: | 張海燕 |
| 地址: | 102208 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語音 識別 控制 方法 裝置 | ||
1.一種基于語音識別的控制方法,其特征在于,所述方法包括:
獲取對話語音信息;
對所述對話語音信息進行語音識別,獲得不同用戶的語音信息;
對所述不同用戶的語音信息進行語義分析,獲得文字信息;
提取所述文字信息中的關鍵詞;
在關鍵詞指令庫中對所述關鍵詞進行匹配,根據匹配結果確定所述關鍵詞對應的控制指令信息;
基于所述控制指令信息對設備進行控制。
2.如權利要求1所述的方法,其特征在于,所述對話語音信息為拾音設備發送的對話語音信息。
3.如權利要求1所述的方法,其特征在于,所述對所述對話語音信息進行語音識別,獲得不同用戶的語音信息,具體包括:
采用聲紋識別對所述對話語音信息進行語音識別,獲得不同用戶的語音信息。
4.如權利要求1所述的方法,其特征在于,在對所述不同用戶的語音信息進行語義分析,獲得文字信息之前,所述方法還包括:
對所述語音信息進行語種識別;
根據語種識別結果調取對應的語義分析策略;
對所述不同用戶的語音信息進行語義分析,獲得文字信息,具體包括:
利用所述語義分析策略對所述不同用戶的語音信息進行語義分析,獲得文字信息。
5.如權利要求1所述的方法,其特征在于,在對所述不同用戶的語音信息進行語義分析,獲得文字信息之后,提取所述文字信息中的關鍵詞之前,還包括:
獲取所述文字信息的預設長度的起始字符串;
根據所述起始字符串判斷所述文字信息是否用于觸發控制指令;
提取所述文字信息中的關鍵詞,具體包括:
若所述文字信息用于觸發控制指令,提取所述文字信息中的關鍵詞。
6.如權利要求1所述的方法,其特征在于,所述控制指令信息用于調取信號源、監控程序或文件。
7.如權利要求1~6任一項所述的方法,其特征在于,所述基于所述控制指令信息對設備進行控制后,所述方法還包括:
當在預設時間內沒有語音輸入時,關閉基于控制指令信息控制設備的功能,當有語音輸入時,自動喚醒基于控制指令信息控制設備的功能。
8.如權利要求1~6任一項所述的方法,其特征在于,在關鍵詞指令庫中對所述關鍵詞進行匹配,具體包括:
從關鍵詞指令庫中檢索所述關鍵詞對應的大屏幕顯示場景,所述關鍵詞指令庫中存儲關鍵詞與大屏幕顯示場景之間的映射關系。
9.如權利要求1~6任一項所述的方法,其特征在于,所述根據匹配結果確定所述關鍵詞對應的控制指令信息后,所述基于所述控制指令信息對設備進行控制前,所述方法還包括:
當所述控制指令信息為多個時,若在預設時間段內,存在相互矛盾或者完全反向的控制指令時,丟棄相互矛盾的控制指令信息。
10.一種基于語音識別的控制裝置,其特征在于,所述設備包括:
語音獲取模塊,用于獲取對話語音信息;
語音識別模塊,用于對所述對話語音信息進行語音識別,獲得不同用戶的語音信息;
語義分析模塊,用于對所述不同用戶的語音信息進行語義分析,獲得文字信息;
關鍵詞提取模塊,用于提取所述文字信息中的關鍵詞;
關鍵詞匹配模塊,用于在關鍵詞指令庫中對所述關鍵詞進行匹配,根據匹配結果確定所述關鍵詞對應的控制指令信息;
設備控制模塊,用于基于所述控制指令信息對設備進行控制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中天智領(北京)科技有限公司,未經中天智領(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110483555.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種Jmeter工具的腳本運行實現方法
- 下一篇:一種無邊框顯示開關器件





