[發明專利]語音控制方法、裝置、設備及存儲介質在審
| 申請號: | 202210507272.5 | 申請日: | 2022-05-10 |
| 公開(公告)號: | CN114999473A | 公開(公告)日: | 2022-09-02 |
| 發明(設計)人: | 劉永妮 | 申請(專利權)人: | 平安國際智慧城市科技股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/06;G10L15/20 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 林麗純;常云敏 |
| 地址: | 518000 廣東省深圳市前海深港合*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 控制 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能,提供一種語音控制方法、裝置、設備及存儲介質。該方法初始化設置電子設備的使用模式;對所述使用模式進行監測;當檢測到所述使用模式為預設模式,且所述預設模式被成功觸發時,獲取所述電子設備的持有用戶的錄入音頻;對所述錄入音頻進行預處理,得到目標音頻;基于預先訓練好的語義識別模型識別所述目標音頻的語義信息;根據所述語義信息從預設匹配庫中匹配出對應的操作信息,所述操作信息包括目標應用程序及操作指令;基于所述操作指令及所述語義信息對所述目標應用程序執行操作實現了通過音頻控制應用程序的操作。此外,本發明還涉及區塊鏈技術,所述操作信息可存儲于區塊鏈中。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種語音控制方法、裝置、設備及存儲介質。
背景技術
隨著語音識別技術的快速發展,用戶可以通過語音對各種終端設備進行控制,例如,用戶可以通過語音控制智能電視、智能掃地機等智能終端的操作。然而,目前無法通過語音對終端設備上的應用軟件進行控制,例如,用戶無法通過語音控制在某個社交軟件上與另一用戶進行交流等操作,造成用戶需要花費大部分時間在查找等操作上。
發明內容
鑒于以上內容,有必要提供一種語音控制方法、裝置、設備及存儲介質,能夠實現通過語音對電子設備上的應用軟件進行控制。
一方面,本發明提出一種語音控制方法,應用于電子設備,所述語音控制方法包括:
初始化設置所述電子設備的使用模式;
對所述使用模式進行監測;
當檢測到所述使用模式為預設模式,且所述預設模式被成功觸發時,獲取所述電子設備的持有用戶的錄入音頻;
對所述錄入音頻進行預處理,得到目標音頻;
基于預先訓練好的語義識別模型識別所述目標音頻的語義信息;
根據所述語義信息從預設匹配庫中匹配出對應的操作信息,所述操作信息包括目標應用程序及操作指令;
基于所述操作指令及所述語義信息對所述目標應用程序執行操作。
根據本發明優選實施例,所述初始化設置所述電子設備的使用模式包括:
獲取多個訓練用戶對所述電子設備的設置模式;
根據所述多個訓練用戶的設置模式計算所述設置模式為所述預設模式的第一設置比例;
若所述第一設置比例小于第一預設比例閾值,則計算所述持有用戶將所述使用模式設置為所述預設模式的第二設置比例;
若所述第二設置比例大于或者等于第二預設比例閾值,則獲取所述預設模式的模式動畫信息,所述第二預設比例閾值大于所述第一預設比例閾值;
獲取所述電子設備的啟動代碼信息;
將所述模式動畫信息插入所述啟動代碼信息以將所述使用模式設置為所述預設模式。
根據本發明優選實施例,所述對所述使用模式進行監測包括:
檢測所述使用模式是否為所述預設模式;
若所述使用模式為所述預設模式,則獲取與所述模式動畫信息對應的模式控件,并監測所述模式控件;
當監測到所述模式控件被觸發,則確定所述預設模式被成功觸發。
根據本發明優選實施例,所述對所述錄入音頻進行預處理,得到目標音頻包括:
對所述錄入音頻進行傅里葉變換,得到頻譜圖;
基于預設處理時長從所述頻譜圖中提取多個頻譜信息;
識別每個頻譜信息在所述錄入音頻中所處的音頻時刻;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安國際智慧城市科技股份有限公司,未經平安國際智慧城市科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210507272.5/2.html,轉載請聲明來源鉆瓜專利網。





