[發明專利]語音控制方法、裝置、設備及存儲介質在審
| 申請號: | 202210507272.5 | 申請日: | 2022-05-10 |
| 公開(公告)號: | CN114999473A | 公開(公告)日: | 2022-09-02 |
| 發明(設計)人: | 劉永妮 | 申請(專利權)人: | 平安國際智慧城市科技股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/06;G10L15/20 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 林麗純;常云敏 |
| 地址: | 518000 廣東省深圳市前海深港合*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 控制 方法 裝置 設備 存儲 介質 | ||
1.一種語音控制方法,應用于電子設備,其特征在于,所述語音控制方法包括:
初始化設置所述電子設備的使用模式;
對所述使用模式進行監測;
當檢測到所述使用模式為預設模式,且所述預設模式被成功觸發時,獲取所述電子設備的持有用戶的錄入音頻;
對所述錄入音頻進行預處理,得到目標音頻;
基于預先訓練好的語義識別模型識別所述目標音頻的語義信息;
根據所述語義信息從預設匹配庫中匹配出對應的操作信息,所述操作信息包括目標應用程序及操作指令;
基于所述操作指令及所述語義信息對所述目標應用程序執行操作。
2.如權利要求1所述的語音控制方法,其特征在于,所述初始化設置所述電子設備的使用模式包括:
獲取多個訓練用戶對所述電子設備的設置模式;
根據所述多個訓練用戶的設置模式計算所述設置模式為所述預設模式的第一設置比例;
若所述第一設置比例小于第一預設比例閾值,則計算所述持有用戶將所述使用模式設置為所述預設模式的第二設置比例;
若所述第二設置比例大于或者等于第二預設比例閾值,則獲取所述預設模式的模式動畫信息,所述第二預設比例閾值大于所述第一預設比例閾值;
獲取所述電子設備的啟動代碼信息;
將所述模式動畫信息插入所述啟動代碼信息以將所述使用模式設置為所述預設模式。
3.如權利要求2所述的語音控制方法,其特征在于,所述對所述使用模式進行監測包括:
檢測所述使用模式是否為所述預設模式;
若所述使用模式為所述預設模式,則獲取與所述模式動畫信息對應的模式控件,并監測所述模式控件;
當監測到所述模式控件被觸發,則確定所述預設模式被成功觸發。
4.如權利要求1所述的語音控制方法,其特征在于,所述對所述錄入音頻進行預處理,得到目標音頻包括:
對所述錄入音頻進行傅里葉變換,得到頻譜圖;
基于預設處理時長從所述頻譜圖中提取多個頻譜信息;
識別每個頻譜信息在所述錄入音頻中所處的音頻時刻;
將所述多個頻譜信息按照所述音頻時刻從小至大的順序依次輸入預先訓練好的降噪模型中,得到初始頻譜;
獲取識別準確率最大的語義識別模型所對應的音量信息;
基于所述音量信息對所述初始頻譜進行調整,得到目標頻譜;
對所述目標頻譜進行轉換處理,得到所述目標音頻。
5.如權利要求1所述的語音控制方法,其特征在于,所述語義識別模型包括文本轉換網絡、實體識別網絡及語義識別網絡,所述基于預先訓練好的語義識別模型識別所述目標音頻的語義信息包括:
基于所述文本轉換網絡將所述目標音頻轉換為目標文本;
基于所述實體識別網絡提取所述目標文本中的實體信息,并根據所述實體信息生成所述目標文本的編碼向量;
基于所述語義識別網絡對所述編碼向量進行處理,得到所述語義信息。
6.如權利要求1所述的語音控制方法,其特征在于,所述根據所述語義信息從預設匹配庫中匹配出對應的操作信息包括:
從所述預設匹配庫中獲取所述電子設備的設置應用程序,并獲取與所述設置應用程序對應的動作指令;
將所述動作指令與所述語義信息進行匹配,并將與所述語義信息匹配成功的動作指令所對應的設置應用程序確定為初始應用程序;
若所述初始應用程序有多個,則識別每個初始應用程序的程序狀態,并將所述程序狀態為啟動狀態的初始應用程序確定為運行應用程序;
獲取所述持有用戶在所述運行應用程序上的使用時長;
將所述使用時長最大的運行應用程序確定為所述目標應用程序,并將所述目標應用程序中與所述語義信息匹配成功的動作指令確定為所述操作指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安國際智慧城市科技股份有限公司,未經平安國際智慧城市科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210507272.5/1.html,轉載請聲明來源鉆瓜專利網。





