[發明專利]語音控制方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010820551.8 | 申請日: | 2020-08-14 |
| 公開(公告)號: | CN111968639A | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 賴永永;方彥彬 | 申請(專利權)人: | 北京小米松果電子有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 苑晨浩 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 控制 方法 裝置 電子設備 存儲 介質 | ||
本發明涉及一種語音控制方法、裝置、電子設備及存儲介質,所述方法應用于終端設備,包括:獲取語音控制命令的第一語義信息,其中,所述第一語義信息用于指示所述語音控制命令針對的控制對象;判斷所述終端設備的當前顯示界面的布局信息是否穩定,當所述顯示界面的布局信息穩定時,獲得對所述顯示界面進行分割所得到的多個界面元素;確定至少一個所述界面元素的目標信息,其中,所述目標信息包括所述界面元素的第二語義信息;根據所述第一語義信息和所述至少一個界面元素的目標信息,在所述至少一個界面元素中確定控制對象,并對所述控制對象執行所述語音控制命令對應的操作。
技術領域
本發明涉及語音控制技術領域,尤其涉及一種語音控制方法、裝置、電子設備及存儲介質。
背景技術
隨著科學技術的不斷進步,用戶和終端設備等機器的交互方式也在發生變化,出現了越來越多的語音助手,用于識別用戶的語音控制命令并給出對應的回復及執行對應的操作,實現了用戶對終端設備的語音控制。但是語音控制方式的信息獲取效率和準確率均較低,導致終端設備對用戶語音控制命令的響應效率低,響應準確率低。
發明內容
本發明提供一種語音控制方法、裝置、電子設備及存儲介質,以解決相關技術中的不足。
根據本發明實施例的第一方面,提供一種語音控制方法,應用于終端設備,所述控制方法包括:
獲取語音控制命令的第一語義信息,其中,所述第一語義信息用于指示所述語音控制命令針對的控制對象;
判斷所述終端設備的當前顯示界面的布局信息是否穩定,當所述顯示界面的布局信息穩定時,獲得對所述顯示界面進行分割所得到的多個界面元素;
確定至少一個所述界面元素的目標信息,其中,所述目標信息包括所述界面元素的第二語義信息;
根據所述第一語義信息和所述至少一個界面元素的目標信息,在所述至少一個界面元素中確定控制對象,并對所述控制對象執行所述語音控制命令對應的操作。
在一個實施例中,所述顯示界面包括至少一個控件元素;
所述獲得對所述顯示界面進行分割所得到的多個界面元素,包括:
以相鄰的所述控件元素的界限為分割線對所述顯示界面進行分割,以得到至少一個控件元素;
將每個所述控件元素作為一個界面元素。
在一個實施例中,所述判斷所述終端設備的當前顯示界面的布局信息是否穩定,包括:
在預設時間內多次獲取所述顯示界面的控件信息;
比較多次獲取的所述控件信息,其中,所述控件信息至少包括以下任意一種:顯示界面內的每個所述控件元素的編號、位置、屬性;
比較多次獲取的所述控件信息,若多次獲取的所述控件信息均相同,確定所述顯示界面的布局信息穩定。
在一個實施例中,所述確定至少一個所述界面元素的目標信息,包括:
識別所述界面元素內包含的文本內容,并根據所述文本內容確定所述界面元素的第二語義信息。
在一個實施例中,所述確定至少一個所述界面元素的目標信息,包括:
對所述界面元素進行圖像識別,以得到所述界面元素對應的文字描述信息,并將所述文字描述信息作為所述界面元素對應的第二語義信息。
在一個實施例中,所述目標信息還包括所述界面元素的位置信息;
所述根據所述第一語義信息和所述至少一個界面元素的目標信息,在所述至少一個界面元素中確定控制對象,包括:
獲取與所述第一語義信息匹配的第二語義信息對應的界面元素;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米松果電子有限公司,未經北京小米松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010820551.8/2.html,轉載請聲明來源鉆瓜專利網。





