[發明專利]語音控制方法、裝置及計算機可讀存儲介質有效
| 申請號: | 201711171472.3 | 申請日: | 2017-11-22 |
| 公開(公告)號: | CN107832036B | 公開(公告)日: | 2022-01-18 |
| 發明(設計)人: | 武小軍;林形省;馮智勇 | 申請(專利權)人: | 北京小米移動軟件有限公司 |
| 主分類號: | G06F3/16 | 分類號: | G06F3/16;G06F3/04842;G06F3/0487;G10L15/22 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 林錦瀾 |
| 地址: | 100085 北京市海淀區清河*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 控制 方法 裝置 計算機 可讀 存儲 介質 | ||
本公開提供了一種語音控制方法、裝置及計算機可讀存儲介質,屬于語音處理技術領域。所述方法包括:接收到語音輔助指令后,在當前顯示的用戶界面中確定至少一個可操作對象;在用戶界面中,為至少一個可操作對象中的每一個可操作對象添加視覺可讀的標識信息;接收語音指令;當接收到的語音指令指示目標可操作對象的標識信息時,對目標可操作對象執行預設操作,目標可操作對象為至少一個可操作對象中的任一個可操作對象。本公開使得用戶在不需要記憶語音指令的指令格式的前提下就能成功實現語音控制,提高了語音控制的效率。
技術領域
本公開涉及語音處理技術領域,尤其涉及一種語音控制方法、裝置及計算機可讀存儲介質。
背景技術
當前,語音控制技術在人們的日常生活中已經越來越常見了,所謂語音控制技術指的是用戶向電子設備輸入語音指令,而后,電子設備對該語音指令進行識別,并基于識別結果執行相應操作的技術。
目前,在進行語音控制時,用戶需要基于預設的指令格式向電子設備輸入語音指令,而后電子設備可以基于該預設的指令格式識別用戶輸入的語音指令類別,以根據該語音指令執行相應操作。例如,撥打電話的語音指令的指令格式可以為“打電話給某某”,導航的語音指令的指令格式可以為“導航到某地”。
在實現現有技術的過程中,發明人發現現有技術至少存在以下問題:
現有技術要求用戶記憶不同語音指令對應的指令格式,而在用戶遺忘了某一語音指令的指令格式時,語音控制就無法正常進行,導致語音控制的效率較低。
發明內容
本公開實施例提供了一種語音控制方法、裝置及計算機可讀存儲介質,本公開實施例提供的技術方案能夠提高語音控制的效率。
根據本公開實施例的第一方面,提供一種語音控制方法,所述方法包括:
接收到語音輔助指令后,在當前顯示的用戶界面中確定至少一個可操作對象;
在所述用戶界面中,為所述至少一個可操作對象中的每一個可操作對象添加視覺可讀的標識信息;
接收語音指令;
當接收到的所述語音指令指示目標可操作對象的標識信息時,對所述目標可操作對象執行預設操作,所述目標可操作對象為所述至少一個可操作對象中的任一個可操作對象。
可選的,所述標識信息為編號信息,在所述用戶界面中,為所述至少一個可操作對象中的每一個可操作對象添加視覺可讀的標識信息,包括:
根據所述至少一個可操作對象在所述用戶界面中的排列順序,生成所述每一個可操作對象對應的編號信息;
在所述用戶界面中顯示所述每一個可操作對象對應的編號信息。
可選的,所述用戶界面為包含物品圖像的圖像界面,所述在當前顯示的用戶界面中確定至少一個可操作對象,包括:
對所述圖像界面進行圖像識別,確定所述圖像界面中包括的至少一個物品圖像;
將所述至少一個物品圖像確定為所述至少一個可操作對象。
可選的,所述圖像界面為虛擬現實圖像界面,所述對所述圖像界面進行圖像識別,確定所述圖像界面中包括的至少一個物品圖像,包括:
獲取所述虛擬現實圖像界面的建模信息;
從所述虛擬現實圖像界面的建模信息中確定至少一個虛擬物品建模信息;
在所述虛擬現實圖像界面中確定每一個所述虛擬物品建模信息所對應的虛擬物品圖像。
可選的,所述圖像界面為虛擬現實圖像界面,所述可操作對象為虛擬物品圖像,所述對所述目標可操作對象執行預設操作,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司,未經北京小米移動軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711171472.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能終端的語音輸入方法
- 下一篇:組件庫的實現方法及裝置





