[發(fā)明專利]基于語音控制的位置定位方法、裝置、用戶設備及計算機程序產品在審
| 申請?zhí)枺?/td> | 201680002796.1 | 申請日: | 2016-12-22 |
| 公開(公告)號: | CN107077319A | 公開(公告)日: | 2017-08-18 |
| 發(fā)明(設計)人: | 駱磊;黃曉慶 | 申請(專利權)人: | 深圳前海達闥云端智能科技有限公司 |
| 主分類號: | G06F3/16 | 分類號: | G06F3/16 |
| 代理公司: | 北京新知遠方知識產權代理事務所(普通合伙)11397 | 代理人: | 申楠 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語音 控制 位置 定位 方法 裝置 用戶 設備 計算機 程序 產品 | ||
技術領域
本申請涉及通信技術領域,尤其是涉及一種基于語音控制的位置定位方法、裝置、用戶設備及計算機程序產品。
背景技術
隨著語音識別技術的不斷發(fā)展與應用,語音識別已經可以進行有限的操作,如添加鬧鐘、添加日程、查天氣、講故事、聊天等等功能。
然而,對于已經固化的應用程序,只能由此應用程序的開發(fā)者專門開發(fā)一套復雜的語音接口來進行比較簡單的行為操作,此類操作大多針對一個常用行為,且受限于語音識別技術的現(xiàn)狀,無法實現(xiàn)足夠智能的操作。而針對現(xiàn)有的UI操作界面,目前也只能通過點擊、滑動等動作進行操作,而無法通過語音進行準確定位,并進而對用戶設備進行操作。
因此目前根據(jù)接收到的語音指令,實現(xiàn)語音內容定位局限性較強,進而使得不能高效地配合用戶完成對用戶設備的操作。
發(fā)明內容
本申請?zhí)峁┝艘环N基于語音控制的位置定位方法、裝置、用戶設備、機器人及計算機程序產品,主要用于提高語音定位的適用性。
一種基于語音控制的位置定位方法,包括:接收語音控制指令;基于圖像分析技術確定所述語音控制指令所指示的內容在當前顯示界面中的位置;
定位至確定出的所述位置。
所述語音控制指令包括:定位內容和指令內容;所述確定所述語音控制指令中的內容在當前顯示界面中的位置,包括:確定所述語音控制指令中的定位內容所指示的內容在當前顯示界面中的位置;所述方法還包括:根據(jù)所確定的位置和所述指令內容,控制用戶設備。
定位至確定出的所述位置,包括:將用戶設備中的光標移動至所述位置處。
所述基于圖像分析技術確定所述語音控制指令所指示的內容在當前顯示界面中的位置,包括:基于圖像分析技術確定所述語音控制指令所指示的內容的文字或者所指示的圖標在當前顯示界面中的位置。
基于圖像分析技術確定所述語音控制指令所指示的內容在當前顯示界面中的位置,包括:在當前顯示界面所顯示的文本信息中查找所述語音控制指令所指示的內容的文字,將查找到的文字所在的位置確定為所述語音控制指令所指示的內容在當前顯示界面中的位置;或在顯示界面所顯示的文本信息中無法查找到所述語音控制指令所指示的內容的文字時,基于圖像分析技術確定所述語音控制指令所指示的內容在當前顯示界面中的位置。
所述方法還包括:在所述語音控制指令所指示的內容位于一個交互按鈕上時,觸發(fā)所述交互按鈕。
所述基于圖像分析技術確定所述語音控制指令所指示的內容在當前顯示界面中的位置,包括:將交互按鈕的中心點作為所述語音控制指令所指示的內容在當前顯示界面中的位置;觸發(fā)所述交互按鈕,包括:觸發(fā)所述交互按鈕的中心位置。
一種用戶設備系統(tǒng),包括:顯示器,存儲器,一個或多個處理器;以及一個或多個模塊,所述一個或多個模塊被存儲在所述存儲器中,并被配置成由所述一個或多個處理器執(zhí)行,所述一個或多個模塊包括用于執(zhí)行上述方法中任一所述方法中各個步驟的指令。
所述計算機程序產品包括內嵌于計算機可讀的存儲介質中的計算機程序,所述計算機程序包括用于使所述電子設備執(zhí)行上述任一所述方法中的各個步驟的指令。
一種基于語音控制的位置定位裝置,包括:接收模塊,用于接收語音控制指令;確定模塊,用于基于圖像分析技術確定所述語音控制指令所指示的內容在當前顯示界面中的位置;執(zhí)行模塊,用于定位至確定出的所述位置。
所述語音控制指令包括:定位內容和指令內容;所述確定模塊,具體用于確定所述語音控制指令中的定位內容所指示的內容在當前顯示界面中的位置;所述執(zhí)行模塊,還用于根據(jù)所確定的位置和所述指令內容,控制用戶設備。
所述執(zhí)行模塊,具體用于將用戶設備中的光標移動至所述位置處。
所述確定模塊,具體用于基于圖像分析技術確定所述語音控制指令所指示的內容的文字或者所指示的圖標在當前顯示界面中的位置。
所述確定模塊,具體用于在當前顯示界面所顯示的文本信息中查找所述語音控制指令所指示的內容的文字,將查找到的文字所在的位置確定為所述語音控制指令所指示的內容在當前顯示界面中的位置;或在顯示界面所顯示的文本信息中無法查找到所述語音控制指令所指示的內容的文字時,基于圖像分析技術確定所述語音控制指令所指示的內容在當前顯示界面中的位置。
所述執(zhí)行模塊,還用于在所述語音控制指令所指示的內容位于一個交互按鈕上時,觸發(fā)所述交互按鈕。
所述確定模塊,具體用于將交互按鈕的中心點作為所述語音控制指令所指示的內容在當前顯示界面中的位置;所述執(zhí)行模塊,具體用于觸發(fā)所述交互按鈕的中心位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海達闥云端智能科技有限公司,未經深圳前海達闥云端智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680002796.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種視頻傳送簽名方法
- 下一篇:IPTV節(jié)目推薦方法
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





