[發明專利]語音控制方法、裝置、計算機可讀存儲介質和計算機設備有效
| 申請號: | 201910348815.1 | 申請日: | 2019-04-28 |
| 公開(公告)號: | CN110058838B | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 廖錫光 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F3/16 | 分類號: | G06F3/16 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 李文淵;何平 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 控制 方法 裝置 計算機 可讀 存儲 介質 設備 | ||
1.一種語音控制方法,所述方法包括:
接收第一終端發送的語音信息和對應的頁面圖片,其中,所述頁面圖片是應用程序中某一頁面的圖片,或者在進入應用程序前所處的界面的圖片;
識別所述語音信息中的控制信息和被控主體信息;
提取所述頁面圖片中的候選文本信息;
確定所述候選文本信息中與所述被控主體信息匹配的目標文本信息;
獲取所述目標文本信息在所述頁面圖片中的目標位置信息;
將所述目標位置信息和所述控制信息發送至所述第一終端,以使所述第一終端根據所述目標位置信息在所述頁面圖片對應的頁面確定目標頁面區域,以及使所述第一終端通過所述目標頁面區域觸發所述控制信息對應的控制操作,通過所述控制操作實現對所述被控主體信息對應的被控主體的控制,所述控制操作為觸發相應的點擊事件;
所述識別所述語音信息中的控制信息和被控主體信息包括:
將所述語音信息轉換為對應的文本信息;
將所述文本信息進行分詞處理,得到子文本信息;
對各個所述子文本信息進行標注,得到標注序列;對各個子文本信息進行標注是指對各個子文本信息進行詞性標注,詞性標注是指為分詞結果中的每個單詞標注一個正確的詞性的程序;
從所述標注序列中確定控制標注和被控主體標注,控制標注是指與控制信息對應的標注,被控主體標注是指與被控主體信息對應的標注;
根據控制標注從各個所述子文本信息中查找得到對應的所述控制信息;
根據被控主體標注從各個所述子文本信息中查找得到對應的所述被控主體信息。
2.根據權利要求1所述的方法,其特征在于,所述提取所述頁面圖片中的候選文本信息包括:
根據文本定位算法對所述頁面圖片進行文本定位檢測,以確定所述頁面圖片中的候選文本框;
提取所述候選文本框中的候選文本信息。
3.根據權利要求2所述的方法,其特征在于,所述根據文本定位算法對所述頁面圖片進行文本定位檢測,以確定所述頁面圖片中的候選文本框包括:
根據頁面圖片的像素值對將所述頁面圖片進行分層處理,得到至少兩個目標子頁面;
對各個所述目標子頁面進行二值化處理,得到各個所述目標子頁面的二值圖;
提取各個所述目標子頁面的二值圖的連通區域;
將各個所述二值圖的連通區域進行合并,得到所述頁面圖片中的候選文本框。
4.根據權利要求1所述的方法,其特征在于,所述候選文本信息包括多個候選子文本,所述確定所述候選文本信息中與所述被控主體信息匹配的目標文本信息包括:
將各個所述候選子文本分別與所述被控主體信息進行比對,得到各個所述候選子文本與所述被控主體信息間的相似度;
將與所述被控主體信息間的相似度符合相似條件的候選子文本作為目標文本信息。
5.根據權利要求4所述的方法,其特征在于,所述將各個所述候選子文本分別與所述被控主體信息進行比對,得到各個所述候選文本信息與所述被控主體信息間的相似度包括:
將各個所述候選子文本映射為第一詞向量序列;
將所述被控主體信息映射為第二詞向量序列;
確定各所述第一詞向量序列與所述第二詞向量序列的相似詞向量和差異詞向量;
基于所述相似詞向量和差異詞向量確定各個所述候選文本信息與所述被控主體信息間的相似度。
6.根據權利要求1所述的方法,其特征在于,所述方法還包括:
當所述控制信息為預設類型控制信息時,識別所述頁面圖片中的形狀子圖;
確定所述形狀子圖中與所述預設類型控制信息匹配的目標形狀子圖;
獲取所述目標形狀子圖在所述頁面圖片中的目標形狀位置信息;
將所述目標形狀位置信息和所述控制信息發送至所述第一終端,以使所述第一終端根據所述目標形狀位置信息在所述頁面圖片對應的頁面確定目標頁面區域,通過所述目標頁面區域觸發所述控制信息對應的控制操作,通過所述控制操作實現對所述被控主體信息對應的被控主體的控制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910348815.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種音頻輸出方法及終端
- 下一篇:一種基于靜態隨機存儲器內存內減法的電路結構





