[發明專利]語音控制方法及裝置、存儲介質、電子設備有效
| 申請號: | 201810163645.5 | 申請日: | 2018-02-27 |
| 公開(公告)號: | CN108538300B | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 舒翔 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L15/30 | 分類號: | G10L15/30;G10L15/26;G10L15/22;G06F3/16;G06K9/32;G06K9/62 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 王立民 |
| 地址: | 230000 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 控制 方法 裝置 存儲 介質 電子設備 | ||
1.一種語音控制方法,其特征在于,所述方法包括:
獲取當前頁面的頁面圖像,識別所述頁面圖像中包含的文字;
將連續排列的文字確定為一個文字單元,并確定出所述文字單元所在顯示區域;
獲取所述當前頁面中可操作元素所在顯示區域,與所述文字單元所在顯示區域相匹配,確定出可操作元素對應的文字單元;
將所述可操作元素對應的文字單元上傳至語音服務器保存;
獲取用戶輸入的語音數據,并將所述語音數據轉發至所述語音服務器進行語音識別,所述語音服務器用于根據上傳的所述文字單元,確定出所述語音數據對應的待操作文字單元;
接收所述語音服務器發送的所述待操作文字單元,對所述待操作文字單元對應的可操作元素執行操作。
2.根據權利要求1所述的方法,其特征在于,所述獲取當前頁面的頁面圖像,包括:
從智能設備的硬件顯示緩沖區獲取所述頁面圖像;或者,
接收智能設備的顯示系統發送的所述頁面圖像;或者,
通過截屏方式獲取所述頁面圖像。
3.根據權利要求1所述的方法,其特征在于,所述將連續排列的文字確定為一個文字單元,包括:
判斷相鄰文字單元之間的間距是否超過預設距離;
如果相鄰文字單元之間的間距未超過預設距離,則將所述相鄰文字單元合并為一個文字單元。
4.根據權利要求1至3任一項所述的方法,其特征在于,所述將連續排列的文字確定為一個文字單元之后,所述方法還包括:
對所述文字單元進行預處理,得到處理后的文字單元,所述預處理包括:
基于預設的指定文字,篩除所述文字單元中的提示性文字;和/或,
基于預設的詞性組合,篩除所述文字單元中無意義的文字,所述詞性組合中至少包括名詞;和/或,
基于預設的詞綴,與所述文字單元中的文字進行組合處理。
5.一種語音控制裝置,其特征在于,所述裝置包括:
頁面圖像獲取模塊,用于獲取當前頁面的頁面圖像,識別所述頁面圖像中包含的文字;
文字單元確定模塊,用于將連續排列的文字確定為一個文字單元,并確定出所述文字單元所在顯示區域;
顯示區域匹配模塊,用于獲取所述當前頁面中可操作元素所在顯示區域,與所述文字單元所在顯示區域相匹配,確定出可操作元素對應的文字單元;
文字單元上傳模塊,用于將所述可操作元素對應的文字單元上傳至語音服務器保存;
語音數據轉發模塊,用于獲取用戶輸入的語音數據,并將所述語音數據轉發至所述語音服務器進行語音識別,所述語音服務器用于根據上傳的所述文字單元,確定出所述語音數據對應的待操作文字單元;
文字單元接收模塊,用于接收所述語音服務器發送的所述待操作文字單元,對所述待操作文字單元對應的可操作元素執行操作。
6.根據權利要求5所述的裝置,其特征在于,
所述頁面圖像獲取模塊,用于從智能設備的硬件顯示緩沖區獲取所述頁面圖像;或者,接收智能設備的顯示系統發送的所述頁面圖像;或者,通過截屏方式獲取所述頁面圖像。
7.根據權利要求5所述的裝置,其特征在于,
所述文字單元確定模塊,用于將連續排列的文字確定為一個文字單元;判斷相鄰文字單元之間的間距是否超過預設距離;如果相鄰文字單元之間的間距未超過預設距離,則將所述相鄰文字單元合并為一個文字單元。
8.根據權利要求5至7任一項所述的裝置,其特征在于,所述裝置還包括:
文字單元預處理模塊,用于對所述文字單元確定模塊確定出的文字單元進行預處理,得到處理后的文字單元,所述預處理包括:
基于預設的指定文字,篩除所述文字單元中的提示性文字;和/或,
基于預設的詞性組合,篩除所述文字單元中無意義的文字,所述詞性組合中至少包括名詞;和/或,
基于預設的詞綴,與所述文字單元中的文字進行組合處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810163645.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動會議記錄方法
- 下一篇:一種基于神經網絡音頻技術的智能數碼樂器





