[發(fā)明專利]語音操控系統(tǒng)在審
| 申請?zhí)枺?/td> | 201510835844.2 | 申請日: | 2015-11-26 |
| 公開(公告)號: | CN105513594A | 公開(公告)日: | 2016-04-20 |
| 發(fā)明(設(shè)計)人: | 不公告發(fā)明人 | 申請(專利權(quán))人: | 許傳平 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G06F3/0487 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266000 山東省青島*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 操控 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù)、圖像識別技術(shù)、文本識別技術(shù)、動作模擬 技術(shù)和藍牙技術(shù)。
背景技術(shù)
開車時用手操控車載娛樂系統(tǒng)危險性非常大。
當前智能家居、智能穿戴、智能玩具對于語音操控的需求越來越強烈。
在醫(yī)療等領(lǐng)域很多人士手不方便操作終端,需要操控一些智能設(shè)備極 其不便利。
如何通過語音有效的操控各種智能設(shè)備是目前急需解決的問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述問題,提供了一種語音操控系統(tǒng),提升了 車載終端、手機、智能家居、移動互聯(lián)等各類應(yīng)用操作的便利性,讓操控 交互更簡單,更人性化。
語音操控系統(tǒng)技術(shù)方案如下描述。
系統(tǒng)自定義命令和系統(tǒng)截取屏幕并識別圖片中可操作區(qū)域,可操作區(qū) 域包括圖標、按鈕、文本標簽等界面控件,然后生成對應(yīng)的命令集庫。
系統(tǒng)采集語音,通過在線或離線的方式對語音進行識別為文字。
系統(tǒng)匹配文字與命令集庫,識別語音控制命令。
系統(tǒng)模擬控制命令對應(yīng)的操控動作或通知應(yīng)用進行操作,實現(xiàn)語音操 控目標。
根據(jù)本發(fā)明的語音操控系統(tǒng)的一實施例,語音識別和命令識別由系統(tǒng) 的語音命令識別層實現(xiàn)。
根據(jù)本發(fā)明的語音操控系統(tǒng)的一實施例,應(yīng)用的操作由系統(tǒng)的操作執(zhí) 行層完成。
根據(jù)本發(fā)明的語音操控系統(tǒng)的一實施例,語音操控系統(tǒng)狀態(tài)包括初期 空閑、開始提示、采集語音、語音識別、命令匹配結(jié)果提示、操作執(zhí)行。
用戶端遙控器包括藍牙遙控器,用于接收用戶按鍵事件傳輸至智能終 端。
智能終端包括圖形和文本識別模塊、語音識別命令模塊和操作執(zhí)行模 塊,各模塊功能如下。
圖形和文本識別模塊,把自定義的命令和截圖識別的可操作區(qū)域命令 匯合生成命令集庫。
語音識別命令模塊,就采樣的語音識別為文字,然后和命令集庫匹配 識別語音控制命令。
操作執(zhí)行模塊,模擬控制命令對應(yīng)的操控動作或通知應(yīng)用進行操作, 實現(xiàn)語音操控目標。
本發(fā)明對比現(xiàn)有技術(shù)有如下的有益效果:本發(fā)明的方案是對現(xiàn)有應(yīng)有 界面識別其可操作區(qū)域動態(tài)生成命令集庫,在語音識別之后進行語音命令 的識別,然后模擬相應(yīng)的操作動作或通知應(yīng)用執(zhí)行。相較于傳統(tǒng)技術(shù),本 發(fā)明可以執(zhí)行應(yīng)用的任何命令,而傳統(tǒng)的技術(shù)只能支持幾個常用的命令, 每次添加命令都需要底層深度定制;本發(fā)明可以推廣到接受語音操控的各 種智能終端,包括但不限于智能手機、智能車載、智能穿戴、智能家居、 智能醫(yī)療、智能玩具等可以接受語音輸入的用戶終端。
附圖說明
圖1示出了本發(fā)明的語音操控系統(tǒng)的較佳實施例的流程圖。
圖2示出了本發(fā)明的語音操控系統(tǒng)的較佳實施例的業(yè)務(wù)邏輯圖。具體 實施方式
下面結(jié)合附圖和實施例對本發(fā)明作進一步的描述。
圖1示出了本發(fā)明的語音操控系統(tǒng)的較佳實施例的流程。請參見圖1, 本實施例的語音操控系統(tǒng)的實施步驟詳述如下。
步驟100系統(tǒng)自定義命令和系統(tǒng)截取屏幕并識別圖片中可操作區(qū) 域,可操作區(qū)域包括圖標、按鈕、文本標簽等界面控件,然后生成對應(yīng)的 命令集庫。
步驟102系統(tǒng)采集語音,通過在線或離線的方式對語音進行識別為 文字。
步驟104系統(tǒng)匹配文字與命令集庫,識別語音控制命令。
圖2示出了本發(fā)明的語音操控系統(tǒng)的較佳實施例的業(yè)務(wù)邏輯圖,請參 見圖2,本實施例的語音操控系統(tǒng)包括用戶端遙控器20和智能終端60。
用戶端遙控器20包括藍牙遙控器,用于接收用戶按鍵事件傳輸至智能 終端。智能終端60包括圖形和文本識別模塊602、語音命令識別模塊604 和操作執(zhí)行模塊606。語音命令識別模塊604對采樣的語音進行識別后轉(zhuǎn) 化成文字并對轉(zhuǎn)化后的文字進行命令識別。操作執(zhí)行模塊606模擬控制命 令對應(yīng)的操控動作或通知應(yīng)用進行操作,實現(xiàn)語音操控目標。
例如,用戶打開車載導航,用戶點擊藍牙遙控器語音開始鍵,說出“搜 地點”命令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于許傳平,未經(jīng)許傳平許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510835844.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





